YOLOv5 против PP-YOLOE+: технический глубокий разбор современного обнаружения объектов

Выбор правильной архитектуры нейронной сети важен для любого современного проекта в области компьютерного зрения. Когда разработчики и исследователи оценивают модели для обнаружения объектов в реальном времени, решение часто сводится к поиску баланса между точностью, скоростью вывода и простотой развертывания. Этот технический обзор сравнивает YOLOv5 и PP-YOLOE+, исследуя их архитектуры, метрики производительности и методологии обучения, чтобы помочь тебе выбрать оптимальное решение для твоего приложения.

Понимание архитектур

Обе модели оказали значительное влияние на ландшафт ИИ в компьютерном зрении, но они подходят к задачам обнаружения объектов через разные структурные методологии и зависимости от фреймворков.

Ultralytics YOLOv5: отраслевой стандарт

Выпущенная в середине 2020 года, Ultralytics YOLOv5 произвела революцию в доступности передовых моделей компьютерного зрения. Будучи первой нативной реализацией PyTorch в семействе YOLO, она значительно снизила порог вхождения для Python-разработчиков и ML-инженеров по всему миру.

Детали YOLOv5:

YOLOv5 использует модифицированный бэкбон CSPDarknet, который эффективно извлекает богатые признаки, сохраняя при этом небольшое количество параметров. Модель внедрила автообучаемые анкорные боксы (anchor boxes), автоматически вычисляя оптимальные размеры анкоров для пользовательских датасетов еще до начала обучения. Кроме того, интеграция аугментации данных MixUp значительно повышает способность модели обнаруживать мелкие объекты и обобщать данные в сложных пространственных контекстах.

Одно из величайших преимуществ YOLOv5 — ее невероятная универсальность. В отличие от стандартных детекторов объектов, семейство YOLOv5 бесшовно поддерживает классификацию изображений, сегментацию экземпляров и обнаружение с помощью ограничивающих рамок (bounding box) в рамках единого API. Ее высокооптимизированная архитектура также обеспечивает существенно меньшее потребление памяти во время обучения и вывода по сравнению с тяжелыми трансформерными сетями.

Узнай больше о YOLOv5

PP-YOLOE+: конкурент от PaddlePaddle

Представленная примерно через два года, PP-YOLOE+ опирается на фундамент предыдущих итераций PP-YOLO. Разработанная для демонстрации возможностей фреймворка глубокого обучения Baidu, она вводит несколько архитектурных улучшений для повышения среднего значения точности (mAP).

Подробности PP-YOLOE+:

PP-YOLOE+ полагается на безъякорную (anchor-free) парадигму и использует бэкбон CSPRepResNet. Она включает мощную технику Task Alignment Learning и эффективную Task-aligned Head для повышения точности. Хотя PP-YOLOE+ достигает впечатляющих показателей точности, ее главная слабость заключается в жесткой зависимости от фреймворка PaddlePaddle. Это часто создает высокий порог вхождения и трения в экосистеме для исследовательских команд и предприятий, которые уже глубоко интегрированы в среду PyTorch или TensorFlow.

Узнай больше о PP-YOLOE+

Производительность и бенчмарки

При оценке этих моделей для продакшена крайне важно понимать компромиссы между точностью, скоростью вывода и количеством параметров. В таблице ниже приведены основные метрики производительности для различных вариантов размеров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Хотя PP-YOLOE+ достигает высоких пределов точности, YOLOv5 стабильно демонстрирует превосходную эффективность параметров и более быстрый вывод на ограниченном аппаратном обеспечении. Для развертывания на периферийных устройствах (edge), где памяти мало, YOLOv5n предлагает непревзойденную скорость и экстремально малый размер.

Эффективность использования памяти

Модели Ultralytics специально разработаны для эффективности обучения. По сравнению с тяжелыми визуальными трансформерами, такими как RT-DETR, YOLOv5 потребляет значительно меньше памяти CUDA, позволяя тебе тренироваться на больших размерах батчей или потребительском железе.

Преимущество Ultralytics: экосистема и простота использования

Истинная ценность архитектуры машинного обучения выходит за рамки «сырых» цифр; она охватывает весь опыт разработчика. Ultralytics Platform и соответствующие инструменты с открытым исходным кодом предоставляют высококлассную, хорошо поддерживаемую экосистему, которая кардинально ускоряет циклы разработки.

  • Простота использования: Ultralytics абстрагирует сложный шаблонный код. Ты можешь обучать, проверять и тестировать модели с помощью интуитивно понятного Python API или CLI.
  • Гибкость развертывания: Экспорт моделей невероятно прост. Одной командой ты можешь конвертировать свои обученные веса YOLOv5 в такие форматы, как ONNX, TensorRT или OpenVINO, обеспечивая широкую совместимость в периферийных и облачных средах.
  • Активное сообщество: Активное сообщество гарантирует частые обновления, обширную документацию и надежные решения распространенных проблем компьютерного зрения.

В отличие от этого, PP-YOLOE+ сильно полагается на сложные конфигурационные файлы, специфичные для PaddleDetection, что может замедлить быстрое прототипирование и усложнить интеграцию в современные MLOps-конвейеры.

Практические реализации и примеры кода

Начать работу с Ultralytics удивительно просто. Вот полный, рабочий пример того, как загрузить предобученную модель YOLOv5, обучить ее на собственном датасете и экспортировать результаты:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Варианты использования и рекомендации

Выбор между YOLOv5 и PP-YOLOE+ зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в выборе экосистемы.

Когда выбирать YOLOv5

YOLOv5 — отличный выбор для:

  • Проверенных производственных систем: Существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
  • Обучения в условиях ограниченных ресурсов: Сред с ограниченными GPU-ресурсами, где эффективный конвейер обучения YOLOv5 и меньшие требования к памяти являются преимуществом.
  • Широкой поддержки форматов экспорта: Проектов, требующих развертывания во множестве форматов, включая ONNX, TensorRT, CoreML и TFLite.

Когда выбирать PP-YOLOE+

PP-YOLOE+ рекомендуется для:

  • Интеграция с экосистемой PaddlePaddle: организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
  • Развертывание на Paddle Lite Edge: развертывание на оборудовании с высокооптимизированными ядрами вывода специально для двигателя Paddle Lite или вывода Paddle.
  • Высокоточное обнаружение на стороне сервера: сценарии, отдающие приоритет максимальной точности обнаружения на мощных серверных GPU, где зависимость от фреймворка не является проблемой.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Альтернативные современные модели для рассмотрения

Хотя YOLOv5 — это надежный и проверенный стандарт, область компьютерного зрения движется быстро. Для команд, начинающих новые проекты, мы настоятельно рекомендуем изучить наши новые архитектуры.

Ultralytics YOLO26

Выпущенная в январе 2026 года, YOLO26 представляет собой абсолютную вершину наших исследований. Она обеспечивает значительные улучшения как в точности, так и в скорости. Ключевые инновации включают:

  • Сквозной дизайн без NMS: Опираясь на концепции YOLOv10, YOLO26 нативно исключает постобработку Non-Maximum Suppression (NMS), снижая задержку и упрощая логику развертывания.
  • Удаление DFL: Убрав Distribution Focal Loss, YOLO26 достигает до 43% более быстрого вывода на CPU, что делает ее невероятно мощной для маломощных периферийных устройств.
  • Оптимизатор MuSGD: Вдохновленный продвинутыми техниками обучения LLM, этот гибрид SGD и Muon обеспечивает исключительно стабильные прогоны обучения и более быструю сходимость.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для дроновых съемок и умного сельского хозяйства.

Кроме того, ты можешь рассмотреть YOLO11, которая предлагает отличную производительность и служит высоконадежным мостом между устаревшими системами и передовыми возможностями YOLO26.

Реальные сценарии использования

Выбор между YOLOv5 и PP-YOLOE+ в конечном итоге зависит от твоей среды развертывания и ограничений проекта.

Идеальные приложения для YOLOv5: Минимальные требования к ресурсам и невероятная простота использования YOLOv5 делают ее главным выбором для периферийного ИИ. Она превосходна в задачах, требующих высокой частоты кадров на ограниченном оборудовании, таких как робототехника в реальном времени, интеграция в мобильные приложения и системы мониторинга трафика с несколькими камерами. Ее способность одновременно выполнять задачи оценки позы и ориентированных ограничивающих рамок (OBB) в рамках одной архитектуры делает ее очень адаптивной.

Идеальные приложения для PP-YOLOE+: PP-YOLOE+ лучше всего подходит для сценариев, где абсолютная максимальная точность на статичных изображениях приоритетнее ограничений реального времени. Она находит нишевое применение в конвейерах промышленного контроля, особенно в азиатских производственных секторах, у которых уже есть сложившиеся технические стеки, глубоко инвестированные в экосистему Baidu и PaddlePaddle.

В итоге, хотя PP-YOLOE+ показывает сильные бенчмарки точности, модели YOLO от Ultralytics обеспечивают непревзойденное сочетание баланса производительности, бесшовного развертывания и дружелюбного к разработчикам дизайна, которые ведут успешные проекты компьютерного зрения от концепции до продакшена.

Комментарии