PP-YOLOE+ против YOLOv5: техническое сравнение систем обнаружения объектов в реальном времени
В условиях жесткой конкуренции в области компьютерного зрения выбор правильной архитектуры для обнаружения объектов является критически важным решением для разработчиков и исследователей. PP-YOLOE+, разработанная PaddlePaddle компании Baidu, и YOLOv5, созданная Ultralytics, выделяются как два различных подхода к решению задач обнаружения в реальном времени. В то время как PP-YOLOE+ делает акцент на механизмах без анкоров в PaddlePaddle , YOLOv5 отраслевой стандарт удобства использования, гибкости развертывания и поддержки сообщества в рамках PyTorch.
В данном руководстве представлен подробный технический анализ этих двух влиятельных моделей, в котором сравниваются их архитектуры, показатели производительности и пригодность для реальных приложений, таких как автоматизация производства и пограничные вычисления.
Обзор модели
PP-YOLOE+
PP-YOLOE+ — это усовершенствованная версия PP-YOLOE, разработанная для улучшения конвергенции обучения и производительности последующих задач. Она работает на PaddlePaddle и использует парадигму без анкеров для упрощения головки обнаружения. Благодаря более мощной базовой структуре и усовершенствованным стратегиям обучения она обеспечивает высокую точность для промышленных приложений, в которых широко используется облачное инференсное вычисление.
- Авторы: Авторы PaddlePaddle
- Организация:Baidu
- Дата: 2022-04-02
- Arxiv:2203.16250
- GitHub:Репозиторий PaddleDetection
Ultralytics YOLOv5
YOLOv5 революционизировал пользовательский опыт в области обнаружения объектов. Выпущенный компанией Ultralytics, он уделяет приоритетное внимание инженерному подходу «развертывание прежде всего», гарантируя, что модели не только точны, но и невероятно просты в обучении, экспорте и запуске на различном оборудовании. Его архитектура на основе якорей высоко оптимизирована для скорости, что делает его фаворитом для вывода в реальном времени на периферийных устройствах.
- Автор: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:Репозиторий Ultralytics YOLOv5
Сравнение технической архитектуры
Архитектурные философии PP-YOLOE+ и YOLOv5 значительно YOLOv5 , что влияет на их поведение при обучении и характеристики развертывания.
Базовая сеть и извлечение признаков
YOLOv5 использует магистраль CSPDarknet (Cross Stage Partial Network). Такая конструкция улучшает градиентный поток и уменьшает количество параметров без ущерба для производительности. Архитектура является высокомодульной, что позволяет быстро экспериментировать с различными глубинами и ширинами моделей (от Nano до X-Large). Эта модульность является ключевым фактором для разработчиков, развертывающих системы в средах с ограниченными ресурсами, таких как Raspberry Pi или мобильные устройства.
PP-YOLOE+, напротив, обычно использует основу CSPRepResStage, которая сочетает в себе остаточные связи с методами перепараметризации. Хотя эта структура эффективна для извлечения богатых характеристик, она часто приводит к более высокой сложности на этапе обучения по сравнению с оптимизированной эффективностью реализации YOLOv5.
Датчики обнаружения: с анкером и без анкера
Фундаментальное различие заключается в датчиках:
- YOLOv5 Anchor-Based): использует заранее определенные анкерные рамки для прогнозирования местоположения объектов. Хотя это требует начальной настройки (которую Ultralytics с помощью AutoAnchor), оно обеспечивает стабильные градиенты обучения и исторически надежную производительность на стандартных наборах данных, таких как COCO.
- PP-YOLOE+ (без анкеров): напрямую прогнозирует центры и размеры объектов, устраняя необходимость настройки гиперпараметров анкерных рамок. Этот подход хорошо справляется с объектами с экстремальными соотношениями сторон, но может быть более чувствительным к качеству обучающих данных и начальной конвергенции потерь.
Эволюция к безякорному креплению
В то время как YOLOv5 использует анкоры, более новые Ultralytics , такие как YOLOv8 и передовая YOLO26 перешли на конструкции без анкоров, сочетая в себе лучшее из обоих миров: простоту использования и превосходную геометрическую обобщенность.
Метрики производительности
При оценке производительности очень важно учитывать компромисс между средней точностью (mAP) и задержкой. В приведенной ниже таблице показано, что, хотя PP-YOLOE+ достигает высокой точности, YOLOv5 конкурентное преимущество в CPU и универсальности развертывания, а также имеет значительно более низкие входные барьеры для новых пользователей.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Анализ скорости и эффективности
Ultralytics YOLOv5 исключительную эффективность, особенно в вариантах «Nano» и «Small». Модель YOLOv5n, имеющая всего 1,9 млн параметров, специально разработана для чрезвычайно ограниченных сред, таких как мобильные приложения или датчики IoT. Хотя PP-YOLOE+ предлагает высокие mAP , сложность настройки и зависимость от PaddlePaddle могут вызвать трения в производственных конвейерах, которые полагаются на стандартные ONNX PyTorch ONNX .
Кроме того, требования к памяти благоприятны YOLOv5. Во время обучения оптимизированные загрузчики данных и управление памятью YOLOv5 позволяют использовать более крупные пакеты данных на потребительских графических процессорах по сравнению со многими конкурентами, что снижает аппаратные барьеры для инженеров в области искусственного интеллекта.
Обучение и экосистема
Экосистема, окружающая модель, часто бывает не менее важна, чем сама модель. Именно в этом Ultralytics явное преимущество.
Простота использования и документация
YOLOv5 своим подходом «от нуля до героя». Разработчик может за считанные минуты пройти путь от установки библиотеки до обучения настраиваемой модели на наборе данных, таком как VisDrone.
from ultralytics import YOLO
# Load a pretrained YOLO model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5s.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
Для сравнения, PP-YOLOE+ требует установки PaddlePaddle клонирования репозитория PaddleDetection. Настройка часто включает в себя изменение нескольких файлов YAML и навигацию по более сложной структуре каталогов, что может представлять собой более сложный процесс обучения для тех, кто привык к простоте Ultralytics, основанной на языке Python.
Универсальность и поддержка задач
В то время как PP-YOLOE+ в первую очередь ориентирован на обнаружение, Ultralytics предлагает встроенную поддержку более широкого спектра задач машинного зрения в рамках одного API:
- Сегментация экземпляров: точное маскирование объектов.
- Оценка позы: обнаружение ключевых точек скелета человека или животного.
- Ориентированная ограничивающая рамка (OBB): обнаружение повернутых объектов, что имеет решающее значение для аэрофотосъемки.
- Классификация: Классификация всего изображения.
Эта универсальность позволяет разработчикам переключаться между задачами без необходимости изучения новых фреймворков или переписывания конвейеров данных.
Приложения в реальном мире
Когда следует выбирать PP-YOLOE+
PP-YOLOE+ — отличный вариант, если ваша инфраструктура уже глубоко интегрирована с технологическим стеком Baidu. Для пользователей в регионах, где PaddlePaddle фреймворк PaddlePaddle , или для конкретных серверных развертываний, где mAP единственным приоритетом по сравнению с простотой развертывания, PP-YOLOE+ остается жизнеспособным вариантом.
Когда выбиратьYOLO Ultralytics YOLO
Для подавляющего большинства разработчиков, стартапов и корпоративных команд по всему миру Ultralytics YOLOv5 (и его последующие версии) является рекомендуемым выбором по следующим причинам:
- Развертывание Edge: беспроблемный экспорт в TFLite, CoreML и OpenVINO гарантирует эффективную работу моделей на устройствах конечных пользователей.
- Поддержка сообщества: огромное активное сообщество способствует частым обновлениям, обеспечивая устранение ошибок и регулярное добавление новых функций, таких как автоматическая аннотация.
- Комплексная платформа: Ultralytics упрощает весь жизненный цикл, от управления наборами данных до обучения моделей и развертывания в облаке.
Будущее: вступает YOLO26
Хотя YOLOv5 надежным и эффективным инструментом, область компьютерного зрения быстро развивается. Ultralytics недавно Ultralytics YOLO26, представляющий собой абсолютный передовой уровень в области эффективности и производительности.
YOLO26 предлагает несколько революционных улучшений по сравнению с YOLOv5 PP-YOLOE+:
- Полное NMS: YOLO26 устраняет немаксимальное подавление (NMS), этап постобработки, который замедляет вывод. Это приводит к упрощению логики развертывания и снижению задержки.
- MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную конвергенцию и более быстрое обучение.
- Улучшенное обнаружение мелких объектов: благодаря ProgLoss и STAL (Task-Alignment Loss) YOLO26 превосходно справляется с обнаружением мелких объектов, что является критически важной функцией для инспектирования с помощью дронов и точного земледелия.
- На 43 % более быстрое CPU : благодаря удалению Distribution Focal Loss (DFL) YOLO26 специально оптимизирован для CPU, что делает его лучшим выбором для экономичного пограничного вычисления.
Разработчикам, начинающим новые проекты в 2026 году, мы настоятельно рекомендуем оценить YOLO26, чтобы обеспечить будущую совместимость ваших приложений с помощью новейших достижений в области архитектуры нейронных сетей.