YOLOv5 PP-YOLOE+: техническое сравнение детекторов объектов в реальном времени
Выбор оптимальной архитектуры для обнаружения объектов — это критически важное решение, которое влияет на эффективность, точность и масштабируемость приложений компьютерного зрения. В этом руководстве представлено подробное техническое сравнение между YOLOv5, всемирно признанным стандартом доступного искусственного интеллекта, и PP-YOLOE+, развивающейся архитектурой из PaddlePaddle .
В то время как PP-YOLOE+ представляет интересные концепции без анкоров, YOLOv5 остается доминирующей силой благодаря своей беспрецедентной экосистеме, надежности и балансу скорости и точности. Для разработчиков, смотрящих в будущее, мы также затронем YOLO26, который переопределяет современные стандарты производительности с помощью инференции NMS.
Метрики производительности и тесты
Компромисс между средней точностью (mAP) и задержкой вывода определяет полезность модели. В таблице ниже сравнивается производительность YOLOv5 PP-YOLOE+ на COCO .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv5 Ultralytics YOLOv5
Выпущено в 2020 году Гленном Джочером и Ultralytics, YOLOv5 произвела революцию в этой области, сделав высокопроизводительное обнаружение объектов доступным для всех. Созданная на базе PyTorch, он уделяет приоритетное внимание удобству использования «от начала до конца», позволяя разработчикам переходить от набора данных к развертыванию в рекордно короткие сроки.
Архитектура и Дизайн
YOLOv5 магистраль CSPDarknet (Cross Stage Partial Network) для максимизации потока градиента при минимальных вычислительных затратах. Он использует анкерную головку обнаружения, которая использует заранее определенные анкерные рамки для прогнозирования местоположения объектов. Этот подход проверен в боевых условиях и обеспечивает стабильную конвергенцию для широкого спектра наборов данных, от аэрофотоснимков до медицинских сканов.
Основные преимущества
- Готовность к производству: YOLOv5 в миллионах приложений по всему миру, что обеспечивает исключительную стабильность.
- Универсальность: Помимо detect, он изначально поддерживает сегментацию экземпляров и классификацию изображений.
- Экспортируемость: модель обеспечивает беспроблемный экспорт в ONNX, TensorRT, CoreML и TFLite различных аппаратных целей.
Обзор PP-YOLOE+
PP-YOLOE+ — это усовершенствованная версия PP-YOLOE, разработанная PaddlePaddle в Baidu. Выпущенная в апреле 2022 года, она направлена на улучшение механизма без анкеров и доработку архитектуры магистрали для высокопроизводительных вычислительных сред.
Архитектура и Дизайн
PP-YOLOE+ использует парадигму без якорей, что устраняет необходимость настройки гиперпараметров якорной коробки. Он использует базовую структуру CSPRepResStage, которая сочетает в себе остаточные соединения с методами перепараметризации (в стиле RepVGG) для ускорения вывода при сохранении возможности извлечения признаков. Он также использует Task Alignment Learning (TAL) для лучшего согласования задач классификации и локализации во время обучения.
Соображения по поводу вариантов использования
Хотя PP-YOLOE+ достигает высоких mAP COCO , он тесно связан с PaddlePaddle . Это может создать проблемы для команд, чья инфраструктура основана на стандартных TensorFlow PyTorch TensorFlow . Его основное преимущество заключается в сценариях, где максимальная точность имеет приоритет над гибкостью развертывания или простотой обучения.
Подробное техническое сравнение
1. Методика обучения и простота использования
Одно из определяющих отличий заключается в пользовательском опыте. YOLOv5 известен своим рабочим процессом «Zero to Hero» (от нуля до героя). Ultralytics автоматизирует сложные задачи, такие как увеличение объема данных (Mosaic, MixUp) и эволюция гиперпараметров.
- YOLOv5: Использует интуитивно понятный интерфейс командной строки (CLI) или Python . Он автоматически обрабатывает вычисления анкорных рамок с помощью AutoAnchor, обеспечивая адаптацию модели к пользовательским наборам данных без ручного вмешательства.
- PP-YOLOE+: Опирается на систему конфигурации PaddleDetection. Несмотря на свою мощность, она часто требует более глубокого понимания конкретных конфигурационных файлов и PaddlePaddle , что для многих разработчиков сопряжено с более сложным процессом обучения.
2. Скорость вывода и развертывание
YOLOv5 скоростьюCPU , что делает его лучшим выбором для периферийных приложений искусственного интеллекта на таких устройствах, как Raspberry Pi или мобильные телефоны. Как показано в таблице, модель YOLOv5n (Nano) достигает невероятных скоростей, что крайне важно для отслеживания в реальном времени.
PP-YOLOE+ уделяет большое внимание GPU с использованием TensorRT. Хотя он хорошо работает на серверном оборудовании (таком как GPU T4), ему часто не хватает легкой оптимизации, необходимой дляGPU , по сравнению с высокооптимизированной Ultralytics .
3. Эффективность памяти
Ultralytics разработаны с учетом эффективного использования памяти. Процесс обучения YOLOv5 оптимизирован для работы на потребительских графических процессорах, что делает ИИ доступным для широкого круга пользователей. В отличие от этого, более новые трансформаторные или сложные архитектурные конструкции часто требуют значительного CUDA , что повышает барьер для входа на рынок. Сбалансированная архитектура YOLOv5 гарантирует, что извлечение признаков остается надежным без ненужного раздувания параметров.
Приложения в реальном мире
- YOLOv5 является лучшим выбором для агротехнологий (например, обнаружение болезней сельскохозяйственных культур) и аналитики розничной торговли благодаря своей способности работать на периферийных устройствах в удаленных местах или магазинах без специальных серверов.
- PP-YOLOE+ часто подходит для промышленного контроля в контролируемых средах, где доступны мощные GPU , способные обрабатывать немного более сложные вычисления для получения незначительного прироста точности.
Совет по рабочему процессу: Ultralytics
При использовании Ultralytics вы получаете доступ к Ultralytics . Этот унифицированный интерфейс позволяет управлять наборами данных, обучать в облаке и развертывать в любом формате (ONNX, TFLite и т. д.) одним щелчком мыши, что значительно снижает нагрузку MLOps по сравнению с управлением необработанными скриптами фреймворка.
Будущее: переход на YOLO26
Хотя YOLOv5 легендарной моделью, в этой области произошли значительные изменения. Разработчикам, стремящимся к максимальной производительности, мы рекомендуем YOLO26.
YOLO26 представляет собой сдвиг парадигмы благодаря своей сквозной конструкции NMS. Благодаря устранению не максимального подавления (NMS) YOLO26 сокращает задержку вывода и сложность развертывания. Он также обладает следующими особенностями:
- MuSGD Optimizer: гибрид SGD Muon для стабильности обучения уровня LLM.
- До 43% более быстрое CPU : оптимизировано специально для пограничных вычислений.
- ProgLoss + STAL: усовершенствованные функции потери, которые улучшают обнаружение мелких объектов, что является критически важной областью для применения дронов и IoT.
Простота обновления
Благодаря унифицированному Python переход с YOLOv5 более новые Ultralytics не представляет никакого труда.
from ultralytics import YOLO
# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")
# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
Заключение
Обе архитектуры имеют свои преимущества. PP-YOLOE+ демонстрирует высокую теоретическую производительность в COCO для задач, GPU. Однако YOLOv5 остается лидером по удобству использования, гибкости развертывания и производительности на периферии.
Для большинства разработчиков и исследователей пребывание в Ultralytics гарантирует долгосрочную поддержку и доступ к последним достижениям. Независимо от того, останетесь ли вы приверженцем надежного YOLOv5 перейдете на передовой YOLO26, вы получаете преимущества от высокооптимизированной платформы, разработанной сообществом и предназначенной для достижения реального успеха.
Чтобы изучить другие варианты, рассмотрите возможность ознакомления с YOLO11 или специализированные модели, такие как RT-DETR для точности на основе трансформатора.