YOLOv6.0 против PP-YOLOE+: оптимизация обнаружения промышленных объектов
Область обнаружения объектов в реальном времени быстро развивается, чему способствует потребность в моделях, способных обеспечить высокую точность и низкую задержку на различном оборудовании. Двумя выдающимися архитектурами, определившими эту область, являются YOLOv6.YOLOv6, разработанная Meituan для промышленного применения, и PP-YOLOE+, усовершенствованная модель без анкоров из PaddlePaddle компании Baidu.
В этом сравнении рассматриваются их архитектурные инновации, тесты производительности и пригодность для развертывания, чтобы помочь вам выбрать подходящий инструмент для ваших проектов в области компьютерного зрения.
Обзор модели
YOLOv6-3.0
Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация:Meituan
Дата: 13 января 2023 г.
Ссылки:Arxiv | GitHub
YOLOv6.YOLOv6, часто называемый «полномасштабной перезагрузкой», представляет собой одноступенчатый детектор объектов, специально разработанный для промышленного применения. Его основная цель — максимально увеличить пропускную способность аппаратного обеспечения, такого как графические процессоры NVIDIA T4. В нем используются стратегии двунаправленной агрегации путей (Bi-PAN) и обучения с помощью якорей (AAT), которые позволяют преодолеть ограничения скорости и точности.
PP-YOLOE+
Авторы: PaddlePaddle
Организация:Baidu
Дата: 2 апреля 2022 г.
Ссылки:Arxiv | GitHub
PP-YOLOE+ — это усовершенствованная версияYOLO , в которой используется масштабируемая магистраль CSPRepResNet и головная часть, адаптированная к задачам. Она входит в состав более широкого набора PaddleDetection и ориентирована на высокую точность, низкую задержку и отсутствие анкеров. Она особенно эффективна при развертывании в PaddlePaddle с использованием PaddleLite для разнообразной поддержки бэкэнда, включая оптимизацию FPGA и NPU.
Сравнение производительности
При выборе модели для производства очень важно понимать компромисс между средней точностью (mAP) и скоростью инференции. В таблице ниже представлено сравнение этих моделей по различным размерам.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Критический анализ
- Эффективность небольших моделей: в нано/крошечном режиме PP-YOLOE+t предлагает значительно более высокую точность (39,9% mAP 37,5% mAP) при сопоставимом количестве параметров. Однако YOLOv6.YOLOv6 агрессивно оптимизирован для задержки на графических процессорах, достигая невероятных 1,17 мс на T4.
- Средний диапазон: в среднем диапазоне конкуренция усиливается. YOLOv6. YOLOv6 немного превосходит PP-YOLOE+m по точности (50,0% против 49,8%) и скорости (5,28 мс против 5,56 мс), что делает его отличным выбором для общепромышленных задач по инспектированию.
- Точность в большом масштабе: для приложений, требующих максимальной детализации, таких как анализ спутниковых изображений, PP-YOLOE+ предлагает вариант X-large, достигающий 54,7% mAP, размер, который YOLOv6. YOLOv6 явно не соответствует в этом конкретном сравнении тестов.
Архитектура и инновации
YOLOv6.0: промышленный специалист
YOLOv6 несколько агрессивных методов оптимизации, разработанных для сред с высокой пропускной способностью.
- RepBi-PAN: двунаправленная сеть агрегации путей, оснащенная блоками типа RepVGG. Это позволяет модели иметь сложные ветвления во время обучения, но сливаться в простые свертки 3x3 во время вывода, что снижает затраты на доступ к памяти.
- Обучение с помощью якорей (AAT): хотя вывод модели не использует якорей, YOLOv6 ветвь на основе якорей во время обучения для стабилизации сходимости, сочетая лучшее из обоих подходов.
- Разделенная головка: она разделяет задачи регрессии и классификации, что является стандартом в современных детекторах для повышения скорости сходимости и точности.
PP-YOLOE+: усовершенствование без якоря
PP-YOLOE+ усовершенствует парадигму без якорей, уделяя особое внимание представлению признаков.
- CSPRepResNet Backbone: использует масштабируемую основу, которая сочетает в себе сети Cross Stage Partial с остаточными соединениями, обеспечивая сильный градиентный поток.
- TAL (Task Alignment Learning): эта динамическая стратегия присвоения меток гарантирует выбор наиболее качественных якорей на основе комбинированного показателя качества классификации и локализации.
- ET-Head: эффективная головка, ориентированная на задачу, которая оптимизирует слои прогнозирования для увеличения скорости без ущерба для преимуществ ориентации на задачу.
Рекомендации по аппаратному обеспечению
YOLOv6 сильно YOLOv6 для NVIDIA (TensorRT) и часто демонстрирует лучшиеmAP на чипах T4 и A100. PP-YOLOE+ отлично подходит, когда требуется более широкая аппаратная поддержка через PaddleLite, включая процессоры ARM и NPU, которые используются в периферийных устройствах.
Преимущество Ultralytics
Хотя YOLOv6 PP-YOLOE+ являются выдающимися научными достижениями, разработчики часто сталкиваются с проблемами интеграции, развертывания и обслуживания при переходе от теории к практике. Ultralytics напрямую решает эти проблемы.
Простота использования и экосистема
Python Ultralytics позволяет обучать, проверять и развертывать модели с минимальным количеством кода. В отличие от сложных конфигурационных файлов, которые часто требуются для PaddleDetection или исследовательских репозиториев, Ultralytics рабочий процесс.
from ultralytics import YOLO
# Load a model (YOLOv8, YOLO11, or YOLO26)
model = YOLO("yolo26s.pt")
# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)
Кроме того, Ultralytics (ранее HUB) предлагает решение без кода для управления наборами данных, автоматической аннотации и обучения в облаке одним щелчком мыши, оптимизируя жизненный цикл MLOps для команд.
Универсальность и поддержка задач
YOLOv6 PP-YOLOE+ в первую очередь ориентированы на обнаружение объектов. В отличие от них, Ultralytics , такие как YOLO11 и YOLO26 изначально поддерживают полный спектр задач компьютерного зрения в рамках одной библиотеки:
- Сегментация экземпляров: точное маскирование объектов.
- Оценка позы: обнаружение ключевых точек для отслеживания людей или животных.
- Ориентированная ограничивающая рамка (OBB): обнаружение повернутых объектов, что имеет решающее значение для аэрофотосъемки.
- Классификация: Категоризация целого изображения.
Эффективность обучения и память
Ultralytics славятся эффективным использованием памяти. Благодаря оптимизации архитектуры и загрузчиков данных, такие модели, как YOLO26, позволяют использовать более крупные пакеты данных на потребительских графических процессорах по сравнению со старыми архитектурами или моделями с большим количеством трансформаторов, такими как RT-DETR. Это делает высокопроизводительный ИИ доступным даже без использования дата-центра.
Рекомендация: Почему стоит выбрать YOLO26?
Для разработчиков, начинающих новые проекты в 2026 году, Ultralytics представляет собой вершину эффективности и точности. Он устраняет конкретные ограничения, обнаруженные в предыдущих поколениях и конкурирующих моделях:
- Сквозное решение NMS: в отличие от YOLOv6 PP-YOLOE+, которые могут потребовать постобработки NMS Non-Maximum Suppression), YOLO26 является сквозным решением. Это упрощает логику развертывания и снижает изменчивость задержки в сценах с большим количеством объектов.
- MuSGD Optimizer: вдохновленный инновациями в области больших языковых моделей (LLM), этот оптимизатор обеспечивает стабильное обучение даже для сложных пользовательских наборов данных.
- Оптимизация границ: благодаря удалению Distribution Focal Loss (DFL) и других тяжелых компонентов, YOLO26 достигает до 43% более быстрой CPU , что делает его лучшим выбором для мобильных и IoT-приложений, где GPU недоступны.
- ProgLoss + STAL: эти усовершенствованные функции потери обеспечивают значительное улучшение в обнаружении мелких объектов, что традиционно является слабым местом детекторов общего назначения.
Заключение
Как YOLOv6.YOLOv6, так и PP-YOLOE+ играют важную роль в истории обнаружения объектов. Выберите YOLOv6.YOLOv6, если ваша инфраструктура строго привязана к NVIDIA и вам необходимо максимально увеличить пропускную способность для промышленного контроля. Выберите PP-YOLOE+, если вы глубоко интегрированы в PaddlePaddle Baidu PaddlePaddle или вам требуется специальная поддержка китайских аппаратных ускорителей.
Однако для перспективного решения, которое обеспечивает универсальность при выполнении различных задач, простоту использования и передовую производительность как на CPU на GPU, рекомендуется выбрать Ultralytics . Его интеграция с Ultralytics позволяет тратить меньше времени на настройку среды и больше времени на решение реальных задач.
Дополнительная литература
- YOLOv8: классическая современная модель, широко используемая в промышленности.
- YOLOv10: пионер стратегий обучения NMS.
- RT-DETR: трансформатор обнаружения в реальном времени для сценариев с высокой точностью.
- YOLO : обнаружение с открытым словарем для поиска объектов без специальной подготовки.