Перейти к содержанию

YOLOv6.0 против PP-YOLOE+: оптимизация обнаружения промышленных объектов

Область обнаружения объектов в реальном времени быстро развивается, чему способствует потребность в моделях, способных обеспечить высокую точность и низкую задержку на различном оборудовании. Двумя выдающимися архитектурами, определившими эту область, являются YOLOv6.YOLOv6, разработанная Meituan для промышленного применения, и PP-YOLOE+, усовершенствованная модель без анкоров из PaddlePaddle компании Baidu.

В этом сравнении рассматриваются их архитектурные инновации, тесты производительности и пригодность для развертывания, чтобы помочь вам выбрать подходящий инструмент для ваших проектов в области компьютерного зрения.

Обзор модели

YOLOv6-3.0

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация:Meituan
Дата: 13 января 2023 г.
Ссылки:Arxiv | GitHub

YOLOv6.YOLOv6, часто называемый «полномасштабной перезагрузкой», представляет собой одноступенчатый детектор объектов, специально разработанный для промышленного применения. Его основная цель — максимально увеличить пропускную способность аппаратного обеспечения, такого как графические процессоры NVIDIA T4. В нем используются стратегии двунаправленной агрегации путей (Bi-PAN) и обучения с помощью якорей (AAT), которые позволяют преодолеть ограничения скорости и точности.

Узнайте больше о YOLOv6

PP-YOLOE+

Авторы: PaddlePaddle
Организация:Baidu
Дата: 2 апреля 2022 г.
Ссылки:Arxiv | GitHub

PP-YOLOE+ — это усовершенствованная версияYOLO , в которой используется масштабируемая магистраль CSPRepResNet и головная часть, адаптированная к задачам. Она входит в состав более широкого набора PaddleDetection и ориентирована на высокую точность, низкую задержку и отсутствие анкеров. Она особенно эффективна при развертывании в PaddlePaddle с использованием PaddleLite для разнообразной поддержки бэкэнда, включая оптимизацию FPGA и NPU.

Узнайте больше о PP-YOLOE

Сравнение производительности

При выборе модели для производства очень важно понимать компромисс между средней точностью (mAP) и скоростью инференции. В таблице ниже представлено сравнение этих моделей по различным размерам.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Критический анализ

  1. Эффективность небольших моделей: в нано/крошечном режиме PP-YOLOE+t предлагает значительно более высокую точность (39,9% mAP 37,5% mAP) при сопоставимом количестве параметров. Однако YOLOv6.YOLOv6 агрессивно оптимизирован для задержки на графических процессорах, достигая невероятных 1,17 мс на T4.
  2. Средний диапазон: в среднем диапазоне конкуренция усиливается. YOLOv6. YOLOv6 немного превосходит PP-YOLOE+m по точности (50,0% против 49,8%) и скорости (5,28 мс против 5,56 мс), что делает его отличным выбором для общепромышленных задач по инспектированию.
  3. Точность в большом масштабе: для приложений, требующих максимальной детализации, таких как анализ спутниковых изображений, PP-YOLOE+ предлагает вариант X-large, достигающий 54,7% mAP, размер, который YOLOv6. YOLOv6 явно не соответствует в этом конкретном сравнении тестов.

Архитектура и инновации

YOLOv6.0: промышленный специалист

YOLOv6 несколько агрессивных методов оптимизации, разработанных для сред с высокой пропускной способностью.

  • RepBi-PAN: двунаправленная сеть агрегации путей, оснащенная блоками типа RepVGG. Это позволяет модели иметь сложные ветвления во время обучения, но сливаться в простые свертки 3x3 во время вывода, что снижает затраты на доступ к памяти.
  • Обучение с помощью якорей (AAT): хотя вывод модели не использует якорей, YOLOv6 ветвь на основе якорей во время обучения для стабилизации сходимости, сочетая лучшее из обоих подходов.
  • Разделенная головка: она разделяет задачи регрессии и классификации, что является стандартом в современных детекторах для повышения скорости сходимости и точности.

PP-YOLOE+: усовершенствование без якоря

PP-YOLOE+ усовершенствует парадигму без якорей, уделяя особое внимание представлению признаков.

  • CSPRepResNet Backbone: использует масштабируемую основу, которая сочетает в себе сети Cross Stage Partial с остаточными соединениями, обеспечивая сильный градиентный поток.
  • TAL (Task Alignment Learning): эта динамическая стратегия присвоения меток гарантирует выбор наиболее качественных якорей на основе комбинированного показателя качества классификации и локализации.
  • ET-Head: эффективная головка, ориентированная на задачу, которая оптимизирует слои прогнозирования для увеличения скорости без ущерба для преимуществ ориентации на задачу.

Рекомендации по аппаратному обеспечению

YOLOv6 сильно YOLOv6 для NVIDIA (TensorRT) и часто демонстрирует лучшиеmAP на чипах T4 и A100. PP-YOLOE+ отлично подходит, когда требуется более широкая аппаратная поддержка через PaddleLite, включая процессоры ARM и NPU, которые используются в периферийных устройствах.

Преимущество Ultralytics

Хотя YOLOv6 PP-YOLOE+ являются выдающимися научными достижениями, разработчики часто сталкиваются с проблемами интеграции, развертывания и обслуживания при переходе от теории к практике. Ultralytics напрямую решает эти проблемы.

Простота использования и экосистема

Python Ultralytics позволяет обучать, проверять и развертывать модели с минимальным количеством кода. В отличие от сложных конфигурационных файлов, которые часто требуются для PaddleDetection или исследовательских репозиториев, Ultralytics рабочий процесс.

from ultralytics import YOLO

# Load a model (YOLOv8, YOLO11, or YOLO26)
model = YOLO("yolo26s.pt")

# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)

Кроме того, Ultralytics (ранее HUB) предлагает решение без кода для управления наборами данных, автоматической аннотации и обучения в облаке одним щелчком мыши, оптимизируя жизненный цикл MLOps для команд.

Универсальность и поддержка задач

YOLOv6 PP-YOLOE+ в первую очередь ориентированы на обнаружение объектов. В отличие от них, Ultralytics , такие как YOLO11 и YOLO26 изначально поддерживают полный спектр задач компьютерного зрения в рамках одной библиотеки:

Эффективность обучения и память

Ultralytics славятся эффективным использованием памяти. Благодаря оптимизации архитектуры и загрузчиков данных, такие модели, как YOLO26, позволяют использовать более крупные пакеты данных на потребительских графических процессорах по сравнению со старыми архитектурами или моделями с большим количеством трансформаторов, такими как RT-DETR. Это делает высокопроизводительный ИИ доступным даже без использования дата-центра.

Рекомендация: Почему стоит выбрать YOLO26?

Для разработчиков, начинающих новые проекты в 2026 году, Ultralytics представляет собой вершину эффективности и точности. Он устраняет конкретные ограничения, обнаруженные в предыдущих поколениях и конкурирующих моделях:

  • Сквозное решение NMS: в отличие от YOLOv6 PP-YOLOE+, которые могут потребовать постобработки NMS Non-Maximum Suppression), YOLO26 является сквозным решением. Это упрощает логику развертывания и снижает изменчивость задержки в сценах с большим количеством объектов.
  • MuSGD Optimizer: вдохновленный инновациями в области больших языковых моделей (LLM), этот оптимизатор обеспечивает стабильное обучение даже для сложных пользовательских наборов данных.
  • Оптимизация границ: благодаря удалению Distribution Focal Loss (DFL) и других тяжелых компонентов, YOLO26 достигает до 43% более быстрой CPU , что делает его лучшим выбором для мобильных и IoT-приложений, где GPU недоступны.
  • ProgLoss + STAL: эти усовершенствованные функции потери обеспечивают значительное улучшение в обнаружении мелких объектов, что традиционно является слабым местом детекторов общего назначения.

Узнайте больше о YOLO26

Заключение

Как YOLOv6.YOLOv6, так и PP-YOLOE+ играют важную роль в истории обнаружения объектов. Выберите YOLOv6.YOLOv6, если ваша инфраструктура строго привязана к NVIDIA и вам необходимо максимально увеличить пропускную способность для промышленного контроля. Выберите PP-YOLOE+, если вы глубоко интегрированы в PaddlePaddle Baidu PaddlePaddle или вам требуется специальная поддержка китайских аппаратных ускорителей.

Однако для перспективного решения, которое обеспечивает универсальность при выполнении различных задач, простоту использования и передовую производительность как на CPU на GPU, рекомендуется выбрать Ultralytics . Его интеграция с Ultralytics позволяет тратить меньше времени на настройку среды и больше времени на решение реальных задач.

Дополнительная литература

  • YOLOv8: классическая современная модель, широко используемая в промышленности.
  • YOLOv10: пионер стратегий обучения NMS.
  • RT-DETR: трансформатор обнаружения в реальном времени для сценариев с высокой точностью.
  • YOLO : обнаружение с открытым словарем для поиска объектов без специальной подготовки.

Комментарии