Перейти к содержанию

PP-YOLOE+ против DAMO-YOLO: Всестороннее техническое сравнение

Непрерывное развитие компьютерного зрения привело к появлению множества высокоспециализированных архитектур для обнаружения объектов в реальном времени. При оценке моделей для промышленных и исследовательских применений часто обсуждаются две выдающиеся платформы 2022 года: PP-YOLOE+ от Baidu и DAMO-YOLO от Alibaba Group. Обе модели расширили границы безанкерного detect за счет внедрения новых базовых сетей, передовых стратегий присвоения меток и специализированных методов слияния признаков.

Это руководство предоставляет подробный технический анализ PP-YOLOE+ и DAMO-YOLO, исследуя их архитектуры, методологии обучения и сильные стороны развертывания. Мы также рассмотрим, как эти фреймворки сравниваются с современными решениями, такими как Ultralytics YOLO26, чтобы помочь вам выбрать подходящий инструмент для ваших конкретных ограничений развертывания.

PP-YOLOE+: Усовершенствованное промышленное detect объектов

Разработанный в экосистеме Baidu, PP-YOLOE+ является итеративным улучшением по сравнению с оригинальным PP-YOLOE, сильно оптимизированным для фреймворка глубокого обучения PaddlePaddle. Он был разработан для максимизации точности и скорости инференции на серверном оборудовании, что делает его сильным кандидатом для промышленной инспекции и приложений умной розничной торговли.

Архитектурные инновации

PP-YOLOE+ представляет несколько архитектурных улучшений для совершенствования предыдущих безанкерных детекторов:

  • Бэкбон CSPRepResNet: Этот бэкбон использует архитектуру в стиле RepVGG в сочетании с соединениями Cross Stage Partial (CSP), обеспечивая хороший баланс между возможностью извлечения признаков и задержкой инференции.
  • Task Alignment Learning (TAL): PP-YOLOE+ использует передовую динамическую стратегию присвоения меток, которая выравнивает задачи классификации и регрессии во время обучения, сокращая разрыв между производительностью обучения и вывода.
  • Эффективная задача-ориентированная голова (ET-head): Оптимизированная голова обнаружения, разработанная для быстрой обработки признаков без ущерба для пространственного разрешения, что крайне выгодно для поддержания высоких метрик mAP.

Детали PP-YOLOE+:

Узнайте больше о PP-YOLOE+

DAMO-YOLO: Поиск нейроархитектуры на периферии

Разработанный Alibaba DAMO Academy, DAMO-YOLO использует совершенно иной подход. Вместо ручного проектирования магистральной сети исследовательская группа использовала поиск нейронной архитектуры (NAS) для обнаружения высокоэффективных сетевых топологий, адаптированных для строгих ограничений по задержке.

Основные особенности и конвейер обучения

DAMO-YOLO делает акцент на низкой задержке и высокой точности благодаря автоматизированной методологии с интенсивным использованием дистилляции:

  • Бэкбоны MAE-NAS: Используя метод автоматизации эффективного поиска нейронной архитектуры, DAMO-YOLO конструирует бэкбоны, оптимизированные специально для компромисса между параметрами и точностью.
  • Эффективная RepGFPN: Репараметризованная обобщенная пирамида признаков обеспечивает надежное многомасштабное слияние признаков, что помогает модели detect объекты значительно различающихся размеров в одном кадре.
  • Дизайн ZeroHead: Значительно упрощенная голова детектора, которая кардинально сокращает вычислительные затраты на этапе инференса.
  • Улучшение дистилляции: Для повышения производительности меньших вариантов DAMO-YOLO в значительной степени полагается на сложный процесс дистилляции знаний, где более крупная модель-учитель направляет модель-ученика.

Подробности DAMO-YOLO:

Узнайте больше о DAMO-YOLO

Привязка к фреймворку

Хотя PP-YOLOE+ и DAMO-YOLO предлагают надежные теоретические инновации, они тесно связаны со своими соответствующими фреймворками (PaddlePaddle и специфическими средами Alibaba). Это может создавать трудности при попытке портировать эти модели в стандартизированные облачные или граничные развертывания.

Анализ производительности

При оценке этих моделей компромисс между задержкой, вычислительной сложностью (FLOPs) и средней точностью (mAP) определяет идеальную среду их развертывания.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

DAMO-YOLO обычно достигает более низких задержек TensorRT на нано- и мини-масштабах, что делает его весьма конкурентоспособным для высокопроизводительных видеопотоков. Однако PP-YOLOE+ невероятно хорошо масштабируется до своего сверхбольшого (x) вариант, достигающий высочайшей точности для сложных изображений, где время инференса является второстепенным фактором.

Преимущество Ultralytics: Прогресс за пределами архитектур 2022 года

Хотя PP-YOLOE+ и DAMO-YOLO представляли собой значительные вехи, современная разработка требует большей универсальности, более простых конвейеров обучения и меньших требований к памяти. Платформа Ultralytics удовлетворяет эти потребности, предлагая беспроблемный опыт, который значительно превосходит сложные процессы дистилляции и специфические для фреймворка настройки, требуемые старыми моделями.

Для разработчиков, стремящихся достичь наилучшего баланса производительности сегодня, Ultralytics YOLO26 обеспечивает революционный скачок в эффективности развертывания в реальных условиях.

Почему YOLO26 лидирует в отрасли

Выпущенный в начале 2026 года, YOLO26 опирается на наследие YOLO11, представляя прорывные технологии, адаптированные для производства:

  • Сквозная архитектура без NMS: YOLO26 устраняет постобработку с использованием немаксимального подавления (NMS). Это приводит к упрощению логики развертывания и стабильным, высокопредсказуемым задержкам инференса.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей, YOLO26 использует гибридный оптимизатор MuSGD. Это обеспечивает невероятно стабильное обучение и быструю сходимость, экономя ценные часы GPU.
  • Превосходный вывод на CPU: Благодаря удалению Distribution Focal Loss (DFL) и оптимизации графа сети, YOLO26 обеспечивает до 43% более быстрый вывод на CPU, что делает его лучшим выбором для периферийных устройств ИИ.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают выдающиеся улучшения в распознавании мелких объектов, что критически важно для операций с дронами и дистанционного зондирования.
  • Непревзойденная универсальность: В отличие от PP-YOLOE+, который строго ориентирован на detect, YOLO26 нативно поддерживает оценку позы, сегментацию экземпляров, классификацию изображений и ориентированные ограничивающие рамки (OBB) без проблем.

Простота использования и эффективность обучения

Обучение модели DAMO-YOLO требует управления сложным конвейером дистилляции по схеме "учитель-ученик". В отличие от этого, обучение модели Ultralytics требует всего нескольких строк Python-кода, с минимальным использованием памяти CUDA по сравнению с конкурирующими архитектурами.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

Узнайте больше о YOLO26

Идеальные варианты использования и рекомендации

Выбор оптимальной архитектуры компьютерного зрения сильно зависит от интеграции экосистемы вашей команды и целей развертывания.

  • Выберите PP-YOLOE+, если весь ваш конвейер глубоко интегрирован в экосистему Baidu PaddlePaddle. Это отличный выбор для анализа статических изображений на мощных серверах, где основной целью является максимизация точности.
  • Выберите DAMO-YOLO, если вы проводите специализированные исследования алгоритмов поиска нейронной архитектуры, или если у вас есть инженерные ресурсы для поддержки сложных конвейеров дистилляции для достижения амбициозных целевых показателей задержки TensorRT.
  • Выберите Ultralytics YOLO26 для большинства современных производственных сценариев. Экосистема Ultralytics предоставляет непревзойденную документацию, сниженные требования к памяти и упрощенный API. Независимо от того, создаете ли вы системы автоматизированного контроля качества или выполняете отслеживание в реальном времени на Raspberry Pi, архитектура YOLO26 без NMS обеспечивает быстрые, стабильные и высокоточные результаты "из коробки".

Для разработчиков, изучающих другие передовые решения, документация Ultralytics также предоставляет обширные ресурсы по широко используемым YOLOv8 и надежным YOLO11, гарантируя, что у вас будет подходящая модель для любой задачи компьютерного зрения.


Комментарии