Link to this sectionDAMO-YOLO против PP-YOLOE+#

В условиях высокой конкуренции в сфере компьютерного зрения в реальном времени выбор оптимальной архитектуры для твоих конкретных задач развертывания имеет решающее значение. Это руководство содержит подробное техническое сравнение DAMO-YOLO и PP-YOLOE+, глубоко погружаясь в их архитектурные решения, методы обучения и показатели производительности. Мы также рассмотрим, как эти модели соотносятся с передовыми решениями, такими как недавно выпущенная Ultralytics YOLO26.

Link to this sectionОбзор моделей#

Оба фреймворка появились в 2022 году как мощные альтернативы для промышленных приложений, использующие сложные методы для расширения границ точности и скорости вывода.

Link to this sectionDAMO-YOLO#

Разработанный Alibaba Group, DAMO-YOLO представил несколько новых методов для оптимизации баланса между задержкой и точностью, в значительной степени опираясь на методы автоматизированного поиска и продвинутое слияние признаков.

Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
Организация: Alibaba Group
Дата: 2022-11-23
Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
GitHub: tinyvision/DAMO-YOLO
Документация: DAMO-YOLO README

DAMO-YOLO использует поиск по многомасштабной архитектуре (MAE-NAS) для автоматического проектирования бэкендов, оптимизированных для эффективности оборудования. Он также оснащен эффективной RepGFPN (перепараметризованной обобщенной пирамидой признаков) для слияния признаков в шее и легкой архитектурой «ZeroHead». Кроме того, он сильно полагается на методы дистилляции во время обучения для повышения репрезентативной мощности модели-студента.

Узнай больше о DAMO-YOLO

Link to this sectionPP-YOLOE+#

Команда Baidu PaddlePaddle представила PP-YOLOE+, инкрементальное обновление архитектуры PP-YOLOE. Она фокусируется на крупномасштабном предварительном обучении и уточненных функциях потерь для обеспечения высокого mAP, особенно в рамках собственного фреймворка глубокого обучения.

Авторы: Авторы PaddlePaddle
Организация: Baidu
Дата: 02.04.2022
Arxiv: PP-YOLOE: An evolved version of YOLO
GitHub: PaddlePaddle/PaddleDetection
Документация: PP-YOLOE+ Configs

PP-YOLOE+ использует бэкенд CSPRepResNet и ET-head (эффективную голову с учетом задач). Версия «plus» вводит мощную стратегию предварительного обучения на наборе данных Objects365, что значительно расширяет ее способность к обобщению в различных реальных условиях.

Узнай больше о PP-YOLOE+

Link to this sectionАрхитектурное сравнение#

Различия в философии проектирования между этими двумя моделями сильно влияют на их идеальные сценарии использования и аппаратную совместимость.

Link to this sectionСлияние признаков и бэкенды#

Бэкенды DAMO-YOLO, созданные с помощью MAE-NAS, хорошо адаптированы для граничных устройств, часто обеспечивая выгодное соотношение скорости и количества параметров. Однако эти кастомные архитектуры могут быть жесткими и сложными в адаптации для новых задач, таких как сегментация экземпляров. Шея RepGFPN улучшает многомасштабное слияние признаков, но добавляет сложности на этапе экспорта с перепараметризацией.

PP-YOLOE+ опирается на более традиционный, но высокоэффективный CSPRepResNet. Хотя этот бэкенд требует большего количества параметров, чем DAMO-YOLO, для достижения аналогичной точности, он очень стабилен в обучении и легче интегрируется в существующие пайплайны. Его ET-head эффективно обрабатывает классификацию и регрессию, но все еще требует шагов постобработки, таких как немаксимальное подавление (NMS).

Устранение задержек постобработки

И DAMO-YOLO, и PP-YOLOE+ требуют NMS для постобработки ограничивающих рамок. Если задержка вывода критична, подумай об использовании Ultralytics YOLO26, которая отличается нативным End-to-End NMS-Free дизайном. Этот прорывной подход исключает постобработку NMS для более быстрого и простого пайплайна развертывания.

Link to this sectionАнализ производительности и метрик#

При оценке этих моделей для производства баланс между точностью (mAP), скоростью вывода и размером параметров критичен. Ниже представлено прямое сравнение их основных вариантов.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(М)	FLOPs ^(Б)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

Как показывает таблица, DAMO-YOLO обычно достигает меньшей задержки на малых (s) и крошечных (t) масштабах благодаря своим NAS-оптимизированным бэкендам. Однако PP-YOLOE+ невероятно хорошо масштабируется до средних (m) и больших (l) уровней, демонстрируя значительно более высокие показатели mAP, хотя и ценой небольшой задержки скорости T4 TensorRT.

Link to this sectionТребования к памяти и эффективность обучения#

Зависимость DAMO-YOLO от дистилляции означает, что тебе часто нужно обучать гораздо большую модель-учитель перед обучением меньшей модели-студента. Это резко увеличивает требования к памяти CUDA и общий вычислительный бюджет. PP-YOLOE+ упрощает это с помощью стандартного одноэтапного обучения, но остается жестко привязанной к фреймворку PaddlePaddle, что может ограничить гибкость для команд, привыкших к PyTorch.

Напротив, современная модель Ultralytics YOLO26 решает эти проблемы. Используя новый оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM, YOLO26 достигает более быстрой сходимости и высокостабильного обучения без необходимости использования сложных пайплайнов дистилляции. Кроме того, модели YOLO обычно требуют гораздо меньше памяти CUDA во время обучения по сравнению с детекторами на основе трансформеров, такими как RT-DETR.

Link to this sectionРеальные применения и идеальные сценарии использования#

Link to this sectionКогда использовать DAMO-YOLO#

DAMO-YOLO идеально подходит для высокопроизводительного граничного вывода, где задержка является главным узким местом. Ее небольшие варианты отлично работают в таких средах, как системы управления трафиком или базовое наблюдение с дронов, при условии, что у твоей инженерной команды есть ресурсы для управления ее сложными процессами дистилляции и перепараметризации.

Link to this sectionКогда использовать PP-YOLOE+#

PP-YOLOE+ сияет, когда ты уже глубоко инвестирован в экосистему Baidu или запускаешь крупномасштабные серверные развертывания. Ее впечатляющий mAP делает ее подходящей для сложного медицинского анализа изображений или плотного обнаружения производственных дефектов.

Link to this sectionПреимущество Ultralytics#

Хотя и DAMO-YOLO, и PP-YOLOE+ предлагают определенные локальные преимущества, разработчики, стремящиеся к максимальной универсальности, скорости и простоте использования, неизменно обращаются к платформе Ultralytics.

При обновлении твоего пайплайна компьютерного зрения Ultralytics YOLO26 обеспечивает непревзойденный опыт разработки:

До 43% более быстрый вывод на CPU: Благодаря полному удалению Distribution Focal Loss (DFL), YOLO26 работает удивительно быстро на периферийных CPU и энергоэффективных IoT-устройствах.
Улучшенное обнаружение мелких объектов: Интеграция функций потерь ProgLoss и STAL обеспечивает значительные улучшения в распознавании мелких объектов, что жизненно важно для аэрофотосъемки.
Широкая универсальность: В отличие от PP-YOLOE+, которая фокусируется строго на обнаружении, YOLO26 легко справляется с оценкой позы, ориентированными ограничивающими рамками (OBB) и семантической сегментацией с архитектурными улучшениями, специфичными для каждой задачи.

Link to this sectionЗаключение#

DAMO-YOLO и PP-YOLOE+ представляют собой важные вехи в развитии детекции объектов без использования анкоров. DAMO-YOLO раздвинул границы поиска нейронных архитектур для задержки на граничных устройствах, в то время как PP-YOLOE+ продемонстрировал мощь крупномасштабного предварительного обучения.

Однако для разработчиков, ищущих лучший баланс скорости, точности и простоты развертывания, модель Ultralytics YOLO26 является окончательным выбором. Ее архитектура без NMS, надежный Python API и бесшовная интеграция с такими инструментами, как Weights & Biases и TensorRT, гарантируют, что твои проекты будут плавно переходить от прототипа к производству.

Готов начать? Изучи Руководство по быстрому старту Ultralytics или сравни другие модели в нашем обзоре YOLO11 против DAMO-YOLO.

Участники

GLglenn-jocher¹⁵ PDpderrenger¹

Создано 27 янв. 2025 г.Обновлено 3 недели назад