Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO против PP-YOLOE+#

В условиях высокой конкуренции в сфере компьютерного зрения в реальном времени выбор оптимальной архитектуры для твоих конкретных задач развертывания имеет решающее значение. Это руководство содержит подробное техническое сравнение DAMO-YOLO и PP-YOLOE+, глубоко погружаясь в их архитектурные решения, методы обучения и показатели производительности. Мы также рассмотрим, как эти модели соотносятся с передовыми решениями, такими как недавно выпущенная Ultralytics YOLO26.

Link to this sectionОбзор моделей#

Оба фреймворка появились в 2022 году как мощные альтернативы для промышленных приложений, использующие сложные методы для расширения границ точности и скорости вывода.

Link to this sectionDAMO-YOLO#

Разработанный Alibaba Group, DAMO-YOLO представил несколько новых методов для оптимизации баланса между задержкой и точностью, в значительной степени опираясь на методы автоматизированного поиска и продвинутое слияние признаков.

DAMO-YOLO использует поиск по многомасштабной архитектуре (MAE-NAS) для автоматического проектирования бэкендов, оптимизированных для эффективности оборудования. Он также оснащен эффективной RepGFPN (перепараметризованной обобщенной пирамидой признаков) для слияния признаков в шее и легкой архитектурой «ZeroHead». Кроме того, он сильно полагается на методы дистилляции во время обучения для повышения репрезентативной мощности модели-студента.

Узнай больше о DAMO-YOLO

Link to this sectionPP-YOLOE+#

Команда Baidu PaddlePaddle представила PP-YOLOE+, инкрементальное обновление архитектуры PP-YOLOE. Она фокусируется на крупномасштабном предварительном обучении и уточненных функциях потерь для обеспечения высокого mAP, особенно в рамках собственного фреймворка глубокого обучения.

PP-YOLOE+ использует бэкенд CSPRepResNet и ET-head (эффективную голову с учетом задач). Версия «plus» вводит мощную стратегию предварительного обучения на наборе данных Objects365, что значительно расширяет ее способность к обобщению в различных реальных условиях.

Узнай больше о PP-YOLOE+

Link to this sectionАрхитектурное сравнение#

Различия в философии проектирования между этими двумя моделями сильно влияют на их идеальные сценарии использования и аппаратную совместимость.

Link to this sectionСлияние признаков и бэкенды#

Бэкенды DAMO-YOLO, созданные с помощью MAE-NAS, хорошо адаптированы для граничных устройств, часто обеспечивая выгодное соотношение скорости и количества параметров. Однако эти кастомные архитектуры могут быть жесткими и сложными в адаптации для новых задач, таких как сегментация экземпляров. Шея RepGFPN улучшает многомасштабное слияние признаков, но добавляет сложности на этапе экспорта с перепараметризацией.

PP-YOLOE+ опирается на более традиционный, но высокоэффективный CSPRepResNet. Хотя этот бэкенд требует большего количества параметров, чем DAMO-YOLO, для достижения аналогичной точности, он очень стабилен в обучении и легче интегрируется в существующие пайплайны. Его ET-head эффективно обрабатывает классификацию и регрессию, но все еще требует шагов постобработки, таких как немаксимальное подавление (NMS).

Устранение задержек постобработки

И DAMO-YOLO, и PP-YOLOE+ требуют NMS для постобработки ограничивающих рамок. Если задержка вывода критична, подумай об использовании Ultralytics YOLO26, которая отличается нативным End-to-End NMS-Free дизайном. Этот прорывной подход исключает постобработку NMS для более быстрого и простого пайплайна развертывания.

Link to this sectionАнализ производительности и метрик#

При оценке этих моделей для производства баланс между точностью (mAP), скоростью вывода и размером параметров критичен. Ниже представлено прямое сравнение их основных вариантов.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Как показывает таблица, DAMO-YOLO обычно достигает меньшей задержки на малых (s) и крошечных (t) масштабах благодаря своим NAS-оптимизированным бэкендам. Однако PP-YOLOE+ невероятно хорошо масштабируется до средних (m) и больших (l) уровней, демонстрируя значительно более высокие показатели mAP, хотя и ценой небольшой задержки скорости T4 TensorRT.

Link to this sectionТребования к памяти и эффективность обучения#

Зависимость DAMO-YOLO от дистилляции означает, что тебе часто нужно обучать гораздо большую модель-учитель перед обучением меньшей модели-студента. Это резко увеличивает требования к памяти CUDA и общий вычислительный бюджет. PP-YOLOE+ упрощает это с помощью стандартного одноэтапного обучения, но остается жестко привязанной к фреймворку PaddlePaddle, что может ограничить гибкость для команд, привыкших к PyTorch.

Напротив, современная модель Ultralytics YOLO26 решает эти проблемы. Используя новый оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM, YOLO26 достигает более быстрой сходимости и высокостабильного обучения без необходимости использования сложных пайплайнов дистилляции. Кроме того, модели YOLO обычно требуют гораздо меньше памяти CUDA во время обучения по сравнению с детекторами на основе трансформеров, такими как RT-DETR.

Link to this sectionРеальные применения и идеальные сценарии использования#

Link to this sectionКогда использовать DAMO-YOLO#

DAMO-YOLO идеально подходит для высокопроизводительного граничного вывода, где задержка является главным узким местом. Ее небольшие варианты отлично работают в таких средах, как системы управления трафиком или базовое наблюдение с дронов, при условии, что у твоей инженерной команды есть ресурсы для управления ее сложными процессами дистилляции и перепараметризации.

Link to this sectionКогда использовать PP-YOLOE+#

PP-YOLOE+ сияет, когда ты уже глубоко инвестирован в экосистему Baidu или запускаешь крупномасштабные серверные развертывания. Ее впечатляющий mAP делает ее подходящей для сложного медицинского анализа изображений или плотного обнаружения производственных дефектов.

Link to this sectionПреимущество Ultralytics#

Хотя и DAMO-YOLO, и PP-YOLOE+ предлагают определенные локальные преимущества, разработчики, стремящиеся к максимальной универсальности, скорости и простоте использования, неизменно обращаются к платформе Ultralytics.

При обновлении твоего пайплайна компьютерного зрения Ultralytics YOLO26 обеспечивает непревзойденный опыт разработки:

  • До 43% более быстрый вывод на CPU: Благодаря полному удалению Distribution Focal Loss (DFL), YOLO26 работает удивительно быстро на периферийных CPU и энергоэффективных IoT-устройствах.
  • Улучшенное обнаружение мелких объектов: Интеграция функций потерь ProgLoss и STAL обеспечивает значительные улучшения в распознавании мелких объектов, что жизненно важно для аэрофотосъемки.
  • Широкая универсальность: В отличие от PP-YOLOE+, которая фокусируется строго на обнаружении, YOLO26 легко справляется с оценкой позы, ориентированными ограничивающими рамками (OBB) и семантической сегментацией с архитектурными улучшениями, специфичными для каждой задачи.

Link to this sectionЗаключение#

DAMO-YOLO и PP-YOLOE+ представляют собой важные вехи в развитии детекции объектов без использования анкоров. DAMO-YOLO раздвинул границы поиска нейронных архитектур для задержки на граничных устройствах, в то время как PP-YOLOE+ продемонстрировал мощь крупномасштабного предварительного обучения.

Однако для разработчиков, ищущих лучший баланс скорости, точности и простоты развертывания, модель Ultralytics YOLO26 является окончательным выбором. Ее архитектура без NMS, надежный Python API и бесшовная интеграция с такими инструментами, как Weights & Biases и TensorRT, гарантируют, что твои проекты будут плавно переходить от прототипа к производству.

Готов начать? Изучи Руководство по быстрому старту Ultralytics или сравни другие модели в нашем обзоре YOLO11 против DAMO-YOLO.

Комментарии