Link to this sectionDAMO-YOLO против PP-YOLOE+#
В условиях высокой конкуренции в сфере компьютерного зрения в реальном времени выбор оптимальной архитектуры для твоих конкретных задач развертывания имеет решающее значение. Это руководство содержит подробное техническое сравнение DAMO-YOLO и PP-YOLOE+, глубоко погружаясь в их архитектурные решения, методы обучения и показатели производительности. Мы также рассмотрим, как эти модели соотносятся с передовыми решениями, такими как недавно выпущенная Ultralytics YOLO26.
Link to this sectionОбзор моделей#
Оба фреймворка появились в 2022 году как мощные альтернативы для промышленных приложений, использующие сложные методы для расширения границ точности и скорости вывода.
Link to this sectionDAMO-YOLO#
Разработанный Alibaba Group, DAMO-YOLO представил несколько новых методов для оптимизации баланса между задержкой и точностью, в значительной степени опираясь на методы автоматизированного поиска и продвинутое слияние признаков.
- Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
- Организация: Alibaba Group
- Дата: 2022-11-23
- Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
- GitHub: tinyvision/DAMO-YOLO
- Документация: DAMO-YOLO README
DAMO-YOLO использует поиск по многомасштабной архитектуре (MAE-NAS) для автоматического проектирования бэкендов, оптимизированных для эффективности оборудования. Он также оснащен эффективной RepGFPN (перепараметризованной обобщенной пирамидой признаков) для слияния признаков в шее и легкой архитектурой «ZeroHead». Кроме того, он сильно полагается на методы дистилляции во время обучения для повышения репрезентативной мощности модели-студента.
Link to this sectionPP-YOLOE+#
Команда Baidu PaddlePaddle представила PP-YOLOE+, инкрементальное обновление архитектуры PP-YOLOE. Она фокусируется на крупномасштабном предварительном обучении и уточненных функциях потерь для обеспечения высокого mAP, особенно в рамках собственного фреймворка глубокого обучения.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 02.04.2022
- Arxiv: PP-YOLOE: An evolved version of YOLO
- GitHub: PaddlePaddle/PaddleDetection
- Документация: PP-YOLOE+ Configs
PP-YOLOE+ использует бэкенд CSPRepResNet и ET-head (эффективную голову с учетом задач). Версия «plus» вводит мощную стратегию предварительного обучения на наборе данных Objects365, что значительно расширяет ее способность к обобщению в различных реальных условиях.
Link to this sectionАрхитектурное сравнение#
Различия в философии проектирования между этими двумя моделями сильно влияют на их идеальные сценарии использования и аппаратную совместимость.
Link to this sectionСлияние признаков и бэкенды#
Бэкенды DAMO-YOLO, созданные с помощью MAE-NAS, хорошо адаптированы для граничных устройств, часто обеспечивая выгодное соотношение скорости и количества параметров. Однако эти кастомные архитектуры могут быть жесткими и сложными в адаптации для новых задач, таких как сегментация экземпляров. Шея RepGFPN улучшает многомасштабное слияние признаков, но добавляет сложности на этапе экспорта с перепараметризацией.
PP-YOLOE+ опирается на более традиционный, но высокоэффективный CSPRepResNet. Хотя этот бэкенд требует большего количества параметров, чем DAMO-YOLO, для достижения аналогичной точности, он очень стабилен в обучении и легче интегрируется в существующие пайплайны. Его ET-head эффективно обрабатывает классификацию и регрессию, но все еще требует шагов постобработки, таких как немаксимальное подавление (NMS).
И DAMO-YOLO, и PP-YOLOE+ требуют NMS для постобработки ограничивающих рамок. Если задержка вывода критична, подумай об использовании Ultralytics YOLO26, которая отличается нативным End-to-End NMS-Free дизайном. Этот прорывной подход исключает постобработку NMS для более быстрого и простого пайплайна развертывания.
Link to this sectionАнализ производительности и метрик#
При оценке этих моделей для производства баланс между точностью (mAP), скоростью вывода и размером параметров критичен. Ниже представлено прямое сравнение их основных вариантов.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Как показывает таблица, DAMO-YOLO обычно достигает меньшей задержки на малых (s) и крошечных (t) масштабах благодаря своим NAS-оптимизированным бэкендам. Однако PP-YOLOE+ невероятно хорошо масштабируется до средних (m) и больших (l) уровней, демонстрируя значительно более высокие показатели mAP, хотя и ценой небольшой задержки скорости T4 TensorRT.
Link to this sectionТребования к памяти и эффективность обучения#
Зависимость DAMO-YOLO от дистилляции означает, что тебе часто нужно обучать гораздо большую модель-учитель перед обучением меньшей модели-студента. Это резко увеличивает требования к памяти CUDA и общий вычислительный бюджет. PP-YOLOE+ упрощает это с помощью стандартного одноэтапного обучения, но остается жестко привязанной к фреймворку PaddlePaddle, что может ограничить гибкость для команд, привыкших к PyTorch.
Напротив, современная модель Ultralytics YOLO26 решает эти проблемы. Используя новый оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM, YOLO26 достигает более быстрой сходимости и высокостабильного обучения без необходимости использования сложных пайплайнов дистилляции. Кроме того, модели YOLO обычно требуют гораздо меньше памяти CUDA во время обучения по сравнению с детекторами на основе трансформеров, такими как RT-DETR.
Link to this sectionРеальные применения и идеальные сценарии использования#
Link to this sectionКогда использовать DAMO-YOLO#
DAMO-YOLO идеально подходит для высокопроизводительного граничного вывода, где задержка является главным узким местом. Ее небольшие варианты отлично работают в таких средах, как системы управления трафиком или базовое наблюдение с дронов, при условии, что у твоей инженерной команды есть ресурсы для управления ее сложными процессами дистилляции и перепараметризации.
Link to this sectionКогда использовать PP-YOLOE+#
PP-YOLOE+ сияет, когда ты уже глубоко инвестирован в экосистему Baidu или запускаешь крупномасштабные серверные развертывания. Ее впечатляющий mAP делает ее подходящей для сложного медицинского анализа изображений или плотного обнаружения производственных дефектов.
Link to this sectionПреимущество Ultralytics#
Хотя и DAMO-YOLO, и PP-YOLOE+ предлагают определенные локальные преимущества, разработчики, стремящиеся к максимальной универсальности, скорости и простоте использования, неизменно обращаются к платформе Ultralytics.
При обновлении твоего пайплайна компьютерного зрения Ultralytics YOLO26 обеспечивает непревзойденный опыт разработки:
- До 43% более быстрый вывод на CPU: Благодаря полному удалению Distribution Focal Loss (DFL), YOLO26 работает удивительно быстро на периферийных CPU и энергоэффективных IoT-устройствах.
- Улучшенное обнаружение мелких объектов: Интеграция функций потерь ProgLoss и STAL обеспечивает значительные улучшения в распознавании мелких объектов, что жизненно важно для аэрофотосъемки.
- Широкая универсальность: В отличие от PP-YOLOE+, которая фокусируется строго на обнаружении, YOLO26 легко справляется с оценкой позы, ориентированными ограничивающими рамками (OBB) и семантической сегментацией с архитектурными улучшениями, специфичными для каждой задачи.
Link to this sectionЗаключение#
DAMO-YOLO и PP-YOLOE+ представляют собой важные вехи в развитии детекции объектов без использования анкоров. DAMO-YOLO раздвинул границы поиска нейронных архитектур для задержки на граничных устройствах, в то время как PP-YOLOE+ продемонстрировал мощь крупномасштабного предварительного обучения.
Однако для разработчиков, ищущих лучший баланс скорости, точности и простоты развертывания, модель Ultralytics YOLO26 является окончательным выбором. Ее архитектура без NMS, надежный Python API и бесшовная интеграция с такими инструментами, как Weights & Biases и TensorRT, гарантируют, что твои проекты будут плавно переходить от прототипа к производству.
Готов начать? Изучи Руководство по быстрому старту Ultralytics или сравни другие модели в нашем обзоре YOLO11 против DAMO-YOLO.