YOLOv6-3.0 против DAMO-YOLO: техническое противостояние в обнаружении объектов в реальном времени

Мир компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы возможного в обнаружении объектов в реальном времени. Два заметных претендента в этой области — YOLOv6-3.0 и DAMO-YOLO. Обе модели привносят уникальные архитектурные инновации, призванные максимизировать производительность на промышленном оборудовании. Это руководство содержит исчерпывающее техническое сравнение этих двух моделей, исследуя их архитектуры, методологии обучения и идеальные сценарии использования, а также представляя преимущества следующего поколения моделей Ultralytics, таких как YOLO26.

Профили моделей

YOLOv6-3.0: промышленная пропускная способность

Разработанная отделом Vision AI компании Meituan, модель YOLOv6-3.0 создана специально для высокопроизводительных промышленных приложений. Она делает упор на максимизацию производительности на аппаратных ускорителях, таких как GPU NVIDIA.

YOLOv6-3.0 представляет модуль двунаправленной конкатенации (BiC) для улучшения слияния признаков и использует стратегию обучения AAT (Anchor-Aided Training). Эта стратегия сочетает в себе преимущества якорей (anchor-based) и детекторов без якорей во время обучения, сохраняя при этом вывод данных строго без якорей. Ее магистральная сеть EfficientRep делает ее высокоэффективной для пакетной обработки на GPU, что идеально подходит для обработки огромных объемов данных понимания видео.

Узнай больше о YOLOv6

DAMO-YOLO: быстрота и точность благодаря NAS

Created by Alibaba Group, DAMO-YOLO leverages Neural Architecture Search (NAS) to automatically discover the most efficient backbone structures for real-time inference.

  • Авторы: Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь и др.
  • Организация: Alibaba Group
  • Дата: 23.11.2022
  • Arxiv: 2211.15444v2
  • GitHub: tinyvision/DAMO-YOLO

DAMO-YOLO выделяется своей сетью RepGFPN (перепараметризованная обобщенная пирамида признаков) для эффективного слияния признаков на нескольких масштабах и дизайном ZeroHead, который значительно снижает вычислительную нагрузку в детектирующей головке. Она также включает в себя назначение меток AlignedOTA и надежные методы дистилляции знаний для повышения точности без увеличения количества параметров модели.

Узнай больше о DAMO-YOLO

Накладные расходы на дистилляцию

Хотя DAMO-YOLO достигает отличной точности, ее сильная зависимость от дистилляции знаний во время обучения требует использования гораздо более крупной «учительской» модели. Это значительно увеличивает потребление памяти CUDA на этапе обучения по сравнению с более простыми архитектурами.

Сравнение производительности

При оценке моделей обнаружения объектов баланс между средней точностью (mAP) и скоростью вывода имеет решающее значение. Ниже приведено подробное сравнение YOLOv6-3.0 и DAMO-YOLO для моделей разного масштаба.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv6-3.0 демонстрирует исключительную скорость на GPU NVIDIA при использовании оптимизаций TensorRT, особенно в версиях nano и small. Однако оптимизированные с помощью NAS магистральные сети DAMO-YOLO, как правило, требуют меньше FLOP на средних и больших масштабах, что дает небольшие преимущества в задержке для более крупных развертываний.

Преимущество Ultralytics: знакомство с YOLO26

Хотя YOLOv6-3.0 и DAMO-YOLO являются мощными инструментами, разработчики часто сталкиваются с трудностями из-за сложных конвейеров развертывания, высоких требований к памяти при обучении и жестких однозадачных архитектур. Экосистема Ultralytics обеспечивает гораздо более простой и удобный опыт для разработчика.

С выходом YOLO26 компания Ultralytics переопределила современное состояние ИИ в компьютерном зрении. Выпущенная в январе 2026 года, модель Ultralytics YOLO26 раздвигает границы эффективности и универсальности.

Ключевые инновации в YOLO26

  • Сквозной дизайн без NMS: Основываясь на концепциях, заложенных в YOLOv10, YOLO26 естественным образом устраняет пост-обработку NMS (немаксимальное подавление). Это радикально снижает вариативность задержек и упрощает развертывание на пограничных устройствах через CoreML или TFLite.
  • Удаление DFL: Удалив функцию потерь Distribution Focal Loss, YOLO26 упрощает процесс экспорта и значительно повышает совместимость с маломощными микроконтроллерами и пограничным оборудованием.
  • До 43% быстрее при выводе на CPU: Для приложений, не имеющих выделенного оборудования GPU, оптимизация CPU в YOLO26 обеспечивает непревзойденную скорость, превосходя модели, сильно зависящие от GPU, такие как YOLOv6.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon), чтобы гарантировать стабильное обучение и быструю сходимость.
  • ProgLoss + STAL: Передовые функции потерь значительно улучшают распознавание мелких объектов, что делает YOLO26 идеальной для управления дронами и отслеживания удаленных целей.
  • Многозадачная универсальность: В отличие от DAMO-YOLO, которая является исключительно детектором, YOLO26 обеспечивает «из коробки» поддержку сегментации экземпляров, оценки позы (через оценку остаточного логарифмического правдоподобия) и ориентированных ограничивающих рамок (OBB) в рамках единого API.

Узнай больше о YOLO26

Обучение с эффективным использованием памяти

В отличие от сложных архитектур трансформеров, таких как RT-DETR, или конвейеров DAMO-YOLO с тяжелой дистилляцией, модели Ultralytics известны своим низким потреблением VRAM. Ты можешь легко обучить модель YOLO26 на потребительском оборудовании.

Упрощенный рабочий процесс на Python

Обучение и развертывание современных моделей не должно требовать сотен строк шаблонного кода. Пакет Ultralytics для Python упрощает жизненный цикл машинного обучения.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

Идеальные сценарии использования

Выбор подходящей архитектуры полностью зависит от твоих ограничений при развертывании:

Когда использовать YOLOv6-3.0

  • Видеоаналитика с большими пакетами данных: Отлично подходит для обработки плотных потоков видео на корпоративных GPU-серверах, где можно в полной мере использовать TensorRT.
  • Промышленная автоматизация: Высокоскоростные производственные линии, выполняющие контроль качества и поиск дефектов.

Когда использовать DAMO-YOLO

  • Специализированные процессоры (Custom Silicon): Исследование отображения поиска нейронной архитектуры для конкретного проприетарного оборудования NPU.
  • Академические исследования: Бенчмаркинг новых методов дистилляции знаний для сетей реального времени.

Когда использовать Ultralytics YOLO26

  • Развертывание на граничных и мобильных устройствах: Дизайн без NMS, удаление DFL и ускорение CPU на 43% делают ее бесспорным лидером для интеграции в iOS, Android и Raspberry Pi.
  • От быстрого прототипирования к производству: Бесшовная интеграция с платформой Ultralytics позволяет командам пройти путь от аннотации набора данных до глобального облачного развертывания за считанные дни, а не месяцы.
  • Сложные конвейеры компьютерного зрения: Когда проект требует одновременного обнаружения ограничивающих рамок, ключевых точек позы человека и точных масок сегментации.

Заключение

И YOLOv6-3.0, и DAMO-YOLO внесли значительный вклад в науку об обнаружении объектов в реальном времени. YOLOv6 усовершенствовала максимизацию работы на GPU, в то время как DAMO-YOLO продемонстрировала возможности автоматизированного поиска архитектуры.

Однако для разработчиков, ищущих идеальное сочетание точности, скорости вывода и простоты обслуживания экосистемы, семейство Ultralytics YOLO остается лучшим выбором. Благодаря революционным оптимизациям, представленным в YOLO26, порог входа для создания профессиональных приложений компьютерного зрения стал ниже, чем когда-либо.

Для дальнейшего изучения тебе также может быть интересно сравнить эти модели с другими архитектурами в нашей документации, такими как YOLO11 или подходами на основе трансформеров, такими как RT-DETR.

Комментарии