Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 против DAMO-YOLO: техническое противостояние в реальном времени в обнаружении объектов#

Ландшафт компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы того, что возможно в обнаружении объектов в реальном времени. Два заметных претендента в этой области — YOLOv6-3.0 и DAMO-YOLO. Обе модели внедряют уникальные архитектурные инновации, разработанные для достижения максимальной производительности на промышленном оборудовании. Это руководство представляет собой исчерпывающее техническое сравнение этих двух моделей, исследуя их архитектуры, методологии обучения и идеальные сценарии использования, а также представляя преимущества следующего поколения моделей Ultralytics, таких как YOLO26.

Link to this sectionПрофили моделей#

Link to this sectionYOLOv6-3.0: Промышленная пропускная способность#

Разработанная отделом Vision AI в Meituan, модель YOLOv6-3.0 создана специально для высокопроизводительных промышленных приложений. Она делает основной упор на достижение максимальной производительности на аппаратных ускорителях, таких как GPU NVIDIA.

YOLOv6-3.0 внедряет модуль двунаправленной конкатенации (BiC) для улучшения слияния признаков и использует стратегию обучения с помощью якорей (AAT). Эта стратегия объединяет преимущества детекторов на основе якорей и безякорных детекторов во время обучения, при этом сохраняя процесс вывода строго без якорей. Ее магистральная сеть EfficientRep делает ее очень удобной для работы с оборудованием при пакетной обработке на GPU, что идеально подходит для обработки огромных объемов данных в задачах видеоаналитики.

Узнай больше о YOLOv6

Link to this sectionDAMO-YOLO: Быстрота и точность благодаря NAS#

Созданная Alibaba Group, модель DAMO-YOLO использует поиск нейронных архитектур (NAS) для автоматического обнаружения наиболее эффективных структур магистральных сетей для вывода в реальном времени.

  • Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen и др.
  • Организация: Alibaba Group
  • Дата: 23.11.2022
  • Arxiv: 2211.15444v2
  • GitHub: tinyvision/DAMO-YOLO

DAMO-YOLO выделяется своей сетью RepGFPN (перепараметризованная обобщенная пирамида признаков) для эффективного многомасштабного слияния признаков и дизайном ZeroHead, который значительно снижает вычислительные затраты в детектирующей головке. Она также включает в себя назначение меток AlignedOTA и надежные методы дистилляции знаний для повышения точности без увеличения количества параметров модели.

Узнай больше о DAMO-YOLO

Затраты на дистилляцию

Хотя DAMO-YOLO достигает отличной точности, ее сильная зависимость от дистилляции знаний во время обучения требует использования гораздо более крупной «учительской» модели. Это значительно увеличивает требования к памяти CUDA на этапе обучения по сравнению с более простыми архитектурами.

Link to this sectionСравнение производительности#

При оценке моделей обнаружения объектов баланс между средней точностью (mAP) и скоростью вывода имеет решающее значение. Ниже представлено подробное сравнение YOLOv6-3.0 и DAMO-YOLO для разных масштабов моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv6-3.0 демонстрирует исключительную скорость на GPU NVIDIA с использованием оптимизаций TensorRT, особенно в своих вариантах nano и small. Однако оптимизированные через NAS магистральные сети DAMO-YOLO, как правило, требуют меньше FLOPs при средних и больших масштабах, что дает небольшие преимущества в задержке для более крупных развертываний.

Link to this sectionПреимущество Ultralytics: знакомься с YOLO26#

Хотя YOLOv6-3.0 и DAMO-YOLO — мощные инструменты, разработчики часто сталкиваются с трудностями при работе со сложными конвейерами развертывания, высокими требованиями к памяти при обучении и жесткими однозадачными архитектурами. Экосистема Ultralytics обеспечивает гораздо более оптимизированный опыт для разработчика.

С выходом YOLO26, Ultralytics переопределили состояние современных технологий ИИ в сфере компьютерного зрения. Выпущенная в январе 2026 года, Ultralytics YOLO26 раздвигает границы эффективности и универсальности.

Link to this sectionКлючевые инновации в YOLO26#

  • Сквозной дизайн без NMS: Основываясь на концепциях, впервые представленных в YOLOv10, YOLO26 изначально исключает пост-обработку немаксимальным подавлением (NMS). Это резко снижает вариативность задержек и упрощает развертывание на пограничных устройствах через CoreML или TFLite.
  • Удаление DFL: Удалив распределенную фокальную потерю (Distribution Focal Loss), YOLO26 упрощает процесс экспорта и значительно улучшает совместимость с маломощными микроконтроллерами и пограничным оборудованием.
  • До 43% более быстрый вывод на CPU: Для приложений, лишенных выделенного GPU, оптимизации CPU в YOLO26 обеспечивают беспрецедентную скорость, превосходя модели, сильно зависящие от GPU, такие как YOLOv6.
  • Оптимизатор MuSGD: Вдохновленный методами обучения LLM, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon), чтобы гарантировать стабильное обучение и быструю сходимость.
  • ProgLoss + STAL: Усовершенствованные функции потерь значительно улучшают распознавание мелких объектов, делая YOLO26 идеальным решением для работы дронов и отслеживания удаленных целей.
  • Универсальность для нескольких задач: В отличие от DAMO-YOLO, которая является исключительно детектором, YOLO26 обеспечивает готовую поддержку сегментации экземпляров, оценки позы (через оценку остаточного логарифмического правдоподобия) и ориентированных ограничивающих рамок (OBB) в рамках одного унифицированного API.

Узнай больше о YOLO26

Обучение с эффективным использованием памяти

В отличие от сложных архитектур трансформеров, таких как RT-DETR, или конвейеров DAMO-YOLO, сильно зависящих от дистилляции, модели Ultralytics славятся своим низким потреблением VRAM. Ты можешь легко обучить модель YOLO26 на потребительском оборудовании.

Link to this sectionОптимизированный рабочий процесс на Python#

Обучение и развертывание передовых моделей не должно требовать сотен строк шаблонного кода. Пакет Ultralytics Python упрощает жизненный цикл машинного обучения.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

Link to this sectionИдеальные варианты использования#

Выбор правильной архитектуры полностью зависит от ограничений твоего развертывания:

Link to this sectionКогда использовать YOLOv6-3.0#

  • Видеоаналитика с большими пакетами: Отлично подходит для обработки плотных видеопотоков на серверах с GPU корпоративного класса, где можно полностью задействовать TensorRT.
  • Промышленная автоматизация: Высокоскоростные производственные линии, выполняющие обнаружение дефектов для контроля качества.

Link to this sectionКогда использовать DAMO-YOLO#

  • Кастомный кремний: Исследование отображения поиска нейронных архитектур для конкретного проприетарного оборудования NPU.
  • Академические исследования: Бенчмаркинг новых методов дистилляции знаний для сетей реального времени.

Link to this sectionКогда использовать Ultralytics YOLO26#

  • Пограничные и мобильные развертывания: Дизайн без NMS, удаление DFL и повышение скорости на CPU на 43% делают ее бесспорным чемпионом для интеграций с iOS, Android и Raspberry Pi.
  • От быстрого прототипирования к производству: Бесшовная интеграция с платформой Ultralytics позволяет командам пройти путь от аннотации датасета до глобального развертывания в облаке за дни, а не месяцы.
  • Сложные конвейеры зрения: Когда проект требует одновременного обнаружения ограничивающих рамок вместе с ключевыми точками человеческой позы и точными масками сегментации.

Link to this sectionЗаключение#

И YOLOv6-3.0, и DAMO-YOLO внесли значительный вклад в науку обнаружения объектов в реальном времени. YOLOv6 усовершенствовал максимизацию GPU, в то время как DAMO-YOLO продемонстрировала силу автоматизированного поиска архитектур.

Однако для разработчиков, ищущих идеальное сочетание точности, скорости вывода и простоты обслуживания экосистемы, семейство Ultralytics YOLO остается первоклассным выбором. Благодаря революционным оптимизациям, представленным в YOLO26, порог входа для создания приложений компьютерного зрения корпоративного уровня еще никогда не был таким низким.

Для дальнейшего изучения тебе также может быть интересно сравнить эти модели с другими архитектурами в нашей документации, такими как YOLO11 или подходы на основе трансформеров, такие как RT-DETR.

Авторы

Комментарии