Link to this sectionYOLOv6-3.0 против DAMO-YOLO: техническое противостояние в реальном времени в обнаружении объектов#
Ландшафт компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы того, что возможно в обнаружении объектов в реальном времени. Два заметных претендента в этой области — YOLOv6-3.0 и DAMO-YOLO. Обе модели внедряют уникальные архитектурные инновации, разработанные для достижения максимальной производительности на промышленном оборудовании. Это руководство представляет собой исчерпывающее техническое сравнение этих двух моделей, исследуя их архитектуры, методологии обучения и идеальные сценарии использования, а также представляя преимущества следующего поколения моделей Ultralytics, таких как YOLO26.
Link to this sectionПрофили моделей#
Link to this sectionYOLOv6-3.0: Промышленная пропускная способность#
Разработанная отделом Vision AI в Meituan, модель YOLOv6-3.0 создана специально для высокопроизводительных промышленных приложений. Она делает основной упор на достижение максимальной производительности на аппаратных ускорителях, таких как GPU NVIDIA.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
- Документация: Документация Ultralytics YOLOv6
YOLOv6-3.0 внедряет модуль двунаправленной конкатенации (BiC) для улучшения слияния признаков и использует стратегию обучения с помощью якорей (AAT). Эта стратегия объединяет преимущества детекторов на основе якорей и безякорных детекторов во время обучения, при этом сохраняя процесс вывода строго без якорей. Ее магистральная сеть EfficientRep делает ее очень удобной для работы с оборудованием при пакетной обработке на GPU, что идеально подходит для обработки огромных объемов данных в задачах видеоаналитики.
Link to this sectionDAMO-YOLO: Быстрота и точность благодаря NAS#
Созданная Alibaba Group, модель DAMO-YOLO использует поиск нейронных архитектур (NAS) для автоматического обнаружения наиболее эффективных структур магистральных сетей для вывода в реальном времени.
- Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen и др.
- Организация: Alibaba Group
- Дата: 23.11.2022
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
DAMO-YOLO выделяется своей сетью RepGFPN (перепараметризованная обобщенная пирамида признаков) для эффективного многомасштабного слияния признаков и дизайном ZeroHead, который значительно снижает вычислительные затраты в детектирующей головке. Она также включает в себя назначение меток AlignedOTA и надежные методы дистилляции знаний для повышения точности без увеличения количества параметров модели.
Хотя DAMO-YOLO достигает отличной точности, ее сильная зависимость от дистилляции знаний во время обучения требует использования гораздо более крупной «учительской» модели. Это значительно увеличивает требования к памяти CUDA на этапе обучения по сравнению с более простыми архитектурами.
Link to this sectionСравнение производительности#
При оценке моделей обнаружения объектов баланс между средней точностью (mAP) и скоростью вывода имеет решающее значение. Ниже представлено подробное сравнение YOLOv6-3.0 и DAMO-YOLO для разных масштабов моделей.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv6-3.0 демонстрирует исключительную скорость на GPU NVIDIA с использованием оптимизаций TensorRT, особенно в своих вариантах nano и small. Однако оптимизированные через NAS магистральные сети DAMO-YOLO, как правило, требуют меньше FLOPs при средних и больших масштабах, что дает небольшие преимущества в задержке для более крупных развертываний.
Link to this sectionПреимущество Ultralytics: знакомься с YOLO26#
Хотя YOLOv6-3.0 и DAMO-YOLO — мощные инструменты, разработчики часто сталкиваются с трудностями при работе со сложными конвейерами развертывания, высокими требованиями к памяти при обучении и жесткими однозадачными архитектурами. Экосистема Ultralytics обеспечивает гораздо более оптимизированный опыт для разработчика.
С выходом YOLO26, Ultralytics переопределили состояние современных технологий ИИ в сфере компьютерного зрения. Выпущенная в январе 2026 года, Ultralytics YOLO26 раздвигает границы эффективности и универсальности.
Link to this sectionКлючевые инновации в YOLO26#
- Сквозной дизайн без NMS: Основываясь на концепциях, впервые представленных в YOLOv10, YOLO26 изначально исключает пост-обработку немаксимальным подавлением (NMS). Это резко снижает вариативность задержек и упрощает развертывание на пограничных устройствах через CoreML или TFLite.
- Удаление DFL: Удалив распределенную фокальную потерю (Distribution Focal Loss), YOLO26 упрощает процесс экспорта и значительно улучшает совместимость с маломощными микроконтроллерами и пограничным оборудованием.
- До 43% более быстрый вывод на CPU: Для приложений, лишенных выделенного GPU, оптимизации CPU в YOLO26 обеспечивают беспрецедентную скорость, превосходя модели, сильно зависящие от GPU, такие как YOLOv6.
- Оптимизатор MuSGD: Вдохновленный методами обучения LLM, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon), чтобы гарантировать стабильное обучение и быструю сходимость.
- ProgLoss + STAL: Усовершенствованные функции потерь значительно улучшают распознавание мелких объектов, делая YOLO26 идеальным решением для работы дронов и отслеживания удаленных целей.
- Универсальность для нескольких задач: В отличие от DAMO-YOLO, которая является исключительно детектором, YOLO26 обеспечивает готовую поддержку сегментации экземпляров, оценки позы (через оценку остаточного логарифмического правдоподобия) и ориентированных ограничивающих рамок (OBB) в рамках одного унифицированного API.
В отличие от сложных архитектур трансформеров, таких как RT-DETR, или конвейеров DAMO-YOLO, сильно зависящих от дистилляции, модели Ultralytics славятся своим низким потреблением VRAM. Ты можешь легко обучить модель YOLO26 на потребительском оборудовании.
Link to this sectionОптимизированный рабочий процесс на Python#
Обучение и развертывание передовых моделей не должно требовать сотен строк шаблонного кода. Пакет Ultralytics Python упрощает жизненный цикл машинного обучения.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")Link to this sectionИдеальные варианты использования#
Выбор правильной архитектуры полностью зависит от ограничений твоего развертывания:
Link to this sectionКогда использовать YOLOv6-3.0#
- Видеоаналитика с большими пакетами: Отлично подходит для обработки плотных видеопотоков на серверах с GPU корпоративного класса, где можно полностью задействовать TensorRT.
- Промышленная автоматизация: Высокоскоростные производственные линии, выполняющие обнаружение дефектов для контроля качества.
Link to this sectionКогда использовать DAMO-YOLO#
- Кастомный кремний: Исследование отображения поиска нейронных архитектур для конкретного проприетарного оборудования NPU.
- Академические исследования: Бенчмаркинг новых методов дистилляции знаний для сетей реального времени.
Link to this sectionКогда использовать Ultralytics YOLO26#
- Пограничные и мобильные развертывания: Дизайн без NMS, удаление DFL и повышение скорости на CPU на 43% делают ее бесспорным чемпионом для интеграций с iOS, Android и Raspberry Pi.
- От быстрого прототипирования к производству: Бесшовная интеграция с платформой Ultralytics позволяет командам пройти путь от аннотации датасета до глобального развертывания в облаке за дни, а не месяцы.
- Сложные конвейеры зрения: Когда проект требует одновременного обнаружения ограничивающих рамок вместе с ключевыми точками человеческой позы и точными масками сегментации.
Link to this sectionЗаключение#
И YOLOv6-3.0, и DAMO-YOLO внесли значительный вклад в науку обнаружения объектов в реальном времени. YOLOv6 усовершенствовал максимизацию GPU, в то время как DAMO-YOLO продемонстрировала силу автоматизированного поиска архитектур.
Однако для разработчиков, ищущих идеальное сочетание точности, скорости вывода и простоты обслуживания экосистемы, семейство Ultralytics YOLO остается первоклассным выбором. Благодаря революционным оптимизациям, представленным в YOLO26, порог входа для создания приложений компьютерного зрения корпоративного уровня еще никогда не был таким низким.
Для дальнейшего изучения тебе также может быть интересно сравнить эти модели с другими архитектурами в нашей документации, такими как YOLO11 или подходы на основе трансформеров, такие как RT-DETR.