Link to this sectionDAMO-YOLO против YOLOv8#
Ландшафт компьютерного зрения в реальном времени постоянно меняется, поскольку исследователи и инженеры расширяют границы скорости и точности. Двумя важными вехами на этом пути являются DAMO-YOLO и Ultralytics YOLOv8. Хотя обе модели нацелены на оптимизацию баланса между задержкой и средним значением точности (mAP), они используют принципиально разные архитектурные и философские подходы к решению задач обнаружения объектов.
Этот подробный технический разбор сравнит их базовые архитектуры, методологии обучения и практическое развертывание, чтобы помочь тебе выбрать подходящий инструмент для твоего следующего проекта в области искусственного интеллекта.
Link to this sectionИстория создания моделей и технические характеристики#
Понимание истоков этих моделей глубокого обучения дает ценный контекст касательно целей их разработки и экосистем развертывания.
Link to this sectionПодробности DAMO-YOLO#
Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
Организация: Alibaba Group
Дата: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: tinyvision/DAMO-YOLO
Link to this sectionПодробности об Ultralytics YOLOv8#
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: ultralytics/ultralytics
Документация: YOLOv8 Documentation
Link to this sectionАрхитектурные инновации#
Характеристики производительности обеих архитектур проистекают из их уникальных структурных решений.
Link to this sectionDAMO-YOLO: На основе архитектурного поиска#
DAMO-YOLO в значительной степени опирается на нейросетевой поиск архитектур (NAS) для автоматического обнаружения оптимальных структур сети. В ней представлена концепция под названием MAE-NAS, которая ищет каркасы, обеспечивающие высокую производительность при низкой задержке. Кроме того, она использует эффективную RepGFPN (перепараметризованную обобщенную пирамидальную сеть признаков) для улучшения слияния признаков в разных пространственных масштабах.
Для улучшения процесса обучения команда Alibaba внедрила дизайн ZeroHead и назначение меток AlignedOTA. Кроме того, они активно полагаются на сложный процесс дистилляции знаний, где тяжелая модель-учитель направляет легкую модель-ученика, добиваясь более высоких показателей точности на академических бенчмарках.
Link to this sectionYOLOv8: Оптимизированная и универсальная#
Ultralytics применила более ориентированный на разработчиков подход к YOLOv8. Модель перешла от дизайна на основе якорей, использовавшегося в YOLOv5, к архитектуре без якорей (anchor-free), что значительно сократило количество предсказаний ограничивающих рамок и ускорило вывод. Внедрение модуля C2f (Cross-Stage Partial Bottleneck с 2 свертками) улучшило поток градиентов и представление признаков, не добавив при этом избыточных вычислительных затрат.
В отличие от моделей, строго нацеленных на ограничивающие рамки, YOLOv8 была с самого начала спроектирована как мультимодальная. Единая кодовая база PyTorch нативно поддерживает сегментацию экземпляров, оценку позы и классификацию изображений, избавляя инженеров от необходимости объединять разрозненные репозитории.
Модели Ultralytics требуют меньше памяти во время обучения по сравнению с тяжелыми архитектурами на базе Transformer, что позволяет достигать передовых результатов на стандартных потребительских GPU.
Link to this sectionСравнение производительности#
При сравнении «сырых» метрик крайне важно анализировать, как теоретические возможности воплощаются в аппаратную производительность. В таблице ниже показаны компромиссы между размерами моделей.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Хотя DAMO-YOLO демонстрирует отличные соотношения параметров к точности благодаря методам дистилляции, YOLOv8 предлагает более широкий диапазон размеров моделей (от Nano до Extra-large). Модель YOLOv8 Nano представляет собой мастер-класс по оптимизации для Edge-устройств, потребляя меньше ресурсов и обеспечивая при этом высокую точность.
Link to this sectionЭкосистема и опыт разработчика#
Настоящим различием между академическими статьями и готовыми к производству системами является экосистема.
Зависимость DAMO-YOLO от сложных конвейеров дистилляции знаний может сделать кастомное обучение затруднительным. Создание модели-учителя, передача знаний и настройка каркасов на основе NAS требуют большого объема памяти CUDA и продвинутой конфигурации, что часто замедляет работу гибких инженерных команд.
Напротив, экосистема Ultralytics делает ставку на простоту использования. Через платформу Ultralytics разработчики получают доступ к простым API, исчерпывающей документации и надежным интеграциям для отслеживания экспериментов. Единый фреймворк Python делает создание сложных конвейеров тривиальной задачей.
from ultralytics import YOLO
# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")Этот оптимизированный рабочий процесс в сочетании с бесшовным экспортом в OpenVINO и TensorRT обеспечивает легкий путь от локального прототипирования до развертывания в облаке или на Edge-устройствах.
Link to this sectionРеальные применения и идеальные сценарии использования#
Выбор между этими архитектурами часто сводится к операционным ограничениям твоей среды.
Link to this sectionГде подходит DAMO-YOLO#
DAMO-YOLO — отличный выбор для академических сред, изучающих нейросетевой поиск архитектур, или исследователей, пытающихся воспроизвести сложные стратегии перепараметризации. Она также может превосходно работать в строго контролируемых промышленных приложениях, таких как высокоскоростное обнаружение дефектов на производственных линиях, при условии, что у команды есть вычислительные ресурсы для выполнения ее многоэтапного обучения.
Link to this sectionПочему Ultralytics лидирует в производстве#
Для подавляющего большинства коммерческих проектов модели Ultralytics обеспечивают лучший баланс производительности.
- Умная розница: использование мультизадачных возможностей YOLOv8 как для обнаружения ограничивающих рамок при учете товаров, так и для оценки позы при анализе поведения покупателей.
- Сельское хозяйство: применение сегментации экземпляров для точного определения границ растений и сорняков в режиме реального времени при работе тракторной техники.
- Аэрофотосъемка: использование ориентированных ограничивающих рамок (OBB) для точного отслеживания повернутых автомобилей и судов с дронов или спутников.
Link to this sectionИнвестиции в будущее: YOLO26#
Хотя YOLOv8 остается фундаментальной моделью, область продолжает развиваться. Для всех новых разработок YOLO26 является рекомендуемым стандартом. Выпущенная в январе 2026 года, она представляет собой колоссальный скачок в линейке Ultralytics.
YOLO26 открывает путь к нативному end-to-end дизайну без NMS, полностью устраняя традиционное узкое место в виде подавления немаксимумов (Non-Maximum Suppression). Этот структурный прорыв обеспечивает до 43% более быстрый вывод на CPU, что делает ее абсолютным лидером для периферийных вычислений и IoT-оборудования.
Кроме того, в YOLO26 представлен оптимизатор MuSGD, гибрид, вдохновленный методами обучения больших языковых моделей (LLM), который гарантирует более быструю сходимость и высокую стабильность циклов обучения. В сочетании с новыми алгоритмами ProgLoss + STAL, YOLO26 демонстрирует значительные улучшения в распознавании мелких объектов, гарантируя, что твои внедрения будут не только быстрыми, но и бескомпромиссно точными.