Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO против YOLOv8#

Ландшафт компьютерного зрения в реальном времени постоянно меняется, поскольку исследователи и инженеры расширяют границы скорости и точности. Двумя важными вехами на этом пути являются DAMO-YOLO и Ultralytics YOLOv8. Хотя обе модели нацелены на оптимизацию баланса между задержкой и средним значением точности (mAP), они используют принципиально разные архитектурные и философские подходы к решению задач обнаружения объектов.

Этот подробный технический разбор сравнит их базовые архитектуры, методологии обучения и практическое развертывание, чтобы помочь тебе выбрать подходящий инструмент для твоего следующего проекта в области искусственного интеллекта.

Link to this sectionИстория создания моделей и технические характеристики#

Понимание истоков этих моделей глубокого обучения дает ценный контекст касательно целей их разработки и экосистем развертывания.

Link to this sectionПодробности DAMO-YOLO#

Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
Организация: Alibaba Group
Дата: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Узнай больше о DAMO-YOLO

Link to this sectionПодробности об Ultralytics YOLOv8#

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: ultralytics/ultralytics
Документация: YOLOv8 Documentation

Узнай больше о YOLOv8

Link to this sectionАрхитектурные инновации#

Характеристики производительности обеих архитектур проистекают из их уникальных структурных решений.

Link to this sectionDAMO-YOLO: На основе архитектурного поиска#

DAMO-YOLO в значительной степени опирается на нейросетевой поиск архитектур (NAS) для автоматического обнаружения оптимальных структур сети. В ней представлена концепция под названием MAE-NAS, которая ищет каркасы, обеспечивающие высокую производительность при низкой задержке. Кроме того, она использует эффективную RepGFPN (перепараметризованную обобщенную пирамидальную сеть признаков) для улучшения слияния признаков в разных пространственных масштабах.

Для улучшения процесса обучения команда Alibaba внедрила дизайн ZeroHead и назначение меток AlignedOTA. Кроме того, они активно полагаются на сложный процесс дистилляции знаний, где тяжелая модель-учитель направляет легкую модель-ученика, добиваясь более высоких показателей точности на академических бенчмарках.

Link to this sectionYOLOv8: Оптимизированная и универсальная#

Ultralytics применила более ориентированный на разработчиков подход к YOLOv8. Модель перешла от дизайна на основе якорей, использовавшегося в YOLOv5, к архитектуре без якорей (anchor-free), что значительно сократило количество предсказаний ограничивающих рамок и ускорило вывод. Внедрение модуля C2f (Cross-Stage Partial Bottleneck с 2 свертками) улучшило поток градиентов и представление признаков, не добавив при этом избыточных вычислительных затрат.

В отличие от моделей, строго нацеленных на ограничивающие рамки, YOLOv8 была с самого начала спроектирована как мультимодальная. Единая кодовая база PyTorch нативно поддерживает сегментацию экземпляров, оценку позы и классификацию изображений, избавляя инженеров от необходимости объединять разрозненные репозитории.

Эффективное обучение

Модели Ultralytics требуют меньше памяти во время обучения по сравнению с тяжелыми архитектурами на базе Transformer, что позволяет достигать передовых результатов на стандартных потребительских GPU.

Link to this sectionСравнение производительности#

При сравнении «сырых» метрик крайне важно анализировать, как теоретические возможности воплощаются в аппаратную производительность. В таблице ниже показаны компромиссы между размерами моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Хотя DAMO-YOLO демонстрирует отличные соотношения параметров к точности благодаря методам дистилляции, YOLOv8 предлагает более широкий диапазон размеров моделей (от Nano до Extra-large). Модель YOLOv8 Nano представляет собой мастер-класс по оптимизации для Edge-устройств, потребляя меньше ресурсов и обеспечивая при этом высокую точность.

Link to this sectionЭкосистема и опыт разработчика#

Настоящим различием между академическими статьями и готовыми к производству системами является экосистема.

Зависимость DAMO-YOLO от сложных конвейеров дистилляции знаний может сделать кастомное обучение затруднительным. Создание модели-учителя, передача знаний и настройка каркасов на основе NAS требуют большого объема памяти CUDA и продвинутой конфигурации, что часто замедляет работу гибких инженерных команд.

Напротив, экосистема Ultralytics делает ставку на простоту использования. Через платформу Ultralytics разработчики получают доступ к простым API, исчерпывающей документации и надежным интеграциям для отслеживания экспериментов. Единый фреймворк Python делает создание сложных конвейеров тривиальной задачей.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Этот оптимизированный рабочий процесс в сочетании с бесшовным экспортом в OpenVINO и TensorRT обеспечивает легкий путь от локального прототипирования до развертывания в облаке или на Edge-устройствах.

Link to this sectionРеальные применения и идеальные сценарии использования#

Выбор между этими архитектурами часто сводится к операционным ограничениям твоей среды.

Link to this sectionГде подходит DAMO-YOLO#

DAMO-YOLO — отличный выбор для академических сред, изучающих нейросетевой поиск архитектур, или исследователей, пытающихся воспроизвести сложные стратегии перепараметризации. Она также может превосходно работать в строго контролируемых промышленных приложениях, таких как высокоскоростное обнаружение дефектов на производственных линиях, при условии, что у команды есть вычислительные ресурсы для выполнения ее многоэтапного обучения.

Link to this sectionПочему Ultralytics лидирует в производстве#

Для подавляющего большинства коммерческих проектов модели Ultralytics обеспечивают лучший баланс производительности.

  • Умная розница: использование мультизадачных возможностей YOLOv8 как для обнаружения ограничивающих рамок при учете товаров, так и для оценки позы при анализе поведения покупателей.
  • Сельское хозяйство: применение сегментации экземпляров для точного определения границ растений и сорняков в режиме реального времени при работе тракторной техники.
  • Аэрофотосъемка: использование ориентированных ограничивающих рамок (OBB) для точного отслеживания повернутых автомобилей и судов с дронов или спутников.
Другие примечательные модели

Если ты исследуешь более широкий ландшафт, тебе может быть интересно сравнить YOLOv10 или YOLO11, которые привносят дальнейшие достижения в обнаружение без якорей.

Link to this sectionИнвестиции в будущее: YOLO26#

Хотя YOLOv8 остается фундаментальной моделью, область продолжает развиваться. Для всех новых разработок YOLO26 является рекомендуемым стандартом. Выпущенная в январе 2026 года, она представляет собой колоссальный скачок в линейке Ultralytics.

YOLO26 открывает путь к нативному end-to-end дизайну без NMS, полностью устраняя традиционное узкое место в виде подавления немаксимумов (Non-Maximum Suppression). Этот структурный прорыв обеспечивает до 43% более быстрый вывод на CPU, что делает ее абсолютным лидером для периферийных вычислений и IoT-оборудования.

Кроме того, в YOLO26 представлен оптимизатор MuSGD, гибрид, вдохновленный методами обучения больших языковых моделей (LLM), который гарантирует более быструю сходимость и высокую стабильность циклов обучения. В сочетании с новыми алгоритмами ProgLoss + STAL, YOLO26 демонстрирует значительные улучшения в распознавании мелких объектов, гарантируя, что твои внедрения будут не только быстрыми, но и бескомпромиссно точными.

Узнай больше о YOLO26

Комментарии