Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO против YOLO11: всестороннее техническое сравнение#

При выборе архитектуры для детекции объектов в реальном времени для твоего следующего проекта по компьютерному зрению критически важно понимать нюансы между ведущими моделями. Это подробное руководство содержит глубокий технический анализ, сравнивающий DAMO-YOLO и Ultralytics YOLO11, исследуя их архитектуры, метрики производительности, методологии обучения и идеальные сценарии развертывания в реальных условиях.

Детали DAMO-YOLO: Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun Организация: Alibaba Group Дата: 2022-11-23 Arxiv: 2211.15444v2 GitHub: tinyvision/DAMO-YOLO Документация: Документация DAMO-YOLO

Детали YOLO11: Авторы: Glenn Jocher и Jing Qiu Организация: Ultralytics Дата: 2024-09-27 GitHub: ultralytics/ultralytics Документация: Документация YOLO11

Link to this sectionФилософия архитектурного проектирования#

Базовая архитектура модели детекции объектов определяет скорость её вывода, точность и адаптируемость к различным аппаратным средам.

DAMO-YOLO внедряет ряд академических инноваций, в значительной степени полагаясь на Neural Architecture Search (NAS) для автоматического проектирования своего бэкенда. Модель использует эффективную RepGFPN (Reparameterized Generalized Feature Pyramid Network) для улучшения объединения признаков и дизайн ZeroHead, который значительно уменьшает массивную «голову» предсказания, часто встречавшуюся в предыдущих архитектурах. Хотя этот подход на основе NAS позволяет DAMO-YOLO достигать определенных показателей эффективности на выбранных GPU, полученные архитектуры иногда лишены гибкости, необходимой для бесшовной работы на разнообразных периферийных устройствах.

Напротив, YOLO11 опирается на многолетние фундаментальные исследования, чтобы предоставить высокооптимизированную архитектуру, созданную вручную. Она фокусируется на обтекаемом бэкенде и высокоэффективной «шейной» части (neck), что сокращает избыточные вычисления. Одним из главных преимуществ YOLO11 является её улучшенная параметрическая эффективность; она достигает высокого представления признаков без тяжелых требований к VRAM, типичных для моделей на базе Transformer, таких как RT-DETR. Это делает YOLO11 исключительно универсальной, позволяя ей плавно работать на потребительских GPU, мобильных устройствах и специализированных периферийных ускорителях.

Link to this sectionПроизводительность и метрики#

Оценка производительности требует смотреть дальше базовой точности, учитывая баланс между скоростью, размером модели и вычислительной нагрузкой (FLOPs).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Как показывает таблица, YOLO11 достигает весьма выгодного баланса производительности. Вариант YOLO11s, например, превосходит DAMO-YOLOs по точности, сохраняя при этом значительно меньший объем параметров. Такое снижение требований к памяти напрямую конвертируется в меньшие затраты на развертывание и более гибкую производительность на периферийных устройствах.

Узнай больше о YOLO11

Link to this sectionМетодики обучения и удобство использования#

Конвейер обучения — это то, где разработчики проводят большую часть своего времени, поэтому эффективность обучения является первостепенной задачей.

DAMO-YOLO использует многоэтапный процесс обучения, сильно зависящий от дистилляции знаний. Он использует AlignedOTA (Optimal Transport Assignment) для назначения меток и часто требует обучения более крупной модели-«учителя» для дистилляции знаний в более компактные модели-«ученики». Эта методология радикально увеличивает потребление CUDA памяти и общее время вычислений, необходимое для достижения оптимальной сходимости.

Напротив, экосистема Ultralytics абстрагирует сложность обучения моделей. YOLO11 разработана для исключительной простоты использования, отличаясь обтекаемым Python API и всесторонними CLI интерфейсами, которые позволяют инженерам начинать обучение на пользовательских наборах данных одной командой. Конвейер обучения по своей сути является ресурсоэффективным, минимизируя скачки памяти, чтобы даже более крупные модели можно было обучать на стандартном оборудовании.

Оптимизированное обучение с Ultralytics

Обучение модели Ultralytics не требует написания шаблонного кода. Встроенные конвейеры для загрузки данных, аугментации и вычисления функции потерь полностью оптимизированы «из коробки».

Вот краткий пример того, как просто обучить и развернуть модель Ultralytics:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")

Узнай больше о YOLO11

Link to this sectionПрименение в реальных условиях и универсальность#

Выбор между этими архитектурами часто зависит от широты задач, требуемых твоей средой развертывания.

Link to this sectionГде подходит DAMO-YOLO#

DAMO-YOLO — это строго фреймворк для детекции объектов. Он превосходен в академических исследовательских средах, где команды изучают репараметризацию или воспроизводят специфические эксперименты Neural Architecture Search. Он также может быть развернут в жестко ограниченных промышленных средах, где очень специфический GPU-ускоритель идеально соответствует бэкенду, сгенерированному NAS.

Link to this sectionПреимущество Ultralytics#

Модели Ultralytics, включая YOLO11, сияют в реальных коммерческих приложениях благодаря своей непревзойденной универсальности и хорошо поддерживаемой экосистеме. В отличие от DAMO-YOLO, фреймворк Ultralytics нативно поддерживает мультимодальные задачи. От сегментации экземпляров в медицинской визуализации до оценки позы для биомеханического анализа в спорте — одна единая кодовая база справляется со всем.

Отрасли, использующие YOLO11, включают:

  • Умное сельское хозяйство: использование детекции объектов для мониторинга здоровья сельскохозяйственных культур и автоматизации уборочной техники.
  • Аналитика ритейла: внедрение умного видеонаблюдения для анализа трафика покупателей и автоматизации управления запасами.
  • Логистика и цепи поставок: высокоскоростная детекция штрих-кодов и посылок с использованием Oriented Bounding Boxes (OBB) на быстро движущихся конвейерных лентах.

Link to this sectionСценарии использования и рекомендации#

Выбор между DAMO-YOLO и YOLO11 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в отношении экосистемы.

Link to this sectionКогда выбирать DAMO-YOLO#

DAMO-YOLO — сильный выбор для:

  • Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
  • Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
  • Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.

Link to this sectionКогда выбирать YOLO11#

YOLO11 рекомендуется для:

  • Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
  • Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionСледующее поколение: представляем YOLO26#

Хотя YOLO11 остается мощным и надежным выбором, область компьютерного зрения движется быстро. Для разработчиков, начинающих новые проекты, новейшая модель YOLO26 представляет собой новый уровень современного состояния технологий (state-of-the-art).

Выпущенная в январе 2026 года, YOLO26 представляет несколько революционных достижений:

  • Сквозной дизайн без NMS: исключая постобработку Non-Maximum Suppression, YOLO26 обеспечивает более быстрое, детерминированное время вывода и драматически упрощает конвейеры развертывания.
  • До 43% быстрее на CPU: благодаря удалению Distribution Focal Loss (DFL), модель исключительно хорошо подходит для периферийных и маломощных устройств, лишенных выделенных GPU.
  • Оптимизатор MuSGD: интегрируя инновации обучения LLM (вдохновленные Moonshot AI), этот гибридный оптимизатор обеспечивает стабильную и быструю сходимость во время обучения.
  • Продвинутые функции потерь: используя ProgLoss + STAL, YOLO26 демонстрирует заметные улучшения в распознавании мелких объектов, что критично для аэрофотосъемки и робототехники.

Узнай больше о YOLO26

Link to this sectionЗаключение#

И DAMO-YOLO, и YOLO11 внесли значительный вклад в развитие быстрого и точного компьютерного зрения. В то время как DAMO-YOLO предлагает интересные академические инсайты в поиск архитектуры и дистилляцию, Ultralytics YOLO11 (и революционная YOLO26) предоставляют превосходный опыт для разработчика.

Благодаря более низким требованиям к памяти, обширной документации, мультизадачным возможностям и интеграции с мощной Ultralytics Platform, модели Ultralytics остаются главной рекомендацией для исследователей и корпоративных инженеров, стремящихся создавать надежные и масштабируемые AI-решения. Для тех, кто изучает другие продвинутые архитектуры, сравнение YOLO26 vs RT-DETR предлагает дополнительные инсайты в альтернативы на базе трансформеров.

Контрибьюторы

Комментарии