YOLO11 против DAMO-YOLO: сравнение детекторов объектов нового поколения

Выбор оптимальной архитектуры — критически важный шаг в любом проекте по компьютерному зрению. В этом техническом руководстве представлено подробное сравнение двух мощных моделей детекции объектов: Ultralytics YOLO11 и DAMO-YOLO. Мы углубимся в их архитектурные инновации, парадигмы обучения и применимость в реальных условиях, чтобы помочь тебе выбрать лучший инструмент для твоих задач развертывания.

Обзор моделей

Ultralytics YOLO11

Модель YOLO11, разработанная командой Ultralytics, представляет собой значительно усовершенствованную итерацию семейства YOLO, в которой максимально оптимизированы как точность, так и эффективность. Она создана для исследователей и инженеров, которым нужна единая, готовая к производству экосистема, охватывающая всё: от управления наборами данных до развертывания на периферийных устройствах.

Узнай больше о YOLO11

YOLO11 впечатляет своей универсальностью. В то время как многие традиционные модели фокусируются исключительно на ограничивающих прямоугольниках (bbox), YOLO11 «из коробки» поддерживает детекцию объектов, сегментацию экземпляров, классификацию изображений и оценку позы. Эта мультимодальная функциональность позволяет разработчикам консолидировать свои пайплайны компьютерного зрения в рамках одной качественной и поддерживаемой платформы.

DAMO-YOLO

Модель DAMO-YOLO была разработана исследователями из Alibaba Group. Она использует поиск нейронных архитектур (NAS) для создания высокоэффективных бэкбонов, оптимизированных для инференса в реальном времени на GPU и других ускорителях.

Узнай больше о DAMO-YOLO

Основная концепция DAMO-YOLO строится вокруг реп-параметризации (rep-parameterization) и автоматизированного поиска. Используя MAE-NAS (Multi-Objective Evolutionary Neural Architecture Search), авторы спроектировали кастомный бэкбон, который значительно ускоряет инференс на специализированном оборудовании. В модель также интегрированы сильно оптимизированный «нек» под названием Efficient RepGFPN и упрощенная структура ZeroHead для минимизации задержек.

Другие модели, которые стоит рассмотреть

Сравнивая YOLO11 и DAMO-YOLO, обрати внимание на более новую модель Ultralytics YOLO26. Она внедряет нативный сквозной инференс без NMS и обеспечивает до 43% более высокую скорость работы на CPU. Ты также можешь ознакомиться со сравнениями YOLOX или YOLOv8.

Сравнение производительности и архитектуры

Понимание компромиссов в производительности критически важно при развертывании приложений периферийного ИИ. В таблице ниже приведены ключевые метрики, такие как средняя точность (mAP), задержка и вычислительная сложность.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Архитектурный разбор

YOLO11 опирается на высокоэффективный, специально разработанный бэкбон, который идеально балансирует между количеством параметров и репрезентативной мощностью. Модель оптимизирована для безупречной работы на различном оборудовании, демонстрируя отличные результаты при минимальном использовании памяти CUDA как во время обучения, так и при инференсе. Это делает ее превосходным выбором как для стандартного потребительского оборудования, так и для IoT-устройств с ограниченными ресурсами.

Напротив, бэкбоны DAMO-YOLO, созданные с помощью MAE-NAS, тонко настроены для высокопроизводительных GPU-сред. Ее Efficient RepGFPN (обобщенная пирамида признаков) агрессивно объединяет множество масштабов. Однако, хотя реп-параметризация ускоряет инференс, она может усложнить процесс развертывания, если твой стек оборудования не поддерживает эти операции должным образом.

Удобство использования и эффективность обучения

При оценке времени разработки удобство использования модели становится не менее важным фактором, чем ее «чистые» бенчмарки.

YOLO11 в значительной степени построена на принципе доступности для разработчиков. Полноценный пакет ultralytics берет на себя всю тяжелую работу по парсингу датасетов, аугментации и настройке гиперпараметров. Экспорт моделей в производственные форматы, такие как ONNX, TensorRT и OpenVINO, требует всего одной команды.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO, имея академическое и научно-исследовательское происхождение, обладает более крутой кривой обучения. Достижение максимальной точности часто требует сложных пайплайнов дистилляции знаний — это значит, что сначала нужно обучить массивную «учительскую» сеть, прежде чем передать знания меньшей «студенческой» сети. Это значительно увеличивает затраты на вычисления GPU и общую продолжительность обучения по сравнению с лаконичными циклами обучения моделей Ultralytics.

Варианты использования и рекомендации

Выбор между YOLO11 и DAMO-YOLO зависит от специфических требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать YOLO11

YOLO11 — это отличный выбор для:

  • Развертывания на периферии (Edge): коммерческих приложений на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих обнаружения, сегментации, оценки позы и OBB в рамках единого унифицированного фреймворка.
  • Быстрого прототипирования и развертывания: команд, которым необходимо быстро перейти от сбора данных к продакшену, используя оптимизированный Python API Ultralytics.

Когда выбирать DAMO-YOLO

DAMO-YOLO рекомендуется для:

  • Высокопроизводительной видеоаналитики: Обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при размере пакета 1 является основным показателем.
  • Линий промышленного производства: Сценариев со строгими ограничениями задержки GPU на специализированном оборудовании, таких как контроль качества в реальном времени на сборочных линиях.
  • Исследований в области поиска архитектуры нейронных сетей: Изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных основ на производительность обнаружения.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Реальные приложения и варианты использования

Автономные системы и дроны

Для анализа аэрофотоснимков и развертывания на БПЛА YOLO11 обеспечивает невероятно выгодный баланс производительности. Детекция мелких объектов — огромная проблема в аналитике дронов, но YOLO11 «из коробки» нативно справляется с различными масштабами. Кроме того, низкие требования к памяти позволяют вариантам YOLO11 Nano и Small работать напрямую на легких периферийных CPU или NPU, установленных на дроне.

Промышленная автоматизация и контроль качества

На «умных» фабриках задержка — это главное. Хотя DAMO-YOLO предлагает надежную скорость инференса на мощных серверных GPU благодаря своему «неку» RepGFPN, такая жесткая интеграция может быть избыточной. YOLO11 часто выступает как превосходная альтернатива для автоматизированного контроля качества благодаря простым API для трекинга и возможности беспрепятственного перехода от обычной детекции к задачам ориентированных ограничивающих прямоугольников (OBB), если дефекты требуют распознавания под углом.

Умное здравоохранение и медицинская визуализация

Medical imaging datasets are often relatively small, and avoiding overfitting is challenging. The active augmentation techniques, combined with standard transfer learning pipelines provided by the Well-Maintained Ecosystem of Ultralytics, help clinicians and developers deploy accurate tumor detection models reliably. The vast community support ensures that issues in complex domains like healthcare are quickly resolved.

Будущее вместе с YOLO26

Если ты создаешь новое приложение с нуля, рассмотри YOLO26. Выпущенная в начале 2026 года, она использует оптимизатор MuSGD и функции ProgLoss, обеспечивая исключительную точность на мелких объектах и предоставляя «из коробки» сквозной NMS-free (без подавления немаксимумов) пайплайн!

В конечном итоге, хотя DAMO-YOLO остается мощной демонстрацией возможностей поиска нейронных архитектур, YOLO11 и расширенное семейство Ultralytics остаются лучшей рекомендацией для реальных задач компьютерного зрения, отдавая приоритет быстрому развертыванию, простоте для разработчиков и первоклассной мультимодальной производительности.

Комментарии