Перейти к содержанию

YOLO11 vs. DAMO-YOLO: Сравнение детекторов объектов следующего поколения

Выбор оптимальной архитектуры является критически важным шагом в любом проекте компьютерного зрения. Это техническое руководство предоставляет всестороннее сравнение двух мощных моделей обнаружения объектов: Ultralytics YOLO11 и DAMO-YOLO. Мы углубимся в их архитектурные инновации, парадигмы обучения и применимость в реальном мире, чтобы помочь вам выбрать лучший инструмент для ваших потребностей развертывания.

Обзоры моделей

Ultralytics YOLO11

Разработанный командой Ultralytics, YOLO11 представляет собой высокоразвитую итерацию в семействе YOLO, значительно оптимизирующую как точность, так и эффективность. Он разработан для исследователей и инженеров, ищущих унифицированную, готовую к производству экосистему, охватывающую всё от управления наборами данных до развёртывания на периферийных устройствах.

Узнайте больше о YOLO11

YOLO11 выделяется своей универсальностью. В то время как многие традиционные модели фокусируются исключительно на ограничивающих рамках, YOLO11 нативно поддерживает обнаружение объектов, сегментацию экземпляров, классификацию изображений и оценку позы. Эта мультимодальная возможность позволяет разработчикам консолидировать свои конвейеры компьютерного зрения на основе ИИ под единым, хорошо поддерживаемым фреймворком.

DAMO-YOLO

DAMO-YOLO был разработан исследователями из Alibaba Group. Он использует поиск нейронной архитектуры (NAS) для обнаружения высокоэффективных основных сетей, адаптированных для вывода в реальном времени на GPU и других ускорителях.

Узнайте больше о DAMO-YOLO

Основная философия DAMO-YOLO вращается вокруг перепараметризации и автоматизированного поиска. Используя MAE-NAS (многоцелевой эволюционный поиск нейронной архитектуры), авторы разработали пользовательскую базовую сеть, которая значительно увеличивает скорость инференса на специализированном оборудовании. Она также включает сильно оптимизированную шейку под названием Efficient RepGFPN и упрощенную структуру ZeroHead для минимизации задержки.

Другие модели для рассмотрения

При сравнении YOLO11 и DAMO-YOLO рекомендуется обратить внимание на более новую Ultralytics YOLO26. Она предлагает нативную сквозную инференцию без NMS и обеспечивает до 43% более высокую скорость на CPU. Также можно изучить сравнения с участием YOLOX или YOLOv8.

Сравнение производительности и архитектуры

Понимание компромиссов в производительности критически важно при развертывании граничных ИИ-приложений. В таблице ниже представлены ключевые метрики, такие как средняя точность (mAP), задержка и вычислительный размер.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Архитектурное Глубокое Погружение

YOLO11 опирается на высокоэффективный, специально разработанный backbone, который идеально балансирует количество параметров и репрезентативную способность. Он оптимизирован для безупречной работы на различных аппаратных платформах, изначально превосходящий с минимальным использованием памяти CUDA как во время обучения, так и во время инференса. Это делает его отличным вариантом для стандартного потребительского оборудования или IoT-устройств с ограниченными ресурсами.

Напротив, бэкбоны, сгенерированные MAE-NAS для DAMO-YOLO, тонко настроены для высокопроизводительных сред с GPU. Его Efficient RepGFPN (обобщенная пирамида признаков) агрессивно интегрирует несколько масштабов. Однако, хотя репараметризация ускоряет инференс, она может усложнить процесс развертывания, если ваш аппаратный стек не поддерживает эти операции должным образом.

Удобство использования и эффективность обучения

При учете времени разработки простота использования модели становится столь же важной, как и ее исходные показатели.

YOLO11 основан на принципе доступности для разработчиков. Комплексная ultralytics пакет абстрагирует трудоемкие задачи парсинга наборов данных, аугментации и настройки гиперпараметров. Экспорт моделей в производственные форматы, такие как ONNX, TensorRTи OpenVINO требует всего одной команды.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO, имеющий академическое и научно-исследовательское происхождение, представляет собой более крутую кривую обучения. Достижение его пиковой точности часто включает сложные конвейеры дистилляции знаний — это означает, что сначала необходимо обучить масштабную сеть-«учителя», прежде чем передавать эти знания меньшей сети-«ученику». Это значительно увеличивает требуемые накладные расходы на вычисления GPU и общую продолжительность обучения по сравнению с оптимизированными циклами обучения моделей Ultralytics.

Сценарии использования и рекомендации

Выбор между YOLO11 и DAMO-YOLO зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать YOLO11

YOLO11 — отличный выбор для:

  • Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
  • Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
  • Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.

Когда следует выбирать DAMO-YOLO

DAMO-YOLO рекомендуется для:

  • Высокопроизводительная видеоаналитика: Обработка видеопотоков с высокой частотой кадров на стационарной инфраструктуре NVIDIA GPU, где пропускная способность при размере пакета 1 является основным показателем.
  • Промышленные производственные линии: Сценарии со строгими ограничениями по задержке GPU на специализированном оборудовании, например, контроль качества в реальном времени на сборочных линиях.
  • Исследования нейронного поиска архитектуры: Изучение влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкбонов на производительность detect.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Реальные приложения и варианты использования

Автономные системы и дроны

Для аэрофотосъемки и развертываний БПЛА YOLO11 обеспечивает невероятно благоприятный баланс производительности. Обнаружение мелких объектов является серьезным препятствием в аналитике дронов, но YOLO11 нативно обрабатывает различные масштабы «из коробки». Кроме того, низкие требования к памяти позволяют вариантам YOLO11 Nano и Small работать непосредственно на легких периферийных CPU или NPU, установленных на дроне.

Промышленная автоматизация и контроль качества

На умных фабриках задержка имеет первостепенное значение. Хотя DAMO-YOLO обеспечивает высокую скорость инференса на мощных серверных GPU благодаря своей RepGFPN-шейке, жесткая интеграция может быть избыточной. YOLO11 часто выступает в качестве превосходной альтернативы для автоматизированного контроля качества благодаря своим простым tracking API и способности легко переключаться от чистого detect к задачам oriented bounding box (OBB), если дефекты требуют распознавания границ под углом.

Интеллектуальное здравоохранение и медицинская визуализация

Наборы данных медицинской визуализации часто относительно невелики, и избежать переобучения сложно. Методы активной аугментации в сочетании со стандартными конвейерами трансферного обучения, предоставляемыми хорошо поддерживаемой экосистемой Ultralytics, помогают клиницистам и разработчикам надежно развертывать точные модели обнаружения опухолей. Обширная поддержка сообщества гарантирует быстрое решение проблем в таких сложных областях, как здравоохранение.

Встречая будущее с YOLO26

Если вы создаёте новое приложение с нуля, рассмотрите возможность изучения YOLO26. Выпущенный в начале 2026 года, он использует оптимизатор MuSGD и функции ProgLoss, обеспечивая исключительную точность на мелких объектах и предоставляя сквозной NMS-free конвейер "из коробки"!

В конечном итоге, хотя DAMO-YOLO остается мощной демонстрацией поиска нейронной архитектуры, YOLO11 и расширенное семейство Ultralytics остаются окончательной рекомендацией для реальных задач компьютерного зрения, приоритизируя быстрое развертывание, удобство для разработчиков и первоклассную мультимодальную производительность.


Комментарии