Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против DAMO-YOLO#

Выбор оптимальной архитектуры — критический шаг в любом проекте computer vision. В этом техническом руководстве представлено подробное сравнение двух мощных моделей для обнаружения объектов: Ultralytics YOLO11 и DAMO-YOLO. Мы углубимся в их архитектурные инновации, парадигмы обучения и применимость в реальных условиях, чтобы помочь тебе подобрать лучший инструмент для твоих задач по развертыванию.

Link to this sectionОбзор моделей#

Link to this sectionUltralytics YOLO11#

Разработанная командой Ultralytics, YOLO11 представляет собой высокоэффективную итерацию в семействе YOLO, значительно оптимизированную как по точности, так и по производительности. Она создана для исследователей и инженеров, которым нужна единая, готовая к промышленному использованию экосистема, охватывающая всё — от управления наборами данных до развертывания на граничных устройствах.

Узнай больше о YOLO11

YOLO11 отличается своей универсальностью. В то время как многие традиционные модели фокусируются только на ограничивающих рамках (bounding boxes), YOLO11 нативно поддерживает object detection, instance segmentation, image classification и pose estimation. Эта мультимодальная функциональность позволяет разработчикам консолидировать свои пайплайны vision AI в рамках единой, хорошо поддерживаемой среды.

Link to this sectionDAMO-YOLO#

DAMO-YOLO была разработана исследователями из Alibaba Group. Она использует поиск архитектуры нейронных сетей (Neural Architecture Search, NAS) для обнаружения высокоэффективных бэкендов, адаптированных для инференса в реальном времени на GPU и других ускорителях.

Узнай больше о DAMO-YOLO

Основная философия DAMO-YOLO строится вокруг репараметризации и автоматизированного поиска. Используя MAE-NAS (Multi-Objective Evolutionary Neural Architecture Search), авторы спроектировали кастомный бэкенд, который значительно увеличивает скорость инференса на специализированном оборудовании. Она также включает в себя сильно оптимизированную «шейку» (neck) под названием Efficient RepGFPN и упрощенную структуру ZeroHead для минимизации задержек.

Другие модели для рассмотрения

Сравнивая YOLO11 и DAMO-YOLO, подумай о том, чтобы взглянуть на более новую Ultralytics YOLO26. Она внедряет нативный сквозной инференс без NMS и обеспечивает скорость работы на CPU до 43% выше. Ты также можешь изучить сравнения с участием YOLOX или YOLOv8.

Link to this sectionСравнение производительности и архитектуры#

Понимание компромиссов в производительности жизненно важно при развертывании приложений edge AI. В таблице ниже приведены ключевые метрики, такие как mean Average Precision (mAP), задержка и вычислительная сложность.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Link to this sectionГлубокое изучение архитектуры#

YOLO11 опирается на высокоэффективный, специально разработанный бэкенд, который идеально балансирует между количеством параметров и репрезентативной способностью. Она оптимизирована для отличной работы на широком спектре оборудования, нативно показывая превосходные результаты при минимальном потреблении CUDA memory как во время обучения, так и во время инференса. Это делает её отличным вариантом для стандартного потребительского оборудования или IoT-устройств с ограниченными ресурсами.

Напротив, бэкенды DAMO-YOLO, созданные с помощью MAE-NAS, точно настроены для сред с высокой пропускной способностью GPU. Её Efficient RepGFPN (Generalized Feature Pyramid Network) агрессивно интегрирует несколько масштабов. Однако, несмотря на то, что репараметризация ускоряет инференс, это может усложнить процесс развертывания, если твой стек оборудования плохо поддерживает такие операции.

Link to this sectionУдобство использования и эффективность обучения#

При учете времени разработки простота использования модели становится такой же важной, как и её базовые показатели.

YOLO11 в значительной степени построена на принципе доступности для разработчиков. Комплексный пакет ultralytics берет на себя всю тяжелую работу по разбору данных, аугментации и настройке гиперпараметров. Экспорт моделей в производственные форматы, такие как ONNX, TensorRT и OpenVINO, требует выполнения всего одной команды.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO, происходящая из академической и исследовательской среды, представляет собой более крутую кривую обучения. Достижение максимальной точности часто включает в себя сложные пайплайны дистилляции знаний — это означает, что тебе сначала нужно обучить массивную «учительскую» (teacher) сеть, прежде чем передать эти знания меньшей «ученической» (student) сети. Это значительно увеличивает требуемые затраты на GPU compute и общую продолжительность обучения по сравнению с быстрыми циклами обучения моделей Ultralytics.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO11 и DAMO-YOLO зависит от требований твоего конкретного проекта, ограничений при развертывании и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLO11#

YOLO11 — отличный выбор для:

  • Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
  • Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
  • Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.

Link to this sectionКогда выбирать DAMO-YOLO#

DAMO-YOLO рекомендуется для:

  • Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
  • Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
  • Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionРеальные применения и варианты использования#

Link to this sectionАвтономные системы и дроны#

Для аэрофотосъемки и развертывания на БПЛА YOLO11 обеспечивает невероятно выгодный баланс производительности. Обнаружение мелких объектов — огромное препятствие в аналитике данных с дронов, но YOLO11 «из коробки» нативно справляется с различными масштабами. Кроме того, низкие memory requirements позволяют вариантам YOLO11 Nano и Small работать непосредственно на легких граничных CPU или NPU, установленных на дроне.

Link to this sectionПромышленная автоматизация и контроль качества#

На «умных» заводах задержка имеет первостепенное значение. Хотя DAMO-YOLO предлагает надежную скорость инференса на мощных GPU серверного уровня благодаря своей «шейке» RepGFPN, такая жесткая интеграция может быть избыточной. YOLO11 часто служит лучшей альтернативой для автоматизированного контроля качества из-за своих простых tracking APIs и возможности легко переключаться с обычного обнаружения на задачи oriented bounding box (OBB), если дефекты требуют распознавания под углом.

Link to this sectionУмное здравоохранение и медицинская визуализация#

Наборы медицинских данных часто относительно малы, и избежать переобучения бывает сложно. Активные методы аугментации в сочетании со стандартными пайплайнами трансферного обучения, предоставляемыми Well-Maintained Ecosystem от Ultralytics, помогают врачам и разработчикам надежно развертывать точные модели tumor detection. Огромная поддержка сообщества гарантирует, что проблемы в сложных областях, таких как здравоохранение, решаются быстро.

Встречай будущее с YOLO26

Если ты создаешь новое приложение с нуля, подумай об изучении YOLO26. Выпущенная в начале 2026 года, она использует оптимизатор MuSGD и функции ProgLoss, обеспечивая исключительную точность на мелких объектах и предоставляя сквозной пайплайн без NMS «из коробки»!

В конечном итоге, хотя DAMO-YOLO остается мощной демонстрацией поиска архитектуры нейронных сетей, YOLO11 и расширенное семейство Ultralytics остаются окончательной рекомендацией для реальных задач компьютерного зрения, отдавая приоритет быстрому развертыванию, удобству для разработчика и первоклассной мультимодальной производительности.

Контрибьюторы

Комментарии