Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против DAMO-YOLO#

При выборе современной модели компьютерного зрения критически важно найти оптимальный баланс между скоростью вывода, точностью и простотой развертывания. В этом подробном руководстве сравниваются две известные модели в сфере vision AI: Ultralytics YOLO26 и DAMO-YOLO. Хотя обе архитектуры расширяют границы обнаружения объектов в реальном времени, их базовые концепции проектирования и предполагаемые сценарии использования существенно различаются.

Link to this sectionАрхитектурные инновации и дизайн#

Link to this sectionUltralytics YOLO26: стандарт компьютерного зрения, ориентированный на Edge-устройства#

Разработанная Гленном Джочером и Цзин Цю в Ultralytics и выпущенная 14 января 2026 года, YOLO26 представляет собой огромный шаг вперед в линейке YOLO. Она разработана с нуля для граничных вычислений (edge computing), органично сочетая передовые методы обучения LLM с продвинутыми архитектурами компьютерного зрения.

Ключевые архитектурные прорывы YOLO26 включают:

  • Дизайн без NMS (End-to-End): Опираясь на новаторскую работу YOLOv10, YOLO26 является нативно сквозной моделью. Полное исключение не-максимального подавления (NMS) при постобработке гарантирует детерминированную задержку и значительно упрощает конвейеры развертывания.
  • Удаление DFL: Удаление функции потерь Distribution Focal Loss оптимизирует граф модели. Это делает экспорт в такие среды развертывания, как ONNX и TensorRT, гораздо более плавным и обеспечивает лучшую совместимость с маломощными периферийными устройствами.
  • Оптимизатор MuSGD: Этот гибрид стохастического градиентного спуска (SGD) и Muon, вдохновленный Kimi K2 от Moonshot AI, привносит инновации обучения LLM в компьютерное зрение, что приводит к удивительно стабильному обучению и быстрой сходимости.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что является критической необходимостью для анализа аэрофотоснимков на базе дронов и сложных робототехнических конвейеров.

Узнай больше о YOLO26

Link to this sectionDAMO-YOLO: нейронный архитектурный поиск в масштабе#

Разработанная Сяньчжэ Сюем, Ици Цзянем, Вэйхуа Чэнем, Илунем Хуаном, Юань Чжаном и Сююй Сунем из Alibaba Group (выпущена 23 ноября 2022 года), DAMO-YOLO уделяет огромное внимание автоматизированному поиску архитектуры. В исследовании, подробно описанном в их статье на arXiv, используется нейронный архитектурный поиск (NAS) для нахождения оптимальных бэкбонов при строгих бюджетных ограничениях по задержке.

Ключевые архитектурные особенности DAMO-YOLO включают:

  • Бэкбон MAE-NAS: Использует многоцелевой эволюционный поиск для автоматического проектирования бэкбонов, которые балансируют точность с целевой скоростью развертывания.
  • Эффективный RepGFPN: Надежный дизайн «тяжелой» горловины (heavy-neck), который оптимизирует слияние признаков в разных масштабах, делая модель высокоэффективной при обработке сложных визуальных сцен.
  • ZeroHead: Радикально упрощенная детектирующая головка, разработанная для минимизации вычислительных затрат в финальных слоях предсказания.

Узнай больше о DAMO-YOLO

Выбор правильной архитектуры

Хотя архитектура DAMO-YOLO, основанная на NAS, отлично подходит для конкретных, заранее определенных аппаратных ограничений, дизайн без NMS и удаление DFL в YOLO26 делают ее гораздо более универсальным и предсказуемым выбором для широкого спектра разнообразных граничных и облачных сред.

Link to this sectionСравнение производительности и метрик#

Прямое сравнение вариантов моделей, обученных на стандартном наборе данных COCO, выявляет различные профили производительности. В приведенной ниже таблице представлены компромиссы между точностью (mAP), скоростью и вычислительными ресурсами (параметры и FLOPs).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Link to this sectionАнализ производительности#

При анализе данных баланс производительности сильно склоняется в пользу YOLO26 для современных приложений. Вариант Nano (YOLO26n) исключительно легкий — всего 2,4 млн параметров, обеспечивающий молниеносную скорость 1,7 мс на GPU NVIDIA T4. Более того, YOLO26 специально спроектирована для обеспечения до 43% более быстрого вывода на CPU, что делает ее бесспорным чемпионом для граничных устройств без выделенных GPU-ускорителей.

Хотя DAMO-YOLOt немного опережает YOLO26n по чистому mAP, это достигается ценой почти четырехкратного увеличения количества параметров (8,5 млн). По мере перехода к более крупным вариантам, YOLO26 неизменно превосходит DAMO-YOLO по точности, сохраняя при этом меньший объем памяти, меньшее использование памяти CUDA во время обучения и значительно более высокую скорость TensorRT.

Link to this sectionЭкосистема, удобство использования и эффективность обучения#

Истинная сила модели машинного обучения заключается не только в ее сухих метриках, но и в том, насколько легко она может использоваться разработчиками и исследователями.

Link to this sectionПреимущество Ultralytics#

Выбор модели Ultralytics гарантирует доступ к высокоутонченной, ориентированной на разработчиков экосистеме. Сложные рабочие процессы, включающие аугментацию данных, настройку гиперпараметров и надежное отслеживание экспериментов, абстрагированы в интуитивно понятные команды.

Более того, YOLO26 предлагает непревзойденную универсальность. В то время как DAMO-YOLO — это исключительно детектор объектов, YOLO26 «из коробки» предоставляет комплексные, специализированные улучшения для нескольких задач:

Link to this sectionМетодологии обучения#

Обучение DAMO-YOLO часто включает сложный процесс дистилляции, при котором большая модель-«учитель» обучает меньшую модель-«ученика». Хотя этот метод дает незначительный прирост точности, он требует больших объемов памяти GPU и более длительных циклов обучения.

И наоборот, требования к памяти для YOLO26 значительно ниже. Благодаря оптимизатору MuSGD, YOLO26 обучается быстро и эффективно на стандартном потребительском оборудовании. Вот как легко ты можешь обучить модель YOLO26, используя Ultralytics Python API с поддержкой PyTorch:

from ultralytics import YOLO

# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized, NMS-free model
model.export(format="onnx")
Изучение других моделей

Если тебя интересует изучение других современных архитектур в экосистеме Ultralytics, высокопроизводительная YOLO11 остается фантастическим выбором для унаследованных конвейеров. Кроме того, исследователи, интересующиеся архитектурами на основе трансформеров, могут изучить модель RT-DETR.

Link to this sectionПрименение в реальных условиях#

Выбор между этими архитектурами в конечном итоге зависит от твоей среды развертывания.

Link to this sectionEdge AI и IoT-устройства#

Для умных камер розничной торговли, автоматизированных сельскохозяйственных мониторов или робототехники вычислительные ресурсы строго ограничены. Здесь YOLO26 является окончательным выбором. Ее вывод на CPU, работающий на 43% быстрее, полностью свободный от NMS конвейер и крошечный объем параметров позволяют ей плавно работать на таких граничных устройствах, как Raspberry Pi, без ущерба для критической точности.

Link to this sectionВысокоскоростное производство и контроль качества#

На линиях автоматизации производства с высоким темпом обнаружение дефектов на быстро движущихся конвейерных лентах требует минимальной, детерминированной задержки. Хотя DAMO-YOLO может адекватно работать на определенных конфигурациях GPU, колеблющаяся задержка, вносимая традиционной постобработкой NMS, может привести к рассинхронизации роботизированных приводов. Сквозной характер YOLO26 гарантирует стабильное и предсказуемое время обработки кадров, обеспечивая безупречную интеграцию в высокоскоростную промышленную робототехнику.

Link to this sectionДроны и аэрофотосъемка#

Обнаружение крошечных объектов с большой высоты — задача заведомо сложная. Интеграция ProgLoss и STAL в YOLO26 кардинально улучшает распознавание мелких объектов. Независимо от того, отслеживаешь ли ты дикую природу или анализируешь транспортные заторы с БПЛА, YOLO26 последовательно идентифицирует объекты с меньшей площадью в пикселях, которые старые архитектуры, включая DAMO-YOLO, часто пропускают.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO26 и DAMO-YOLO зависит от твоих конкретных требований проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLO26#

YOLO26 — отличный выбор для:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionКогда выбирать DAMO-YOLO#

DAMO-YOLO рекомендуется для:

  • Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
  • Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
  • Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.

Link to this sectionЗаключение#

Хотя DAMO-YOLO остается увлекательным исследованием возможностей нейронного архитектурного поиска для конкретных аппаратных целей, Ultralytics YOLO26 является превосходным, всесторонним решением для современного специалиста по ИИ. Благодаря сквозной архитектуре без NMS, значительно меньшим требованиям к памяти, гибридному оптимизатору MuSGD и безупречно поддерживаемой экосистеме, YOLO26 дает разработчикам возможность создавать и развертывать современные системы компьютерного зрения быстрее и надежнее, чем когда-либо прежде.

Участники

Комментарии