Meet YOLO26: next-gen vision AI.

Link to this sectionСравнение DAMO-YOLO и EfficientDet#

Эволюция компьютерного зрения породила множество мощных архитектур, адаптированных для различных реальных задач. В то время как некоторые фреймворки отдают приоритет высокой масштабируемости, другие делают упор на скорость вывода в режиме реального времени. В этом техническом сравнении мы рассмотрим DAMO-YOLO и EfficientDet — две крайне влиятельные модели, демонстрирующие разные подходы к решению задачи обнаружения объектов. Мы разберем их архитектуры, сравним показатели бенчмарков и в конечном итоге выясним, почему недавно выпущенная Ultralytics YOLO26 представляет собой оптимальный выбор для современных производственных развертываний.

Link to this sectionОбзор архитектуры#

Обе модели были разработаны для решения проблемы компромисса между эффективностью и точностью, но они опираются на принципиально разные механизмы для достижения своих целей.

Link to this sectionDAMO-YOLO: скорость за счет нейроархитектурного поиска#

Разработанная для расширения границ обнаружения в реальном времени, DAMO-YOLO использует методы автоматизированного поиска для создания высокоэффективных сетей, адаптированных для сред с низкой задержкой.

Детали DAMO-YOLO:
Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
Организация: Alibaba Group
Дата: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO

DAMO-YOLO построена на базе нейроархитектурного поиска (NAS), который оптимизирует как скорость, так и точность. Она представляет RepGFPN (перепараметризованную обобщенную пирамиду признаков), которая улучшает слияние признаков, сохраняя при этом высокую скорость вывода. Кроме того, дизайн ZeroHead минимизирует вычислительные затраты, обычно связанные с детекционными головами. Модель также выигрывает от AlignedOTA (назначение оптимального транспорта) и дистилляционного улучшения, гарантируя, что даже самые компактные варианты обучаются на богатых представлениях более крупных моделей.

Узнай больше о DAMO-YOLO

Link to this sectionEfficientDet: масштабируемость за счет составного масштабирования#

В отличие от подхода, ориентированного на скорость, EfficientDet фокусируется на систематической масштабируемости при различных вычислительных бюджетах.

Детали EfficientDet:
Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google Brain
Дата: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet

EfficientDet представляет BiFPN (двунаправленную пирамидальную сеть признаков), которая позволяет легко и быстро выполнять многомасштабное слияние признаков. В отличие от традиционных методов, которые масштабируют архитектуры путем произвольного добавления слоев или каналов, EfficientDet использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину бэкбона, сети признаков и сетей предсказания рамок/классов одновременно. Это позволяет достичь передовой точности на высокопроизводительном оборудовании, предлагая при этом меньшие варианты для ограниченных сред.

Узнай больше об EfficientDet

Link to this sectionСравнение производительности и метрик#

При сравнении этих моделей становится очевидным компромисс между чистой точностью и скоростью вывода. В таблице ниже приведены ключевые показатели производительности, демонстрирующие, как возможности вывода DAMO-YOLO соотносятся с семейством моделей EfficientDet.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как видно выше, EfficientDet-d7 достигает наивысшей общей точности, что делает её подходящей для сложных облачных приложений. С другой стороны, серия DAMO-YOLO обеспечивает высокую конкурентоспособную точность со значительно меньшей задержкой на оборудовании GPU, что делает её более сильным кандидатом для развертывания на периферийных устройствах в реальном времени.

Link to this sectionСценарии использования и рекомендации#

Выбор между DAMO-YOLO и EfficientDet зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать DAMO-YOLO#

DAMO-YOLO — сильный выбор для:

  • Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
  • Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
  • Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.

Link to this sectionКогда стоит выбрать EfficientDet#

EfficientDet рекомендуется для:

  • Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
  • Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionСовременная альтернатива: Ultralytics YOLO26#

Хотя DAMO-YOLO и EfficientDet представляют собой важные академические вехи, реальное развертывание часто требует более сбалансированного, многофункционального и дружественного к разработчику подхода. Именно здесь Ultralytics YOLO26 устанавливает новый отраслевой стандарт.

Выпущенная в январе 2026 года, YOLO26 опирается на наследие своих предшественников, включая Ultralytics YOLO11 и YOLOv8, обеспечивая смену парадигмы в том, как мы подходим к обнаружению объектов.

Сквозная простота

YOLO26 оснащена нативным дизайном End-to-End без использования NMS. Исключая немаксимальное подавление (NMS) при постобработке — «узкое место», которое годами преследовало детекторы объектов, — YOLO26 предлагает более простой и значительно более быстрый конвейер развертывания, особенно на периферийном оборудовании.

Link to this sectionНепревзойденная производительность и универсальность#

YOLO26 не только улучшает скорость; она переопределяет стабильность обучения и точность. Она представляет оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный инновациями в обучении LLM, что приводит к значительно более высокой скорости сходимости и превосходной эффективности обучения. В отличие от тяжелых альтернатив на основе трансформеров, таких как RT-DETR, YOLO26 сохраняет невероятно низкие требования к памяти, гарантируя, что её можно обучать на потребительском оборудовании.

Кроме того, YOLO26 включает ProgLoss + STAL, значительно улучшая распознавание мелких объектов, что жизненно важно для таких вариантов использования, как аэрофотосъемка с дронов и робототехника. Для оптимизации работы на маломощных устройствах YOLO26 убрала Distribution Focal Loss (DFL), что привело к увеличению скорости вывода на CPU до 43% по сравнению с предыдущими поколениями.

Link to this sectionЭкосистема и простота использования#

Одним из самых больших препятствий при работе с такими моделями, как EfficientDet, является сложный процесс интеграции. В отличие от них, платформа Ultralytics предлагает хорошо поддерживаемую комплексную экосистему. С помощью единого API ты можешь легко переключаться между обнаружением, сегментацией экземпляров, оценкой позы, классификацией изображений и ориентированными ограничивающими рамками (OBB).

Вот насколько просто обучать и запускать вывод с YOLO26, используя пакет Ultralytics для Python:

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run ultra-fast NMS-free inference
predictions = model.predict("image.jpg")

Узнай больше о YOLO26

Link to this sectionЗаключение#

Хотя изучение сравнения DAMO-YOLO и EfficientDet дает отличные знания о компромиссах между нейроархитектурным поиском и составным масштабированием, современным разработчикам нужны инструменты, которые устраняют разрыв между академическими исследованиями и производственной реальностью.

Для разработчиков, которые ценят простоту использования, активное сообщество с открытым исходным кодом и бескомпромиссный баланс скорости и точности, Ultralytics YOLO26 является окончательным выбором. Её архитектура без NMS, низкие накладные расходы на обучение и бесшовная интеграция с комплексной экосистемой Ultralytics делают её идеальным фреймворком для твоего следующего проекта в области компьютерного зрения.

Контрибьюторы

Комментарии