Link to this sectionСравнение DAMO-YOLO и EfficientDet#
Эволюция компьютерного зрения породила множество мощных архитектур, адаптированных для различных реальных задач. В то время как некоторые фреймворки отдают приоритет высокой масштабируемости, другие делают упор на скорость вывода в режиме реального времени. В этом техническом сравнении мы рассмотрим DAMO-YOLO и EfficientDet — две крайне влиятельные модели, демонстрирующие разные подходы к решению задачи обнаружения объектов. Мы разберем их архитектуры, сравним показатели бенчмарков и в конечном итоге выясним, почему недавно выпущенная Ultralytics YOLO26 представляет собой оптимальный выбор для современных производственных развертываний.
Link to this sectionОбзор архитектуры#
Обе модели были разработаны для решения проблемы компромисса между эффективностью и точностью, но они опираются на принципиально разные механизмы для достижения своих целей.
Link to this sectionDAMO-YOLO: скорость за счет нейроархитектурного поиска#
Разработанная для расширения границ обнаружения в реальном времени, DAMO-YOLO использует методы автоматизированного поиска для создания высокоэффективных сетей, адаптированных для сред с низкой задержкой.
Детали DAMO-YOLO:
Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
Организация: Alibaba Group
Дата: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO построена на базе нейроархитектурного поиска (NAS), который оптимизирует как скорость, так и точность. Она представляет RepGFPN (перепараметризованную обобщенную пирамиду признаков), которая улучшает слияние признаков, сохраняя при этом высокую скорость вывода. Кроме того, дизайн ZeroHead минимизирует вычислительные затраты, обычно связанные с детекционными головами. Модель также выигрывает от AlignedOTA (назначение оптимального транспорта) и дистилляционного улучшения, гарантируя, что даже самые компактные варианты обучаются на богатых представлениях более крупных моделей.
Link to this sectionEfficientDet: масштабируемость за счет составного масштабирования#
В отличие от подхода, ориентированного на скорость, EfficientDet фокусируется на систематической масштабируемости при различных вычислительных бюджетах.
Детали EfficientDet:
Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google Brain
Дата: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
EfficientDet представляет BiFPN (двунаправленную пирамидальную сеть признаков), которая позволяет легко и быстро выполнять многомасштабное слияние признаков. В отличие от традиционных методов, которые масштабируют архитектуры путем произвольного добавления слоев или каналов, EfficientDet использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину бэкбона, сети признаков и сетей предсказания рамок/классов одновременно. Это позволяет достичь передовой точности на высокопроизводительном оборудовании, предлагая при этом меньшие варианты для ограниченных сред.
Link to this sectionСравнение производительности и метрик#
При сравнении этих моделей становится очевидным компромисс между чистой точностью и скоростью вывода. В таблице ниже приведены ключевые показатели производительности, демонстрирующие, как возможности вывода DAMO-YOLO соотносятся с семейством моделей EfficientDet.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Как видно выше, EfficientDet-d7 достигает наивысшей общей точности, что делает её подходящей для сложных облачных приложений. С другой стороны, серия DAMO-YOLO обеспечивает высокую конкурентоспособную точность со значительно меньшей задержкой на оборудовании GPU, что делает её более сильным кандидатом для развертывания на периферийных устройствах в реальном времени.
Link to this sectionСценарии использования и рекомендации#
Выбор между DAMO-YOLO и EfficientDet зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать DAMO-YOLO#
DAMO-YOLO — сильный выбор для:
- Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
- Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
- Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.
Link to this sectionКогда стоит выбрать EfficientDet#
EfficientDet рекомендуется для:
- Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
- Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
- Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionСовременная альтернатива: Ultralytics YOLO26#
Хотя DAMO-YOLO и EfficientDet представляют собой важные академические вехи, реальное развертывание часто требует более сбалансированного, многофункционального и дружественного к разработчику подхода. Именно здесь Ultralytics YOLO26 устанавливает новый отраслевой стандарт.
Выпущенная в январе 2026 года, YOLO26 опирается на наследие своих предшественников, включая Ultralytics YOLO11 и YOLOv8, обеспечивая смену парадигмы в том, как мы подходим к обнаружению объектов.
YOLO26 оснащена нативным дизайном End-to-End без использования NMS. Исключая немаксимальное подавление (NMS) при постобработке — «узкое место», которое годами преследовало детекторы объектов, — YOLO26 предлагает более простой и значительно более быстрый конвейер развертывания, особенно на периферийном оборудовании.
Link to this sectionНепревзойденная производительность и универсальность#
YOLO26 не только улучшает скорость; она переопределяет стабильность обучения и точность. Она представляет оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный инновациями в обучении LLM, что приводит к значительно более высокой скорости сходимости и превосходной эффективности обучения. В отличие от тяжелых альтернатив на основе трансформеров, таких как RT-DETR, YOLO26 сохраняет невероятно низкие требования к памяти, гарантируя, что её можно обучать на потребительском оборудовании.
Кроме того, YOLO26 включает ProgLoss + STAL, значительно улучшая распознавание мелких объектов, что жизненно важно для таких вариантов использования, как аэрофотосъемка с дронов и робототехника. Для оптимизации работы на маломощных устройствах YOLO26 убрала Distribution Focal Loss (DFL), что привело к увеличению скорости вывода на CPU до 43% по сравнению с предыдущими поколениями.
Link to this sectionЭкосистема и простота использования#
Одним из самых больших препятствий при работе с такими моделями, как EfficientDet, является сложный процесс интеграции. В отличие от них, платформа Ultralytics предлагает хорошо поддерживаемую комплексную экосистему. С помощью единого API ты можешь легко переключаться между обнаружением, сегментацией экземпляров, оценкой позы, классификацией изображений и ориентированными ограничивающими рамками (OBB).
Вот насколько просто обучать и запускать вывод с YOLO26, используя пакет Ultralytics для Python:
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run ultra-fast NMS-free inference
predictions = model.predict("image.jpg")Link to this sectionЗаключение#
Хотя изучение сравнения DAMO-YOLO и EfficientDet дает отличные знания о компромиссах между нейроархитектурным поиском и составным масштабированием, современным разработчикам нужны инструменты, которые устраняют разрыв между академическими исследованиями и производственной реальностью.
Для разработчиков, которые ценят простоту использования, активное сообщество с открытым исходным кодом и бескомпромиссный баланс скорости и точности, Ultralytics YOLO26 является окончательным выбором. Её архитектура без NMS, низкие накладные расходы на обучение и бесшовная интеграция с комплексной экосистемой Ultralytics делают её идеальным фреймворком для твоего следующего проекта в области компьютерного зрения.