Перейти к содержанию

EfficientDet vs. DAMO-YOLO: техническое сравнение

В области обнаружения объектов разработчики сталкиваются с широким спектром моделей, каждая из которых обладает уникальными преимуществами. На этой странице представлено подробное техническое сравнение двух влиятельных архитектур: EfficientDet, разработанной Google, и DAMO-YOLO от Alibaba Group. Хотя обе являются мощными одноэтапными детекторами, они следуют разным философиям проектирования. EfficientDet отдает приоритет вычислительной эффективности и эффективности параметров за счет систематического масштабирования, в то время как DAMO-YOLO расширяет границы компромисса между скоростью и точностью, используя современные методы, такие как Neural Architecture Search (NAS).

Это сравнение углубится в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать правильную модель для вашего проекта в области компьютерного зрения.

EfficientDet: Масштабируемое и эффективное обнаружение объектов

EfficientDet был представлен Google Research с целью создания семейства детекторов объектов, которые могли бы эффективно масштабироваться в рамках различных вычислительных бюджетов. Он основан на высокоэффективной базовой сети EfficientNet и представляет новые компоненты для многомасштабного объединения признаков и масштабирования модели.

Узнайте больше об EfficientDet

Технические детали

Архитектура и ключевые особенности

  • EfficientNet Backbone: EfficientDet использует предварительно обученный EfficientNet в качестве своей базовой сети, которая уже оптимизирована для обеспечения баланса между точностью и эффективностью.
  • BiFPN (Bi-directional Feature Pyramid Network): Вместо стандартной FPN, EfficientDet представляет BiFPN, более эффективный слой для объединения многомасштабных признаков. BiFPN обеспечивает простой и быстрый поток информации между различными разрешениями карт признаков за счет включения взвешенного объединения признаков и соединений сверху вниз/снизу вверх.
  • Составное масштабирование: Основным нововведением EfficientDet является метод составного масштабирования. Он совместно масштабирует глубину, ширину и разрешение для backbone, сети признаков и prediction heads, используя один составной коэффициент. Это обеспечивает сбалансированное распределение ресурсов по всем частям сети, что приводит к значительным улучшениям эффективности.
  • Масштабируемое семейство: Метод сложного масштабирования позволяет создавать целое семейство моделей (EfficientDet-D0 - D7), что позволяет разработчикам выбирать модель, идеально соответствующую их аппаратным ограничениям, от мобильных устройств до мощных облачных серверов.

Сильные стороны

  • Высокая эффективность параметров и FLOPs: Отлично подходит для сценариев, где размер модели и вычислительные затраты являются критическими ограничениями.
  • Масштабируемость: Предлагается широкий спектр моделей (D0-D7), обеспечивающих четкий компромисс между точностью и использованием ресурсов.
  • Высокая точность: Достигает конкурентоспособной точности, особенно если учитывать низкое количество параметров и FLOP.

Слабые стороны

  • Более медленная скорость инференса: Будучи эффективной с точки зрения FLOPs, его задержка инференса на GPU может быть выше, чем у более новых, высокооптимизированных моделей, таких как DAMO-YOLO и Ultralytics YOLO.
  • Сложность: BiFPN и составное масштабирование, хотя и эффективны, могут сделать архитектуру более сложной для понимания и модификации по сравнению с более простыми конструкциями YOLO.

Идеальные варианты использования

EfficientDet хорошо подходит для приложений, где ограничения ресурсов являются основной проблемой. Его масштабируемость делает его универсальным выбором для развертывания на различном оборудовании, включая устройства edge AI и системы, где минимизация вычислительных затрат имеет важное значение для управления питанием или температурой.

DAMO-YOLO: Быстрый и точный вариант YOLO

DAMO-YOLO — это высокопроизводительный детектор объектов от Alibaba Group, который основывается на серии YOLO, но включает в себя несколько передовых методов для достижения современного баланса скорости и точности. Он использует поиск нейронной архитектуры (NAS) для оптимизации ключевых компонентов сети для конкретного оборудования.

Узнайте больше о DAMO-YOLO

Технические детали

Архитектура и ключевые особенности

  • NAS-Powered Backbone: DAMO-YOLO использует backbone, созданный с помощью Neural Architecture Search (NAS), который автоматически находит оптимальную структуру сети, что приводит к улучшению возможностей извлечения признаков.
  • Эффективный RepGFPN Neck: Он представляет новую конструкцию neck под названием RepGFPN, которая разработана для обеспечения аппаратной эффективности и эффективного слияния многомасштабных признаков.
  • ZeroHead: Модель использует упрощенную структуру "ZeroHead", которая представляет собой связанную структуру, уменьшающую архитектурную сложность и вычислительные затраты без ущерба для производительности.
  • Назначение меток AlignedOTA: DAMO-YOLO использует AlignedOTA, усовершенствованную динамическую стратегию назначения меток, которая улучшает обучение за счет лучшего согласования целей классификации и регрессии.
  • Улучшение дистилляции: Процесс обучения улучшен с помощью дистилляции знаний для дальнейшего повышения производительности небольших моделей в семействе.

Сильные стороны

  • Исключительная скорость GPU: Обеспечивает чрезвычайно высокую скорость инференса на оборудовании GPU, что делает его идеальным для инференса в реальном времени.
  • Высокая точность: Достигает высоких показателей mAP, конкурируя с лучшими моделями в своем классе.
  • Современный дизайн: Включает в себя несколько передовых методов (NAS, продвинутое назначение меток), которые представляют собой передний край исследований в области обнаружения объектов.

Слабые стороны

  • Ограниченная универсальность: DAMO-YOLO специализируется на обнаружении объектов и не имеет встроенной поддержки других задач, таких как сегментация экземпляров или оценка позы.
  • Производительность CPU: Оригинальное исследование и репозиторий в основном сосредоточены на производительности GPU, с меньшим акцентом на оптимизацию CPU.
  • Экосистема и удобство использования: Как модель, ориентированная на исследования, она может потребовать больше инженерных усилий для интеграции и развертывания по сравнению с полностью поддерживаемыми фреймворками, такими как Ultralytics.

Идеальные варианты использования

DAMO-YOLO — отличный выбор для приложений, требующих как высокой точности, так и очень низкой задержки на GPU-оборудовании. К ним относятся системы видеонаблюдения в реальном времени, робототехника и автономные системы, где критически важно быстрое принятие решений.

Анализ производительности: скорость, точность и эффективность

В таблице ниже представлено количественное сравнение моделей EfficientDet и DAMO-YOLO на наборе данных COCO. Результаты подчеркивают различные компромиссы, на которые идет каждая модель.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

На основании сравнительных тестов можно сделать несколько выводов:

  • Скорость GPU: DAMO-YOLO значительно быстрее на GPU T4. Например, DAMO-YOLOm достигает 49,2 mAP с задержкой всего 5,09 мс, в то время как сопоставимая EfficientDet-d4 достигает 49,7 mAP, но с гораздо большей задержкой в 33,55 мс.
  • Эффективность параметров: EfficientDet демонстрирует превосходную эффективность параметров и FLOP. Самая маленькая модель, EfficientDet-d0, использует всего 3,9 млн параметров и 2,54 млрд FLOPs.
  • Производительность CPU: EfficientDet предоставляет четкие бенчмарки CPU, что делает его более предсказуемым выбором для развертываний на основе CPU. Отсутствие официальных скоростей CPU для DAMO-YOLO является заметным пробелом для разработчиков, ориентированных на оборудование, отличное от GPU.

Преимущество Ultralytics: Производительность и удобство использования

Хотя EfficientDet и DAMO-YOLO обладают широкими возможностями, модели Ultralytics YOLO, такие как YOLOv8 и новейшая YOLO11, представляют собой более целостное и удобное для разработчиков решение.

Ключевые преимущества использования моделей Ultralytics включают:

  • Простота использования: Оптимизированный Python API, подробная документация и понятное использование CLI значительно упрощают начало работы, обучение и развертывание моделей.
  • Хорошо поддерживаемая экосистема: Ultralytics предоставляет надежную экосистему с активной разработкой, мощной поддержкой сообщества на GitHub, частыми обновлениями и бесшовной интеграцией с Ultralytics HUB для MLOps.
  • Баланс производительности: Модели Ultralytics высоко оптимизированы для достижения превосходного компромисса между скоростью и точностью на аппаратном обеспечении CPU и GPU, что делает их подходящими для широкого спектра сценариев развертывания.
  • Универсальность: Такие модели, как YOLOv8 и YOLO11, являются многозадачными и поддерживают обнаружение объектов, сегментацию, классификацию, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой унифицированной структуры.
  • Эффективность обучения: Воспользуйтесь преимуществами быстрого времени обучения, более низких требований к памяти и готовых предварительно обученных весов.

Заключение

И EfficientDet, и DAMO-YOLO - убедительные модели обнаружения объектов. EfficientDet выделяется своей исключительной эффективностью параметров и FLOP, предлагая масштабируемое семейство моделей, подходящих для различных аппаратных профилей. DAMO-YOLO превосходит в обеспечении высокой точности при очень быстрой скорости инференса GPU за счет использования современных архитектурных инноваций.

Однако для разработчиков и исследователей, ищущих сочетание высокой производительности, простоты использования и надежной, универсальной экосистемы, модели Ultralytics YOLO, такие как YOLOv8 и YOLO11, часто представляют собой наиболее сильное общее ценностное предложение. Их баланс скорости, точности, поддержки нескольких задач и ориентированной на разработчиков структуры делает их настоятельно рекомендуемым выбором для широкого спектра реальных приложений.

Изучите другие сравнения моделей

Для получения дополнительной информации изучите, как эти модели сравниваются с другими современными архитектурами:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии