Перейти к содержанию

YOLO11 против EfficientDet: подробное техническое сравнение

На этой странице представлено подробное техническое сравнение Ultralytics YOLO11 и EfficientDet, двух известных моделей обнаружения объектов. Мы анализируем их архитектуры, показатели производительности и пригодность для различных приложений, чтобы помочь вам выбрать оптимальную модель для ваших нужд в области компьютерного зрения. Хотя обе модели направлены на эффективное и точное обнаружение объектов, они происходят из разных направлений исследований (Ultralytics и Google) и используют различные архитектурные принципы.

Ultralytics YOLO11

Ultralytics YOLO11 представляет собой последнее достижение в серии YOLO (You Only Look Once), разработанной Ultralytics и известной своими исключительными возможностями обнаружения объектов в реальном времени. Она основана на успехе предшественников, таких как YOLOv8, и ориентирована на повышение точности и вычислительной эффективности.

Технические детали:

Архитектура и ключевые особенности

YOLO11 использует одноступенчатую архитектуру без привязки к якорям, оптимизированную для скорости и точности. Ключевые особенности включают усовершенствованные слои извлечения признаков и оптимизированную структуру сети, что снижает количество параметров и вычислительную нагрузку. Эта конструкция обеспечивает отличную производительность на различном оборудовании, от периферийных устройств (NVIDIA Jetson, Raspberry Pi) до облачных серверов.

Основным преимуществом YOLO11 является его универсальность и интеграция в экосистему Ultralytics. Он поддерживает несколько задач, помимо обнаружения объектов, включая сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие прямоугольники (OBB). Платформа Ultralytics предлагает простой Python API и CLI, обширную документацию, легкодоступные предварительно обученные веса и эффективные процессы обучения с более низкими требованиями к памяти по сравнению со многими другими архитектурами. Экосистема выигрывает от активной разработки, сильной поддержки сообщества и бесшовной интеграции с такими инструментами, как Ultralytics HUB для оптимизированного MLOps.

Сильные стороны

  • Высокая скорость и эффективность: Отличная скорость инференса, идеально подходит для приложений реального времени.
  • Высокая точность: Достигает самых современных показателей mAP для моделей разных размеров.
  • Универсальность: Поддерживает задачи обнаружения, сегментации, классификации, определения позы и OBB в рамках единой структуры.
  • Простота использования: Простой API, исчерпывающая документация и удобная экосистема.
  • Экосистема с хорошей поддержкой: Активно разрабатывается, сильное сообщество, частые обновления и инструменты, такие как Ultralytics HUB.
  • Эффективность обучения: Более быстрое время обучения и меньшее использование памяти по сравнению со многими альтернативами.
  • Deployment Flexibility (Гибкость развертывания): Оптимизировано для различного оборудования от периферии до облака.

Слабые стороны

  • Меньшие модели уделяют приоритетное внимание скорости, что может повлечь за собой компромисс в максимально достижимой точности по сравнению с самыми большими вариантами.
  • Как одностадийный детектор, может столкнуться с проблемами при работе с очень маленькими объектами в сложных сценах.

Идеальные варианты использования

YOLO11 превосходно подходит для приложений, требующих производительности в реальном времени и высокой точности:

Узнайте больше о YOLO11

EfficientDet от Google

EfficientDet — это семейство моделей обнаружения объектов, представленное командой Google Brain. Он разработан для достижения высокой эффективности за счет оптимизации компромисса между точностью и вычислительными ресурсами (параметрами и FLOPs).

Технические детали:

Архитектура и ключевые особенности

Архитектура EfficientDet построена на трех ключевых инновациях:

  1. EfficientNet Backbone: Он использует высокоэффективный EfficientNet в качестве своей базовой сети для извлечения признаков.
  2. BiFPN (Bi-directional Feature Pyramid Network): Новая сеть признаков, которая обеспечивает простое и быстрое многомасштабное слияние признаков, улучшая традиционные FPN путем добавления взвешенных соединений.
  3. Комплексное масштабирование (Compound Scaling): Метод, который равномерно масштабирует глубину, ширину и разрешение для backbone, сети признаков и сетей предсказания bounding box/класса. Это позволяет масштабировать модель от малых (D0) до больших (D7) вариантов для соответствия различным ограничениям ресурсов.

Сильные стороны

  • Высокая эффективность параметров: Обеспечивает высокую точность при относительно небольшом количестве параметров и FLOPs.
  • Масштабируемость: Метод масштабирования предоставляет четкий путь для масштабирования модели под различные целевые показатели производительности.
  • Высокая производительность в бенчмарках: Достигнуты самые современные результаты на наборе данных COCO на момент выпуска.

Слабые стороны

  • Более медленная скорость инференса: Несмотря на свою эффективность по FLOPs, EfficientDet часто имеет более высокую задержку инференса по сравнению с моделями YOLO, особенно на GPU, что делает его менее подходящим для многих приложений реального времени.
  • Ограниченная универсальность: В первую очередь предназначен для обнаружения объектов и не имеет встроенной поддержки других задач, таких как сегментация экземпляров, оценка позы или OBB, которые интегрированы во фреймворк Ultralytics YOLO.
  • Менее интегрированная экосистема: Исходный репозиторий является прежде всего исследовательским артефактом. Ему не хватает всесторонней документации, простого API и интегрированных инструментов, таких как Ultralytics HUB, которые упрощают сквозной рабочий процесс от обучения до развертывания.
  • Зависимость от фреймворка: Официальная реализация выполнена на TensorFlow, что может быть ограничением для разработчиков и исследователей, работающих в основном в экосистеме PyTorch.

Идеальные варианты использования

EfficientDet хорошо подходит для сценариев, где размер модели и теоретические вычислительные затраты являются наиболее важными ограничениями:

  • Edge AI: Развертывание на мобильных или встроенных устройствах, где память и вычислительная мощность сильно ограничены.
  • Академические исследования: Изучение законов масштабирования моделей и архитектурной эффективности.
  • Облачные приложения: Сценарии, в которых минимизация вычислительных затрат на одно логическое заключение важнее, чем достижение минимально возможной задержки.

Узнайте больше об EfficientDet

Производительность и сравнительное тестирование: YOLO11 против EfficientDet

При сравнении производительности крайне важно смотреть не только на mAP. Хотя оба семейства моделей предлагают ряд уровней точности, YOLO11 разработан для превосходной скорости в реальных условиях. Таблица ниже показывает, что для аналогичного mAP модели YOLO11 значительно быстрее, особенно при ускорении с помощью TensorRT на GPU.

Например, YOLO11m достигает тех же 51.5 mAP, что и EfficientDet-d5, но при этом в 14 раз быстрее на T4 GPU (4.7 мс против 67.86 мс) и использует на 40% меньше параметров. Это подчеркивает исключительный баланс точности, скорости и размера модели YOLO11, что делает ее гораздо более практичным выбором для приложений, требующих обработки в реальном времени.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

Заключение: какую модель вам следует выбрать?

В то время как EfficientDet была значительным шагом вперед в повышении эффективности моделей, Ultralytics YOLO11 представляет собой более современное, практичное и мощное решение для подавляющего большинства приложений компьютерного зрения.

  • Выбирайте EfficientDet, если ваше основное ограничение — минимизация теоретических FLOPs или количества параметров, и вы комфортно работаете в рамках его научно-ориентированной структуры.

  • Выбирайте Ultralytics YOLO11 почти для всех остальных сценариев. Его превосходный компромисс между скоростью и точностью, невероятная универсальность в различных задачах компьютерного зрения и простота использования делают его окончательным выбором для разработчиков и исследователей. Хорошо поддерживаемая экосистема, включающая исчерпывающую документацию, активную поддержку сообщества и такие инструменты, как Ultralytics HUB, обеспечивает плавную разработку и развертывание, от начальных экспериментов до масштабирования в производство.

Сравнения с другими моделями

Для дальнейшего изучения рассмотрите эти сравнения с участием YOLO11 и других соответствующих моделей:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии