YOLO11 против EfficientDet: подробное техническое сравнение
На этой странице представлено подробное техническое сравнение Ultralytics YOLO11 и EfficientDet, двух известных моделей обнаружения объектов. Мы анализируем их архитектуры, показатели производительности и пригодность для различных приложений, чтобы помочь вам выбрать оптимальную модель для ваших нужд в области компьютерного зрения. Хотя обе модели направлены на эффективное и точное обнаружение объектов, они происходят из разных направлений исследований (Ultralytics и Google) и используют различные архитектурные принципы.
Ultralytics YOLO11
Ultralytics YOLO11 представляет собой последнее достижение в серии YOLO (You Only Look Once), разработанной Ultralytics и известной своими исключительными возможностями обнаружения объектов в реальном времени. Она основана на успехе предшественников, таких как YOLOv8, и ориентирована на повышение точности и вычислительной эффективности.
Технические детали:
- Авторы: Гленн Джохер, Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
YOLO11 использует одноступенчатую архитектуру без привязки к якорям, оптимизированную для скорости и точности. Ключевые особенности включают усовершенствованные слои извлечения признаков и оптимизированную структуру сети, что снижает количество параметров и вычислительную нагрузку. Эта конструкция обеспечивает отличную производительность на различном оборудовании, от периферийных устройств (NVIDIA Jetson, Raspberry Pi) до облачных серверов.
Основным преимуществом YOLO11 является его универсальность и интеграция в экосистему Ultralytics. Он поддерживает несколько задач, помимо обнаружения объектов, включая сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие прямоугольники (OBB). Платформа Ultralytics предлагает простой Python API и CLI, обширную документацию, легкодоступные предварительно обученные веса и эффективные процессы обучения с более низкими требованиями к памяти по сравнению со многими другими архитектурами. Экосистема выигрывает от активной разработки, сильной поддержки сообщества и бесшовной интеграции с такими инструментами, как Ultralytics HUB для оптимизированного MLOps.
Сильные стороны
- Высокая скорость и эффективность: Отличная скорость инференса, идеально подходит для приложений реального времени.
- Высокая точность: Достигает самых современных показателей mAP для моделей разных размеров.
- Универсальность: Поддерживает задачи обнаружения, сегментации, классификации, определения позы и OBB в рамках единой структуры.
- Простота использования: Простой API, исчерпывающая документация и удобная экосистема.
- Экосистема с хорошей поддержкой: Активно разрабатывается, сильное сообщество, частые обновления и инструменты, такие как Ultralytics HUB.
- Эффективность обучения: Более быстрое время обучения и меньшее использование памяти по сравнению со многими альтернативами.
- Deployment Flexibility (Гибкость развертывания): Оптимизировано для различного оборудования от периферии до облака.
Слабые стороны
- Меньшие модели уделяют приоритетное внимание скорости, что может повлечь за собой компромисс в максимально достижимой точности по сравнению с самыми большими вариантами.
- Как одностадийный детектор, может столкнуться с проблемами при работе с очень маленькими объектами в сложных сценах.
Идеальные варианты использования
YOLO11 превосходно подходит для приложений, требующих производительности в реальном времени и высокой точности:
- Автономные системы: Робототехника и самоуправляемые автомобили.
- Безопасность: Системы видеонаблюдения и предотвращение краж.
- Промышленная автоматизация: Контроль качества и эффективность переработки.
- Розничная торговля: Управление запасами и аналитика клиентов.
EfficientDet от Google
EfficientDet — это семейство моделей обнаружения объектов, представленное командой Google Brain. Он разработан для достижения высокой эффективности за счет оптимизации компромисса между точностью и вычислительными ресурсами (параметрами и FLOPs).
Технические детали:
- Авторы: Мингксинг Тан, Руоминг Панг, Куок В. Ле
- Организация: Google
- Дата: 20.11.2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Архитектура и ключевые особенности
Архитектура EfficientDet построена на трех ключевых инновациях:
- EfficientNet Backbone: Он использует высокоэффективный EfficientNet в качестве своей базовой сети для извлечения признаков.
- BiFPN (Bi-directional Feature Pyramid Network): Новая сеть признаков, которая обеспечивает простое и быстрое многомасштабное слияние признаков, улучшая традиционные FPN путем добавления взвешенных соединений.
- Комплексное масштабирование (Compound Scaling): Метод, который равномерно масштабирует глубину, ширину и разрешение для backbone, сети признаков и сетей предсказания bounding box/класса. Это позволяет масштабировать модель от малых (D0) до больших (D7) вариантов для соответствия различным ограничениям ресурсов.
Сильные стороны
- Высокая эффективность параметров: Обеспечивает высокую точность при относительно небольшом количестве параметров и FLOPs.
- Масштабируемость: Метод масштабирования предоставляет четкий путь для масштабирования модели под различные целевые показатели производительности.
- Высокая производительность в бенчмарках: Достигнуты самые современные результаты на наборе данных COCO на момент выпуска.
Слабые стороны
- Более медленная скорость инференса: Несмотря на свою эффективность по FLOPs, EfficientDet часто имеет более высокую задержку инференса по сравнению с моделями YOLO, особенно на GPU, что делает его менее подходящим для многих приложений реального времени.
- Ограниченная универсальность: В первую очередь предназначен для обнаружения объектов и не имеет встроенной поддержки других задач, таких как сегментация экземпляров, оценка позы или OBB, которые интегрированы во фреймворк Ultralytics YOLO.
- Менее интегрированная экосистема: Исходный репозиторий является прежде всего исследовательским артефактом. Ему не хватает всесторонней документации, простого API и интегрированных инструментов, таких как Ultralytics HUB, которые упрощают сквозной рабочий процесс от обучения до развертывания.
- Зависимость от фреймворка: Официальная реализация выполнена на TensorFlow, что может быть ограничением для разработчиков и исследователей, работающих в основном в экосистеме PyTorch.
Идеальные варианты использования
EfficientDet хорошо подходит для сценариев, где размер модели и теоретические вычислительные затраты являются наиболее важными ограничениями:
- Edge AI: Развертывание на мобильных или встроенных устройствах, где память и вычислительная мощность сильно ограничены.
- Академические исследования: Изучение законов масштабирования моделей и архитектурной эффективности.
- Облачные приложения: Сценарии, в которых минимизация вычислительных затрат на одно логическое заключение важнее, чем достижение минимально возможной задержки.
Узнайте больше об EfficientDet
Производительность и сравнительное тестирование: YOLO11 против EfficientDet
При сравнении производительности крайне важно смотреть не только на mAP. Хотя оба семейства моделей предлагают ряд уровней точности, YOLO11 разработан для превосходной скорости в реальных условиях. Таблица ниже показывает, что для аналогичного mAP модели YOLO11 значительно быстрее, особенно при ускорении с помощью TensorRT на GPU.
Например, YOLO11m достигает тех же 51.5 mAP, что и EfficientDet-d5, но при этом в 14 раз быстрее на T4 GPU (4.7 мс против 67.86 мс) и использует на 40% меньше параметров. Это подчеркивает исключительный баланс точности, скорости и размера модели YOLO11, что делает ее гораздо более практичным выбором для приложений, требующих обработки в реальном времени.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Заключение: какую модель вам следует выбрать?
В то время как EfficientDet была значительным шагом вперед в повышении эффективности моделей, Ultralytics YOLO11 представляет собой более современное, практичное и мощное решение для подавляющего большинства приложений компьютерного зрения.
-
Выбирайте EfficientDet, если ваше основное ограничение — минимизация теоретических FLOPs или количества параметров, и вы комфортно работаете в рамках его научно-ориентированной структуры.
-
Выбирайте Ultralytics YOLO11 почти для всех остальных сценариев. Его превосходный компромисс между скоростью и точностью, невероятная универсальность в различных задачах компьютерного зрения и простота использования делают его окончательным выбором для разработчиков и исследователей. Хорошо поддерживаемая экосистема, включающая исчерпывающую документацию, активную поддержку сообщества и такие инструменты, как Ultralytics HUB, обеспечивает плавную разработку и развертывание, от начальных экспериментов до масштабирования в производство.
Сравнения с другими моделями
Для дальнейшего изучения рассмотрите эти сравнения с участием YOLO11 и других соответствующих моделей:
- YOLO11 против YOLOv10
- YOLO11 против YOLOv9
- YOLO11 против YOLOv8
- YOLO11 против YOLOv7
- YOLO11 против RT-DETR
- YOLOX против EfficientDet
- YOLOv8 против EfficientDet