EfficientDet vs. YOLO11: подробное техническое сравнение
На этой странице представлено подробное техническое сравнение EfficientDet от Google и Ultralytics YOLO11, двух известных моделей обнаружения объектов. Мы анализируем их архитектуры, показатели производительности и пригодность для различных приложений, чтобы помочь вам выбрать оптимальную модель для ваших нужд в области компьютерного зрения. Хотя обе модели направлены на эффективное и точное обнаружение объектов, они происходят из разных направлений исследований (Google и Ultralytics) и используют различные архитектурные принципы.
EfficientDet
EfficientDet — это семейство моделей обнаружения объектов, разработанное исследователями из Google Brain. Представленный в 2019 году, он установил новый стандарт эффективности, объединив мощный backbone с новым механизмом объединения признаков и уникальным методом масштабирования.
Технические детали:
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация: Google
- Дата: 20.11.2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Архитектура и ключевые особенности
Архитектура EfficientDet построена на трех основных компонентах:
- EfficientNet Backbone: В качестве основы для извлечения признаков используется высокоэффективная сеть EfficientNet.
- BiFPN (Bi-directional Feature Pyramid Network): Новая взвешенная сеть пирамиды признаков, которая обеспечивает простое и быстрое объединение многомасштабных признаков. Она вводит обучаемые веса для понимания важности различных входных признаков и применяет соединения как сверху вниз, так и снизу вверх.
- Составное масштабирование: Ключевое нововведение, при котором глубина, ширина и разрешение модели масштабируются вместе с использованием одного составного коэффициента. Это позволяет семейству моделей (от D0 до D7) эффективно масштабироваться в широком диапазоне ограничений ресурсов.
Сильные стороны
- Высокая эффективность: Модели EfficientDet известны своим низким количеством параметров и FLOPs, достигая высокой точности для своего вычислительного бюджета.
- Масштабируемость: Метод масштабирования обеспечивает четкий путь для масштабирования модели вверх или вниз, что делает ее адаптируемой к различным аппаратным профилям, от мобильных устройств до центров обработки данных.
- Надежный академический бенчмарк: Эта модель была передовой на момент выпуска и остается надежным базовым уровнем для исследований, ориентированных на эффективность.
Слабые стороны
- Более медленный инференс на GPU: Несмотря на свою эффективность по FLOPs, EfficientDet может быть медленнее с точки зрения реальной задержки инференса на GPU по сравнению с такими моделями, как YOLO11, которые специально разработаны для оборудования параллельной обработки.
- Ограниченная универсальность: EfficientDet — это в первую очередь детектор объектов. Ему не хватает встроенной поддержки других задач, таких как сегментация экземпляров, оценка позы или классификация, которые интегрированы в современные фреймворки, такие как Ultralytics.
- Менее поддерживаемая экосистема: Официальный репозиторий не так активно развивается, как экосистема Ultralytics. Это может привести к проблемам с удобством использования, поддержкой сообщества и интеграцией с новейшими инструментами и платформами развертывания.
Узнайте больше об EfficientDet
Ultralytics YOLO11
Ultralytics YOLO11 — это последнее достижение в серии YOLO (You Only Look Once), разработанной Ultralytics. Он опирается на успех своих предшественников, таких как YOLOv8, уделяя особое внимание расширению границ как точности, так и производительности в реальном времени, предлагая при этом беспрецедентную простоту использования и универсальность.
Технические детали:
- Авторы: Гленн Джохер, Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
В YOLO11 используется одноэтапный безанкерный детектор, архитектура, оптимизированная для скорости и точности. Его конструкция включает в себя усовершенствованные слои извлечения признаков и оптимизированную структуру сети, что снижает количество параметров и вычислительную нагрузку без ущерба для точности. Это обеспечивает исключительную производительность на различном оборудовании, от периферийных устройств, таких как NVIDIA Jetson, до мощных облачных серверов.
Значительным преимуществом YOLO11 является ее интеграция во всеобъемлющую экосистему Ultralytics. Это предоставляет разработчикам:
- Простота использования: Простой и интуитивно понятный Python API и CLI делают обучение, проверку и вывод простыми.
- Универсальность: YOLO11 — это многозадачная модель, поддерживающая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой унифицированной структуры.
- Хорошо поддерживаемая экосистема: Модель получает преимущества от активной разработки, большого и поддерживающего сообщества с открытым исходным кодом, частых обновлений и простой интеграции с такими инструментами, как Ultralytics HUB, для сквозного MLOps.
- Эффективность обучения и памяти: YOLO11 разработан для эффективного обучения, часто требуя меньше памяти CUDA и сходясь быстрее, чем альтернативы. Он поставляется с легкодоступными предварительно обученными весами на наборах данных, таких как COCO.
Сильные стороны
- Передовая производительность: Достигает превосходного баланса между высокими показателями mAP и высокой скоростью инференса, особенно на GPU.
- Deployment Flexibility (Гибкость развертывания): Оптимизировано для широкого спектра оборудования, с легким экспортом в такие форматы, как ONNX и TensorRT для максимальной производительности.
- Удобный фреймворк: Поддерживается обширной документацией, учебными пособиями и сильным сообществом, что снижает порог вхождения как для новичков, так и для экспертов.
- Поддержка нескольких задач: Одна модель YOLO11 может быть обучена для различных задач компьютерного зрения, что снижает сложность и время разработки.
Слабые стороны
- Компромиссы производительности CPU: Будучи высоко оптимизированными для GPU, более крупные модели YOLO11 могут работать медленнее в средах только с CPU по сравнению с самыми маленькими вариантами EfficientDet.
- Обнаружение мелких объектов: Как и другие одноэтапные детекторы, иногда может испытывать трудности при обнаружении очень маленьких или сильно заслоненных объектов в плотных сценах, хотя с каждой версией вносятся постоянные улучшения.
Производительность и сравнительное тестирование
Сравнение производительности на наборе данных COCO val2017 подчеркивает различные философии проектирования EfficientDet и YOLO11. EfficientDet превосходит в теоретической эффективности (mAP на параметр/FLOP), особенно с его меньшими моделями. Однако, когда дело доходит до практического развертывания, особенно на GPU, YOLO11 демонстрирует явное преимущество в скорости инференса.
Например, YOLO11s достигает сопоставимого mAP (47.0) с EfficientDet-d3 (47.5), но с ошеломляющей в 2.9 раза более высокой скоростью инференса на T4 GPU. Самая большая модель, YOLO11x, превосходит все модели EfficientDet по точности (54.7 mAP), оставаясь при этом значительно быстрее на GPU, чем даже модели EfficientDet среднего размера. Это делает YOLO11 превосходным выбором для приложений, где инференс в реальном времени имеет решающее значение.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Идеальные варианты использования
EfficientDet
EfficientDet лучше всего подходит для сценариев, где вычислительные ресурсы являются основным узким местом, а оптимизация GPU менее важна.
- Академические исследования: Отлично подходит для исследований, посвященных эффективности модели и проектированию архитектуры.
- Приложения, ограниченные ресурсами CPU: Меньшие варианты (D0-D2) могут хорошо работать в средах без выделенных GPU.
- Экономичное облачное развертывание: Где оплата напрямую связана с FLOPs или использованием CPU.
YOLO11
YOLO11 превосходно подходит для широкого спектра реальных приложений, требующих высокой точности, скорости и эффективности разработки.
- Автономные системы: Обеспечение робототехники и автомобилей с автоматическим управлением восприятием с низкой задержкой.
- Безопасность и видеонаблюдение: Обеспечение мониторинга в реальном времени для систем безопасности и общественной безопасности.
- Промышленная автоматизация: Используется для высокоскоростного контроля качества и обнаружения дефектов на производственных линиях.
- Аналитика розничной торговли: Приложения для таких задач, как управление запасами и анализ поведения клиентов.
Заключение
EfficientDet — это знаковая архитектура, которая расширила границы эффективности модели. Его масштабируемая конструкция остается ценным вкладом в эту область, особенно для сред с ограниченными ресурсами.
Однако для разработчиков и исследователей, ищущих современное, универсальное и удобное решение, Ultralytics YOLO11 — очевидный выбор. Он предлагает превосходное сочетание точности и скорости в реальных условиях, особенно на современном оборудовании. Ключевые преимущества YOLO11 заключаются не только в его производительности, но и в надежной экосистеме, которая его окружает. Оптимизированный API, обширная документация, многозадачные возможности и активная поддержка сообщества значительно ускоряют жизненный цикл разработки и развертывания, что делает его наиболее практичным и мощным вариантом для решения широкого круга задач компьютерного зрения сегодня.
Изучите другие модели
Для дальнейшего изучения рассмотрите эти сравнения с другими современными моделями:
- YOLO11 vs. YOLOv10
- YOLO11 против YOLOv9
- YOLO11 vs. RT-DETR
- EfficientDet против YOLOv8
- EfficientDet против YOLOX