Перейти к содержанию

EfficientDet против YOLOv8: техническое сравнение гигантов обнаружения объектов

В быстро развивающейся области компьютерного зрения выбор правильной архитектуры имеет решающее значение для успеха проекта. В данном анализе сравниваются две влиятельные модели: EfficientDet, исследовательская веха от Google , сфокусированная на эффективности параметров, и YOLOv8современная модель от Ultralytics , разработанная для приложений реального времени и простоты использования.

В то время как EfficientDet представила новаторские концепции масштабирования моделей, новые архитектуры, такие как YOLOv8 и передовая YOLO11 с тех пор переосмыслили стандарты скорости, точности и универсальности развертывания.

Метрики производительности: Скорость, точность и эффективность

При выборе модели для производства разработчики должны взвесить компромисс между задержкой вывода и точностью обнаружения. В таблице ниже представлено прямое сравнение показателей производительности на наборе данныхCOCO .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Анализ данных

Показатели свидетельствуют о явном расхождении в философии проектирования. EfficientDet минимизирует FLOPs (операции с плавающей запятой), что исторически коррелирует с теоретической эффективностью. Однако в практических сценариях вычислений в реальном времени - в частности, на GPU - YOLOv8 демонстрирует значительное преимущество.

  • Задержка наGPU : YOLOv8n примерно в 2,6 раза быстрее, чем EfficientDet-d0 на GPU T4 с TensorRT. TensorRTнесмотря на то, что FLOPs немного выше. Это объясняется тем, что архитектура YOLOv8 оптимизирована для аппаратного параллелизма, в то время как разделяемые по глубине свертки EfficientDet могут быть ограничены памятью на ускорителях.
  • Точность в масштабе: На более высоком уровне YOLOv8x достигает превосходной точности mAP 53,9 при скорости вывода 14,37 мс, значительно превосходя EfficientDet-d7, который отстает на 128,07 мс при аналогичной точности.
  • Размер модели: YOLOv8n требует меньше параметров (3,2 М), чем самый маленький EfficientDet (3,9 М), что делает его очень эффективным для хранения данных в мобильных приложениях.

Эффективность в сравнении с задержкой

Низкое количество FLOP не всегда равно быстрому выполнению. EfficientDet сильно оптимизирован для теоретической стоимости вычислений, но YOLOv8 более эффективно использует возможности параллельной обработки современных графических процессоров (например, NVIDIA T4/A100), что приводит к более низкой задержке в реальном мире.

Философия архитектуры и дизайна

Понимание архитектурных нюансов объясняет разницу в производительности, о которой говорилось выше.

EfficientDet Details

EfficientDet построен по принципу Compound Scaling, который равномерно масштабирует разрешение, глубину и ширину сети. Она использует основу EfficientNet и представляет BiFPN (Bidirectional Feature Pyramid Network). BiFPN позволяет объединять взвешенные признаки, определяя, какие из них наиболее важны. Хотя это обеспечивает высокую эффективность параметров, сложные нерегулярные связи BiFPN могут быть вычислительно дорогими для выполнения на оборудовании, которое предпочитает регулярные схемы доступа к памяти.

Узнайте больше об EfficientDet

YOLOv8 Подробнее

  • Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
  • Организация:Ultralytics
  • Дата: Январь 2023 года
  • Репозиторий:Ultralytics GitHub

YOLOv8 представляет собой переход к безъякорному механизму обнаружения, упрощая процесс обучения за счет устранения необходимости ручного расчета якорных блоков. В ней используется основа CSPDarknet, модифицированная модулями C2f, которые улучшают градиентный поток и богатство признаков по сравнению с предыдущими версиями. Головка использует раздельную структуру, обрабатывая задачи классификации и регрессии независимо друг от друга, и применяет Task Aligned Assign для динамического присвоения меток. Эта архитектура специально разработана для максимизации производительности на оборудовании GPU .

Узнайте больше о YOLOv8

Преимущество Ultralytics

Хотя EfficientDet - это выдающееся академическое достижение, экосистема Ultralytics , окружающая YOLOv8 и YOLO11 предлагает ощутимые преимущества для разработчиков, сосредоточенных на доставке продуктов и MLOps.

1. Простота использования и внедрения

Реализация EfficientDet часто требует навигации по сложным конфигурационным файлам и зависимостям в экосистеме TensorFlow . В отличие от этого, в моделях Ultralytics приоритет отдается опыту разработчиков. Модель можно загрузить, обучить и развернуть всего за несколько строк на языке Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
detection = model("https://ultralytics.com/images/bus.jpg")

2. Универсальность в решении различных задач

EfficientDet - это прежде всего архитектура обнаружения объектов. Ultralytics YOLOv8 выходит далеко за рамки простых ограничительных рамок. В рамках одной и той же структуры пользователи могут выполнять:

3. Тренировка и эффективность памяти

Обучение современных трансформаторов или сложных многомасштабных архитектур может потребовать значительных ресурсов. Модели Ultralytics YOLO известны своей эффективностью использования памяти.

  • Низкое потребление VRAM: Эффективные модули C2f и оптимизированные функции потерь позволяют YOLOv8 обучаться на графических процессорах потребительского класса, где другие модели могут столкнуться с ошибками Out-Of-Memory (OOM).
  • Быстрая конвергенция: Передовые методы дополнения, такие как Mosaic, ускоряют обучение, сокращая количество эпох, необходимых для достижения высокой точности.

Интегрированная экосистема

Модели Ultralytics легко интегрируются с такими инструментами, как Weights & Biases, Cometи ClearML для отслеживания экспериментов, а также Roboflow для управления наборами данных.

Приложения в реальном мире

Выбор между этими моделями часто диктует целесообразность развертывания в конкретных средах.

  • Примеры использования EfficientDet: Высокая эффективность параметра делает его интересным для академических исследований законов масштабирования или строго CPU старых систем, где FLOP являются жестким ограничением, хотя задержка все равно может быть выше, чем YOLOv8n.
  • Примеры использования YOLOv8 :
    • Автономные системы: Высокий FPS (количество кадров в секунду) на устройствах Edge AI, таких как NVIDIA Jetson, делает YOLOv8 идеальным для беспилотников и робототехники.
    • Производство: Используется для обнаружения дефектов в режиме реального времени на сборочных линиях, где счет идет на миллисекунды.
    • Интеллектуальная розничная торговля: Такие возможности, как подсчет и отслеживание объектов, позволяют проводить расширенную аналитику для планировки магазинов и управления очередями.

Заключение

EfficientDet остается значительным вкладом в область Deep Learning, доказывая, что интеллектуальное масштабирование позволяет создавать компактные модели. Однако для подавляющего большинства практических приложений сегодня, Ultralytics YOLOv8 (и более новая версия YOLO11) предлагает превосходное решение.

Сочетание молниеносной скорости вычислений на современном оборудовании, всеобъемлющего SDK на Python и способности решать множество задач технического зрения делает модели Ultralytics рекомендованным выбором для разработчиков. Независимо от того, создаете ли вы систему охранной сигнализации или анализируете спутниковые снимки, экосистема Ultralytics предоставляет инструменты для эффективного продвижения вашего проекта от концепции до производства.

Изучите другие модели

Чтобы получить более широкое представление о возможностях обнаружения объектов, рассмотрите эти сравнения:


Комментарии