EfficientDet против YOLO: детальное сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов - критически важное решение для проектов в области компьютерного зрения, поскольку различные модели предлагают уникальные преимущества в точности, скорости и эффективности. На этой странице представлено подробное техническое сравнение EfficientDet и YOLO, двух выдающихся моделей в области обнаружения объектов. Мы анализируем их архитектуры, эталоны производительности и пригодность для различных приложений, чтобы помочь вам сделать осознанный выбор.
EfficientDet
EfficientDet был представлен компанией Google в 2019 году и известен своей эффективностью и масштабируемостью при обнаружении объектов. Он достигает современной точности при значительно меньшем количестве параметров и FLOP по сравнению со многими современными детекторами.
Архитектура и ключевые особенности
EfficientDet использует ряд архитектурных инноваций для повышения эффективности и точности:
- Магистральная сеть: В качестве опорной сети используется EfficientNet, известная своей эффективностью и масштабируемостью, достигаемой за счет поиска нейронной архитектуры.
- BiFPN (Bi-directional Feature Pyramid Network): Взвешенная двунаправленная сеть пирамид признаков, обеспечивающая эффективное и действенное слияние разномасштабных признаков.
- Составное масштабирование: Систематическое масштабирование всех измерений детектора (основа, сеть признаков, разрешение сети предсказания блоков/классов) с помощью коэффициента соединения.
Показатели производительности
Модели EfficientDet бывают разных размеров (от d0 до d7), предлагая различные компромиссы в производительности для разных вычислительных ресурсов.
- mAP: Достигает высокой средней точности (mAP) на наборе данных COCO, демонстрируя высокую точность обнаружения.
- Скорость вывода: Предлагает ряд скоростей вывода в зависимости от размера модели, причем модели меньшего размера подходят для приложений реального времени.
- Размер модели: Модели EfficientDet спроектированы с учетом параметров, что позволяет уменьшить размеры модели по сравнению с другими высокоточными детекторами.
Сильные и слабые стороны
Сильные стороны:
- Высокая эффективность: Отличный баланс между точностью и вычислительными затратами, что делает его подходящим для сред с ограниченными ресурсами.
- Масштабируемость: Компаунд-масштабирование позволяет легко масштабировать модель для достижения желаемых уровней производительности.
- Точность: Достижение современной точности при меньшем количестве параметров.
- Хорошо документированная реализация: Репозиторий AutoML от Google предоставляет четкую реализацию и предварительно обученные модели.
Слабые стороны:
- Сложность: Стратегии BiFPN и комбинированного масштабирования добавляют сложности архитектуре.
- Скорость вывода: Несмотря на эффективность, скорость вывода может быть не такой высокой, как у некоторых детекторов реального времени, таких как модели Ultralytics YOLO , особенно для больших вариантов EfficientDet.
Примеры использования
EfficientDet хорошо подходит для приложений, где важны и точность, и эффективность:
- Мобильные и пограничные устройства: Благодаря своей эффективности она может быть развернута на мобильных устройствах и пограничных вычислительных платформах.
- Робототехника: Подходит для робототехнических приложений, требующих точного и эффективного обнаружения объектов.
- Приложения с ограниченными ресурсами: Идеально подходит для сценариев, в которых вычислительные ресурсы ограничены, но при этом требуется высокая точность.
Узнайте больше об EfficientDet
DAMO-YOLO
YOLO, представленный компанией Alibaba Group в 2022 году, предназначен для высокоскоростного и точного обнаружения объектов, особенно в промышленных условиях. В нем объединены несколько новых технологий для достижения баланса скорости и точности.
Архитектура и ключевые особенности
Архитектура YOLO включает в себя несколько инновационных компонентов:
- Магистраль на основе NAS: Используется магистраль поиска на основе нейронной архитектуры (NAS), оптимизированная с точки зрения скорости и точности.
- RepGFPN (Reparameterized Gradient Feature Pyramid Network): Эффективная сеть слияния признаков, которая улучшает представление признаков, сохраняя при этом эффективность вычислений.
- ZeroHead: легкая головка обнаружения, разработанная для минимизации задержек.
- AlignedOTA (Aligned Optimal Transport Assignment): Усовершенствованная стратегия назначения для повышения уровня подготовки и точности.
Показатели производительности
Модели YOLO выпускаются в разных размерах (t, s, m, l), чтобы удовлетворить различные потребности в производительности.
- mAP: Достигнута конкурентоспособная mAP на наборе данных COCO, демонстрирующая высокую производительность обнаружения объектов.
- Скорость вывода: Приоритет отдается высокой скорости вывода, что делает его подходящим для приложений, работающих в режиме реального времени и чувствительных к задержкам.
- Размер модели: Разработана с целью обеспечения эффективности, предлагая хороший баланс между размером модели и производительностью.
Сильные и слабые стороны
Сильные стороны:
- Высокая скорость: Исключительная скорость вывода, оптимизированная для приложений реального времени.
- Промышленная направленность: Специально разработаны для промышленного применения с упором на практическое внедрение.
- Точность: Поддерживает высокую точность при высокой скорости вывода.
- Передовые технологии: Интеграция передовых технологий, таких как NAS-магистраль и AlignedOTA, для повышения производительности.
- Открытый исходный код: Публичный доступ с кодом и предварительно обученными моделями.
Слабые стороны:
- Относительно новая: Поскольку это новая модель, сообщество и экосистема могут все еще развиваться по сравнению с более устоявшимися моделями.
- Сложность: Интеграция нескольких передовых технологий может сделать архитектуру сложной для модификации или глубокой настройки.
Примеры использования
YOLO особенно эффективна в сценариях, требующих обнаружения объектов в реальном времени с высокой точностью:
- Промышленная инспекция: Идеально подходит для контроля качества и инспекции в производственных процессах.
- Автономное вождение: Подходит для автономных транспортных средств и передовых систем помощи водителю (ADAS), где низкая задержка является критически важной.
- Видеоаналитика в реальном времени: Такие приложения, как мониторинг дорожного движения и системы безопасности.
- Edge AI: развертывание на пограничных устройствах для обработки данных в режиме реального времени.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Заключение
EfficientDet и YOLO - это мощные модели обнаружения объектов с разными достоинствами. EfficientDet обеспечивает ряд эффективных моделей с высокой точностью, что делает ее универсальной для различных приложений, особенно с ограниченными ресурсами. YOLO, с другой стороны, разработана для высокоскоростных выводов без существенного снижения точности, что делает ее идеальной для промышленных и краевых приложений реального времени.
Для пользователей, заинтересованных в других высокопроизводительных моделях обнаружения объектов, Ultralytics предлагает ряд моделей YOLO , включая YOLOv5, YOLOv8и новейшую YOLO11. Сравнение с другими моделями, подобными YOLOX, также доступно, чтобы помочь вам найти лучшую модель для ваших конкретных потребностей. Рассмотрите возможность использования Ultralytics HUB для упрощенного обучения и развертывания моделей YOLO .