EfficientDet vs. YOLOv6-3.0: подробное сравнение
Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое напрямую влияет на производительность и эффективность приложений компьютерного зрения. На этой странице представлено подробное техническое сравнение двух влиятельных моделей: EfficientDet, разработанной Google, и YOLOv6-3.0 от Meituan. Хотя обе являются мощными детекторами объектов, они происходят из разных философий проектирования. EfficientDet отдает приоритет масштабируемой эффективности и точности за счет составного масштабирования, тогда как YOLOv6-3.0 — это одноэтапный детектор, разработанный для высокоскоростных промышленных приложений. Мы углубимся в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам сделать осознанный выбор.
Обзор EfficientDet
EfficientDet — это семейство масштабируемых и эффективных моделей обнаружения объектов, представленное командой Google Brain. Он известен достижением высокой точности при сохранении вычислительной эффективности за счет систематического масштабирования архитектуры модели.
Подробности:
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация: Google
- Дата: 20.11.2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Архитектура и ключевые особенности
Конструкция EfficientDet ориентирована на оптимизацию как точности, так и эффективности. К основным нововведениям относятся:
- EfficientNet Backbone: В качестве основы для извлечения признаков используется высокоэффективная сеть EfficientNet. Модели EfficientNet масштабируются с использованием составного метода, который равномерно балансирует глубину, ширину и разрешение сети.
- BiFPN (Bi-directional Feature Pyramid Network): Для объединения признаков EfficientDet представляет BiFPN, новую архитектуру neck. В отличие от традиционных FPN сверху вниз, BiFPN обеспечивает простое и быстрое объединение многомасштабных признаков за счет включения взвешенных соединений, которые определяют важность различных входных признаков.
- Составное масштабирование: Ключевым принципом EfficientDet является метод составного масштабирования. Эта стратегия совместно масштабирует глубину, ширину и разрешение backbone, сети признаков (BiFPN) и detection head, позволяя адаптировать модель к различным ограничениям ресурсов, от EfficientDet-D0 до D7.
Сильные стороны EfficientDet
- Высокая точность: Модели EfficientDet известны своей превосходной точностью, часто превосходя другие модели с аналогичным или даже большим количеством параметров.
- Масштабируемость: Семейство моделей предлагает широкий диапазон размеров (D0-D7), обеспечивая гибкость развертывания на различном оборудовании с разными вычислительными возможностями.
- Эффективность по отношению к точности: Он обеспечивает надежный баланс между точностью и вычислительными затратами (FLOPs), что делает его очень эффективной архитектурой.
Слабые стороны EfficientDet
- Скорость инференса: Как правило, ниже, чем у одноэтапных детекторов, таких как YOLOv6-3.0, особенно у более крупных вариантов. Это может быть ограничением для приложений реального времени.
- Сложность: Архитектура, особенно BiFPN, сложнее, чем более простые одноэтапные детекторы, что может затруднить модификацию или понимание модели.
- Специфичность задачи: EfficientDet в основном разработан для обнаружения объектов, и ему не хватает встроенной универсальности для других задач, таких как сегментация или оценка позы, которые есть в современных фреймворках, таких как Ultralytics YOLO.
Узнайте больше об EfficientDet
Обзор YOLOv6-3.0
YOLOv6-3.0, разработанная компанией Meituan, представляет собой одноэтапную структуру обнаружения объектов, предназначенную для промышленных приложений, с акцентом на баланс между высокой производительностью и эффективностью. Как часть семейства YOLO, задокументированная на нашем сайте, она часто сравнивается с другими моделями, такими как Ultralytics YOLOv8 и YOLOv5.
Подробности:
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
- Организация: Meituan
- Дата: 13.01.2023
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- Документация: https://docs.ultralytics.com/models/yolov6/
Архитектура и ключевые особенности
YOLOv6-3.0 фокусируется на оптимизации скорости инференса без значительного ущерба для точности. Ключевые архитектурные аспекты включают:
- Эффективный backbone: Использует эффективный backbone с репараметризацией для ускорения инференса.
- Гибридный блок: Балансирует точность и эффективность в слоях извлечения признаков.
- Оптимизированная стратегия обучения: Использует улучшенные методы обучения для более быстрой сходимости и повышения производительности.
YOLOv6-3.0 предлагает различные размеры моделей (n, s, m, l) для удовлетворения различных сценариев развертывания, от периферийных устройств с ограниченными ресурсами до высокопроизводительных серверов.
Преимущества YOLOv6-3.0
- Высокая скорость инференса: Оптимизирована для быстрого инференса, что делает ее очень подходящей для приложений реального времени.
- Хорошая точность: Достигает конкурентоспособного mAP, особенно для моделей большего размера.
- Промышленная направленность: Разработана для практического промышленного применения с хорошей поддержкой квантования.
Слабые стороны YOLOv6-3.0
- Точность по сравнению с новыми моделями: Несмотря на хорошие показатели, новые модели, такие как Ultralytics YOLO11, часто обеспечивают лучшее соотношение точности и скорости.
- Ограниченная универсальность: В первую очередь ориентирован на обнаружение объектов, не имея встроенной поддержки других задач компьютерного зрения, таких как сегментация экземпляров, классификация и оценка позы, которые являются стандартными в экосистеме Ultralytics.
- Экосистема и поддержка: Хотя это и открытый исходный код, его экосистема не так всеобъемлюща и активно поддерживается, как платформа Ultralytics, которая предлагает обширную документацию, учебные пособия и бесшовную интеграцию с такими инструментами, как Ultralytics HUB.
Производительность и сравнительное тестирование
При сравнении EfficientDet и YOLOv6-3.0 основным компромиссом является компромисс между точностью и скоростью.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Как показывает таблица, модели YOLOv6-3.0 демонстрируют значительно более высокую скорость инференса на GPU с TensorRT, что делает их очевидным выбором для приложений со строгими требованиями к задержке. Например, YOLOv6-3.0l достигает 52,8 mAP со временем инференса всего 8,95 мс, в то время как сопоставимый EfficientDet-d6 достигает 52,6 mAP, но занимает 89,29 мс—почти в 10 раз медленнее.
С другой стороны, EfficientDet может достигать очень высокого mAP (53.7 для D7), но его задержка при выводе значительно выше, что делает его менее подходящим для обработки видео в реальном времени. Однако для задач автономной обработки, где максимальная точность является целью, а задержка не имеет значения, более крупные модели EfficientDet являются отличным вариантом. Меньшие модели EfficientDet также демонстрируют превосходную эффективность с точки зрения параметров и FLOPs для заданной точности.
Идеальные варианты использования
EfficientDet
EfficientDet лучше всего подходит для приложений, где точность имеет первостепенное значение, а вывод может выполняться в автономном режиме или на мощном оборудовании без строгих ограничений по скорости в реальном времени.
- Анализ медицинской визуализации: Обнаружение опухолей или аномалий на медицинских сканах высокого разрешения, где точность имеет решающее значение.
- Спутниковые снимки: Идентификация объектов или изменений на спутниковых фотографиях для мониторинга окружающей среды или разведки.
- Высокоточный контроль качества: В производстве, для задач детальной инспекции, где скорость вторична по отношению к выявлению каждого дефекта.
YOLOv6-3.0
YOLOv6-3.0 превосходен в сценариях, требующих быстрого и эффективного обнаружения объектов.
- Наблюдение в реальном времени: Мониторинг видеопотоков для систем безопасности или управления дорожным движением.
- Промышленная автоматизация: Быстрый контроль качества на производственных линиях и мониторинг процессов.
- Робототехника и Edge AI: Обнаружение объектов для навигации и взаимодействия на устройствах с ограниченными вычислительными ресурсами, таких как NVIDIA Jetson.
Заключение и рекомендации
EfficientDet и YOLOv6-3.0 — это высокопроизводительные модели обнаружения объектов, но они служат разным потребностям. EfficientDet предлагает отличную точность и масштабируемость, что делает его отличным выбором для критически важных по точности задач, выполняемых не в реальном времени. YOLOv6-3.0 обеспечивает впечатляющую скорость, что делает его идеальным для промышленных приложений и приложений реального времени.
Однако разработчикам и исследователям, ищущим современное решение, сочетающее в себе высокую производительность, универсальность и исключительный пользовательский опыт, мы рекомендуем изучить модели из серии Ultralytics YOLO, такие как последняя версия Ultralytics YOLO11.
Модели Ultralytics предлагают несколько ключевых преимуществ:
- Превосходный баланс производительности: YOLO11 достигает современного компромисса между скоростью и точностью, часто превосходя другие модели по обоим показателям.
- Беспрецедентная универсальность: В отличие от моделей для одной задачи, YOLO11 поддерживает обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию и ориентированные ограничивающие рамки в рамках единого унифицированного фреймворка.
- Простота использования: Благодаря простому Python API, обширной документации и многочисленным руководствам, начать работу с моделями Ultralytics очень просто.
- Развитая экосистема: Воспользуйтесь преимуществами активной разработки, сильного сообщества, частых обновлений и бесшовной интеграции с инструментами MLOps, такими как Ultralytics HUB для оптимизации обучения и развертывания.
- Эффективность обучения: Модели Ultralytics разработаны для эффективного обучения, часто требуя меньше памяти и времени для сходимости, с готовыми предварительно обученными весами на наборе данных COCO.
Несмотря на то, что YOLOv6-3.0 является сильным конкурентом по скорости, а EfficientDet — по точности, Ultralytics YOLO11 предоставляет более целостное и мощное решение для подавляющего большинства современных проектов компьютерного зрения.
Изучите другие модели
Для дальнейшего чтения вас могут заинтересовать другие сравнения с участием этих моделей:
- YOLOv8 vs. EfficientDet
- YOLO11 vs. EfficientDet
- YOLOv5 vs. YOLOv6
- YOLOv7 против YOLOv6
- RT-DETR против EfficientDet