EfficientDet против YOLOv9: техническое сравнение
Выбор оптимальной модели обнаружения объектов имеет решающее значение для задач компьютерного зрения, балансируя точность, скорость и вычислительные ресурсы. На этой странице представлено подробное техническое сравнение EfficientDet от Google и Ultralytics YOLOv9, двух важных моделей в области обнаружения объектов. Мы углубимся в их архитектурные проекты, эталонные показатели производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение для ваших проектов.
EfficientDet: Масштабируемая и эффективная архитектура
EfficientDet был представлен в 2019 году исследователями из Google Research и быстро стал эталоном для эффективного обнаружения объектов. Он предложил семейство моделей, которые могли масштабироваться от легких, совместимых с периферийными устройствами версий до высокоточных, облачных версий, используя систематический метод сложного масштабирования.
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация: Google
- Дата: 20.11.2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Архитектура и ключевые особенности
Архитектура EfficientDet построена на трех ключевых компонентах:
- EfficientNet Backbone: В качестве основы для извлечения признаков используется высокоэффективная сеть EfficientNet, которая была разработана с использованием поиска нейронной архитектуры (NAS) для оптимизации как точности, так и FLOPs.
- BiFPN (Bi-directional Feature Pyramid Network): Вместо традиционной FPN, EfficientDet использует BiFPN, которая обеспечивает более насыщенное объединение многомасштабных признаков со взвешенными соединениями, повышая точность с минимальными вычислительными затратами.
- Комплексное масштабирование (Compound Scaling): Новый метод, который равномерно масштабирует глубину, ширину и разрешение backbone, сети признаков и detection head. Это позволяет создать семейство моделей (от D0 до D7), которые удовлетворяют различным ограничениям ресурсов.
Сильные стороны
- Масштабируемость: Основной сильной стороной EfficientDet является семейство моделей, которое предоставляет широкий спектр опций для различных целей развертывания, от мобильных устройств до центров обработки данных.
- Новаторская эффективность: На момент выпуска он установил новый стандарт эффективности, достигнув высокой точности с меньшим количеством параметров и FLOPs, чем конкурирующие модели.
Слабые стороны
- Возраст и производительность: Несмотря на то, что архитектура является основополагающей, она датируется 2019 годом. Более новые модели, такие как YOLOv9, превзошли ее как по скорости, так и по точности, особенно на современном оборудовании, таком как GPU.
- Скорость инференса: Более крупные модели EfficientDet могут быть медленными, особенно по сравнению с высокооптимизированными скоростями инференса моделей YOLO.
- Специфичность задачи: EfficientDet разработан исключительно для обнаружения объектов, ему не хватает встроенной универсальности для других задач, таких как сегментация экземпляров или оценка позы, которые есть в современных фреймворках.
- Экосистема: Официальный репозиторий меньше ориентирован на удобство использования и не так активно поддерживается, как комплексная экосистема Ultralytics.
Случаи использования
EfficientDet по-прежнему является жизнеспособным вариантом для:
- Приложения, где конкретная компромиссная точка, предлагаемая одним из его масштабированных вариантов (D0-D7), идеально подходит.
- Проекты, требующие развертывания на CPU, где его небольшие модели показывают конкурентоспособную производительность.
- Устаревшие системы, в которых модель уже интегрирована и работает адекватно.
Узнайте больше об EfficientDet
YOLOv9: Современная точность и эффективность
Ultralytics YOLOv9, представленная в 2024 году Chien-Yao Wang и Hong-Yuan Mark Liao, представляет собой значительный прогресс в обнаружении объектов в реальном времени. Она решает проблему потери информации в глубоких сетях с помощью инновационных архитектурных элементов, устанавливая новые современные стандарты.
- Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
- Организация: Institute of Information Science, Academia Sinica, Taiwan
- Дата: 21.02.2024
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Документация: https://docs.ultralytics.com/models/yolov9/
Архитектура и ключевые особенности
Превосходная производительность YOLOv9 обусловлена двумя основными инновациями:
- Программируемая градиентная информация (PGI): Эта концепция разработана для решения проблемы информационного узкого места в глубоких нейронных сетях. PGI генерирует надежные градиенты, чтобы гарантировать, что модель может изучать полную информацию, что приводит к более точному представлению признаков.
- Обобщенная эффективная сеть агрегации слоев (GELAN): YOLOv9 представляет GELAN, новую и высокоэффективную архитектуру, основанную на принципах CSPNet и ELAN. Она оптимизирует использование параметров и вычислительную эффективность, позволяя модели достигать более высокой точности с меньшими ресурсами.
Сильные стороны
- Современная точность: YOLOv9 достигает превосходной точности в обнаружении объектов, превосходя конкурентов, таких как EfficientDet, при аналогичном или меньшем количестве параметров, как подробно описано в статье "YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information".
- Исключительный баланс производительности: Он предлагает выдающийся компромисс между точностью, скоростью инференса и размером модели, что делает его подходящим для широкого спектра приложений, от периферийного AI до высокопроизводительных облачных серверов.
- Простота использования: При использовании в рамках Ultralytics, YOLOv9 выигрывает от оптимизированного пользовательского интерфейса, простого Python API и обширной документации.
- Хорошо поддерживаемая экосистема: Экосистема Ultralytics обеспечивает активную разработку, большое и поддерживающее сообщество, частые обновления и интеграцию с такими инструментами, как Ultralytics HUB, для обучения без кода и MLOps.
- Эффективность обучения: Модели YOLO обычно имеют более низкие требования к памяти во время обучения по сравнению с другими архитектурами. Фреймворк предлагает эффективные процессы обучения и готовые предварительно обученные веса.
- Универсальность: Хотя в оригинальной статье основное внимание уделяется обнаружению, базовая архитектура GELAN является универсальной. В оригинальном репозитории упоминается поддержка таких задач, как сегментация экземпляров и паноптическая сегментация, что соответствует многозадачным возможностям других моделей Ultralytics, таких как YOLOv8.
Слабые стороны
- Новизна: Поскольку это более новая модель, примеров развертывания в реальных условиях может быть меньше, чем для более старых, устоявшихся моделей, таких как EfficientDet, хотя внедрение в сообществе Ultralytics происходит быстро.
- Ресурсы для обучения: Несмотря на вычислительную эффективность для своего уровня производительности, обучение самых больших вариантов YOLOv9 (например, YOLOv9-E) все равно может потребовать значительных вычислительных ресурсов.
Случаи использования
YOLOv9 особенно хорошо подходит для приложений, где точность и эффективность имеют первостепенное значение, например:
- Анализ изображений с высоким разрешением, например, в спутниковых снимках.
- Комплексное понимание сцен, необходимое в автономных транспортных средствах и робототехнике.
- Детальное распознавание объектов для таких задач, как контроль качества в производстве.
Анализ производительности: YOLOv9 против EfficientDet
В следующей таблице представлено прямое сравнение показателей производительности для различных размеров моделей EfficientDet и YOLOv9, протестированных на наборе данных COCO.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Из данных вытекает несколько ключевых выводов:
- Точность и эффективность: YOLOv9 неизменно предлагает лучший компромисс. Например, YOLOv9-C достигает более высокого mAP (53,0), чем EfficientDet-D6 (52,6), имея примерно вдвое меньше параметров и FLOPs.
- Скорость инференса: На современной GPU с оптимизацией TensorRT модели YOLOv9 значительно быстрее. YOLOv9-E более чем в 7 раз быстрее, чем EfficientDet-D7, и при этом более точная. Даже самая маленькая модель YOLOv9t намного быстрее, чем самая маленькая EfficientDet-d0.
- Использование ресурсов: Модели YOLOv9 более эффективны с точки зрения параметров. YOLOv9-S (7,1 млн параметров) превосходит по точности EfficientDet-D3 (12,0 млн параметров). Эта эффективность имеет решающее значение для развертывания на устройствах с ограниченными ресурсами.
Заключение и рекомендации
В то время как EfficientDet была новаторской моделью, которая расширила границы эффективности, область компьютерного зрения быстро продвинулась вперед. Для новых проектов, начинающихся сегодня, YOLOv9 является очевидным выбором. Она обеспечивает современную точность, превосходную скорость инференса на современном оборудовании и большую вычислительную эффективность.
Интеграция YOLOv9 в экосистему Ultralytics еще больше укрепляет ее преимущество, предоставляя разработчикам удобную, хорошо поддерживаемую и универсальную платформу, которая ускоряет весь рабочий процесс от обучения до развертывания. EfficientDet остается исторически важной моделью и может быть подходящей для поддержания устаревших систем, но для новых высокопроизводительных приложений YOLOv9 предлагает решающее преимущество.
Изучите другие модели
Если вы изучаете различные современные модели, обязательно ознакомьтесь с другими страницами сравнения: