EfficientDet vs. PP-YOLOE+: техническое сравнение
Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое балансирует точность, скорость инференса и вычислительные затраты. На этой странице представлено подробное техническое сравнение между EfficientDet и PP-YOLOE+, двумя очень влиятельными моделями, разработанными Google и Baidu, соответственно. Мы изучим их архитектурные философии, эталонные показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для вашего проекта.
EfficientDet: Масштабируемость и эффективность
EfficientDet, представленный командой Google Brain, представляет собой семейство моделей обнаружения объектов, разработанных для исключительной эффективности параметров и вычислений. Он достигает этого за счет систематического масштабирования глубины, ширины и разрешения модели с использованием нового метода составного масштабирования.
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация: Google
- Дата: 20.11.2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Архитектура и ключевые особенности
Архитектура EfficientDet построена на трех основных инновациях:
- EfficientNet Backbone: В качестве основы для извлечения признаков используется высокоэффективная сеть EfficientNet, которая также была разработана с использованием подхода составного масштабирования.
- BiFPN (Bi-directional Feature Pyramid Network): Для объединения признаков EfficientDet представляет BiFPN, взвешенную двунаправленную сеть пирамиды признаков, которая обеспечивает простое и быстрое объединение многомасштабных признаков. Она определяет важность различных входных признаков и применяет соединения сверху вниз и снизу вверх более эффективно, чем традиционные FPN.
- Составное масштабирование: Ключевым принципом EfficientDet является метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину backbone, BiFPN и detection head. Это обеспечивает сбалансированное распределение ресурсов по всей модели, что приводит к значительным улучшениям эффективности.
Сильные и слабые стороны
-
Преимущества:
- Высокая эффективность параметров: Обеспечивает высокую точность при значительно меньшем количестве параметров и FLOPs по сравнению со многими другими архитектурами.
- Масштабируемость: Семейство моделей (от D0 до D7) предоставляет четкий и эффективный способ масштабирования модели вверх или вниз в зависимости от ограничений ресурсов, от мобильных устройств до крупных облачных серверов.
- Высокая точность: Достигает конкурентоспособных показателей mAP, особенно если учитывать низкую вычислительную нагрузку.
-
Слабые стороны:
- Скорость инференса: Несмотря на вычислительную эффективность, ее задержка при прямом инференсе может быть выше, чем у моделей, специально оптимизированных для производительности в реальном времени, таких как серия Ultralytics YOLO.
- Зависимость от фреймворка: Оригинальная реализация и основная поддержка предназначены для TensorFlow, что может потребовать дополнительных усилий для разработчиков, работающих в экосистеме PyTorch.
Случаи использования
EfficientDet — отличный выбор для приложений, где вычислительные ресурсы и размер модели являются основными ограничениями. Он превосходен в таких сценариях, как:
- Edge AI: Развертывание на устройствах с ограниченными ресурсами, таких как смартфоны или встроенные системы.
- Облачные приложения: Экономически эффективное развертывание в облачных средах, где минимизация вычислительных затрат имеет решающее значение.
- Мобильное зрение: Обеспечение компьютерного зрения на устройстве в мобильных приложениях.
Узнайте больше об EfficientDet
PP-YOLOE+: Оптимизирован для точности и скорости
PP-YOLOE+, разработанный Baidu, является высокопроизводительным одноэтапным детектором объектов из пакета PaddleDetection. Он фокусируется на достижении оптимального баланса между точностью и скоростью, основываясь на архитектуре YOLO с несколькими ключевыми улучшениями.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Документация: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Архитектура и ключевые особенности
PP-YOLOE+ — это детектор без anchor boxes, который упрощает процесс обнаружения, устраняя необходимость в предварительно определенных anchor boxes. Его ключевые особенности включают в себя:
- Эффективная согласованная по задачам голова: Использует отделенную голову для задач классификации и локализации и применяет Task Alignment Learning (TAL) для их согласования, что повышает точность обнаружения.
- Улучшенная базовая сеть и Neck: Модель включает улучшенную базовую сеть и сеть агрегирования путей (Path Aggregation Network, PAN) для эффективного объединения признаков в разных масштабах.
- Экосистема PaddlePaddle: Он глубоко интегрирован во фреймворк глубокого обучения PaddlePaddle, извлекая выгоду из оптимизаций, доступных в этой экосистеме.
Сильные и слабые стороны
-
Преимущества:
- Превосходный баланс скорости и точности: Обеспечивает высокие показатели mAP, сохраняя при этом очень высокую скорость инференса, особенно на GPU с оптимизацией TensorRT.
- Anchor-Free Design: Упрощает структуру модели и уменьшает количество гиперпараметров, требующих настройки.
- Высокая производительность: Часто превосходит другие модели как по скорости, так и по точности для своего размера.
-
Слабые стороны:
- Зависимость от экосистемы: Ее основная оптимизация и поддержка предназначены для фреймворка PaddlePaddle, что может создать проблему для пользователей за пределами этой экосистемы.
- Сообщество и ресурсы: Может иметь меньшее глобальное сообщество и меньше сторонних ресурсов по сравнению с более широко используемыми моделями, такими как модели от Ultralytics.
Случаи использования
PP-YOLOE+ хорошо подходит для приложений, которые требуют как высокой точности, так и быстрой производительности в реальном времени.
- Промышленная автоматизация: Для таких задач, как контроль качества в производстве и обнаружение дефектов.
- Умная розничная торговля: Обеспечение работы таких приложений, как ИИ для управления запасами и аналитика клиентов.
- Автоматизация переработки: Повышение эффективности переработки за счет идентификации материалов для автоматизированной сортировки.
Напрямую: Производительность и обучение
При сравнении двух моделей становится очевидной разница в их философии проектирования. EfficientDet отдает приоритет эффективности параметров, в то время как PP-YOLOE+ фокусируется на достижении наилучшего компромисса между скоростью и точностью.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Из таблицы видно, что модели PP-YOLOE+ стабильно достигают более высокой скорости inference на GPU (T4 TensorRT) и часто более высоких показателей mAP, чем модели EfficientDet сопоставимого или даже большего размера. Например, PP-YOLOE+l достигает 52,9 mAP при 8,36 мс, превосходя EfficientDet-d6, который имеет аналогичное количество параметров, но гораздо более медленное время inference и немного более низкую точность.
Преимущество Ultralytics: Почему модели YOLO выделяются
Хотя EfficientDet и PP-YOLOE+ являются мощными моделями, разработчики, ищущие современную, универсальную и удобную платформу, часто находят более привлекательный выбор в моделях Ultralytics YOLO, таких как YOLOv8 и новейшая Ultralytics YOLO11.
- Простота использования: Модели Ultralytics разработаны для оптимизации работы пользователей благодаря простому Python API, обширной документации и понятным командам CLI, которые упрощают обучение, проверку и развертывание.
- Хорошо поддерживаемая экосистема: Экосистема Ultralytics получает преимущества от активной разработки, сильного сообщества с открытым исходным кодом, частых обновлений и простой интеграции с такими инструментами, как Ultralytics HUB, для сквозного MLOps.
- Баланс производительности: Модели Ultralytics известны своим превосходным компромиссом между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев, от периферийных устройств до облачных серверов.
- Эффективность использования памяти: Модели Ultralytics YOLO разработаны для эффективного использования памяти во время обучения и инференса, часто требуя меньше памяти CUDA, чем другие архитектуры. Это делает их более доступными для пользователей с ограниченными аппаратными ресурсами.
- Универсальность: В отличие от однозадачной направленности EfficientDet и PP-YOLOE+, такие модели, как YOLO11, являются многозадачными, поддерживающими обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных объектов (OBB) в рамках единой унифицированной структуры.
- Эффективность обучения: Пользователи получают выгоду от эффективных процессов обучения, готовых предварительно обученных весов на наборах данных, таких как COCO, и более быстрого времени сходимости.
Заключение
EfficientDet превосходен в приложениях, где эффективность параметров и FLOP является наивысшим приоритетом, предлагая масштабируемое семейство моделей, подходящих для сред с ограниченными ресурсами. PP-YOLOE+ обеспечивает мощное сочетание высокой точности и скорости в реальном времени, особенно для пользователей, работающих в экосистеме PaddlePaddle.
Однако, для большинства современных разработчиков и исследователей модели Ultralytics, такие как YOLOv10 и YOLO11, представляют собой превосходный выбор. Они предлагают современный баланс производительности, очень удобную и хорошо поддерживаемую экосистему и непревзойденную универсальность в различных задачах компьютерного зрения, что делает их идеальным решением для широкого спектра приложений, от исследований до производства.
Сравнения с другими моделями
Для дальнейшего изучения рассмотрите эти сравнения с участием EfficientDet, PP-YOLOE+ и других соответствующих моделей:
- EfficientDet против YOLOv8
- PP-YOLOE+ vs. YOLOv10
- YOLO11 vs. EfficientDet
- YOLO11 vs. PP-YOLOE+
- RT-DETR против EfficientDet