Перейти к содержанию

EfficientDet vs. PP-YOLOE+: техническое сравнение

Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое балансирует точность, скорость инференса и вычислительные затраты. На этой странице представлено подробное техническое сравнение между EfficientDet и PP-YOLOE+, двумя очень влиятельными моделями, разработанными Google и Baidu, соответственно. Мы изучим их архитектурные философии, эталонные показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для вашего проекта.

EfficientDet: Масштабируемость и эффективность

EfficientDet, представленный командой Google Brain, представляет собой семейство моделей обнаружения объектов, разработанных для исключительной эффективности параметров и вычислений. Он достигает этого за счет систематического масштабирования глубины, ширины и разрешения модели с использованием нового метода составного масштабирования.

Архитектура и ключевые особенности

Архитектура EfficientDet построена на трех основных инновациях:

  • EfficientNet Backbone: В качестве основы для извлечения признаков используется высокоэффективная сеть EfficientNet, которая также была разработана с использованием подхода составного масштабирования.
  • BiFPN (Bi-directional Feature Pyramid Network): Для объединения признаков EfficientDet представляет BiFPN, взвешенную двунаправленную сеть пирамиды признаков, которая обеспечивает простое и быстрое объединение многомасштабных признаков. Она определяет важность различных входных признаков и применяет соединения сверху вниз и снизу вверх более эффективно, чем традиционные FPN.
  • Составное масштабирование: Ключевым принципом EfficientDet является метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину backbone, BiFPN и detection head. Это обеспечивает сбалансированное распределение ресурсов по всей модели, что приводит к значительным улучшениям эффективности.

Сильные и слабые стороны

  • Преимущества:

    • Высокая эффективность параметров: Обеспечивает высокую точность при значительно меньшем количестве параметров и FLOPs по сравнению со многими другими архитектурами.
    • Масштабируемость: Семейство моделей (от D0 до D7) предоставляет четкий и эффективный способ масштабирования модели вверх или вниз в зависимости от ограничений ресурсов, от мобильных устройств до крупных облачных серверов.
    • Высокая точность: Достигает конкурентоспособных показателей mAP, особенно если учитывать низкую вычислительную нагрузку.
  • Слабые стороны:

    • Скорость инференса: Несмотря на вычислительную эффективность, ее задержка при прямом инференсе может быть выше, чем у моделей, специально оптимизированных для производительности в реальном времени, таких как серия Ultralytics YOLO.
    • Зависимость от фреймворка: Оригинальная реализация и основная поддержка предназначены для TensorFlow, что может потребовать дополнительных усилий для разработчиков, работающих в экосистеме PyTorch.

Случаи использования

EfficientDet — отличный выбор для приложений, где вычислительные ресурсы и размер модели являются основными ограничениями. Он превосходен в таких сценариях, как:

  • Edge AI: Развертывание на устройствах с ограниченными ресурсами, таких как смартфоны или встроенные системы.
  • Облачные приложения: Экономически эффективное развертывание в облачных средах, где минимизация вычислительных затрат имеет решающее значение.
  • Мобильное зрение: Обеспечение компьютерного зрения на устройстве в мобильных приложениях.

Узнайте больше об EfficientDet

PP-YOLOE+: Оптимизирован для точности и скорости

PP-YOLOE+, разработанный Baidu, является высокопроизводительным одноэтапным детектором объектов из пакета PaddleDetection. Он фокусируется на достижении оптимального баланса между точностью и скоростью, основываясь на архитектуре YOLO с несколькими ключевыми улучшениями.

Архитектура и ключевые особенности

PP-YOLOE+ — это детектор без anchor boxes, который упрощает процесс обнаружения, устраняя необходимость в предварительно определенных anchor boxes. Его ключевые особенности включают в себя:

  • Эффективная согласованная по задачам голова: Использует отделенную голову для задач классификации и локализации и применяет Task Alignment Learning (TAL) для их согласования, что повышает точность обнаружения.
  • Улучшенная базовая сеть и Neck: Модель включает улучшенную базовую сеть и сеть агрегирования путей (Path Aggregation Network, PAN) для эффективного объединения признаков в разных масштабах.
  • Экосистема PaddlePaddle: Он глубоко интегрирован во фреймворк глубокого обучения PaddlePaddle, извлекая выгоду из оптимизаций, доступных в этой экосистеме.

Сильные и слабые стороны

  • Преимущества:

    • Превосходный баланс скорости и точности: Обеспечивает высокие показатели mAP, сохраняя при этом очень высокую скорость инференса, особенно на GPU с оптимизацией TensorRT.
    • Anchor-Free Design: Упрощает структуру модели и уменьшает количество гиперпараметров, требующих настройки.
    • Высокая производительность: Часто превосходит другие модели как по скорости, так и по точности для своего размера.
  • Слабые стороны:

    • Зависимость от экосистемы: Ее основная оптимизация и поддержка предназначены для фреймворка PaddlePaddle, что может создать проблему для пользователей за пределами этой экосистемы.
    • Сообщество и ресурсы: Может иметь меньшее глобальное сообщество и меньше сторонних ресурсов по сравнению с более широко используемыми моделями, такими как модели от Ultralytics.

Случаи использования

PP-YOLOE+ хорошо подходит для приложений, которые требуют как высокой точности, так и быстрой производительности в реальном времени.

Узнайте больше о PP-YOLOE+

Напрямую: Производительность и обучение

При сравнении двух моделей становится очевидной разница в их философии проектирования. EfficientDet отдает приоритет эффективности параметров, в то время как PP-YOLOE+ фокусируется на достижении наилучшего компромисса между скоростью и точностью.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

Из таблицы видно, что модели PP-YOLOE+ стабильно достигают более высокой скорости inference на GPU (T4 TensorRT) и часто более высоких показателей mAP, чем модели EfficientDet сопоставимого или даже большего размера. Например, PP-YOLOE+l достигает 52,9 mAP при 8,36 мс, превосходя EfficientDet-d6, который имеет аналогичное количество параметров, но гораздо более медленное время inference и немного более низкую точность.

Преимущество Ultralytics: Почему модели YOLO выделяются

Хотя EfficientDet и PP-YOLOE+ являются мощными моделями, разработчики, ищущие современную, универсальную и удобную платформу, часто находят более привлекательный выбор в моделях Ultralytics YOLO, таких как YOLOv8 и новейшая Ultralytics YOLO11.

  • Простота использования: Модели Ultralytics разработаны для оптимизации работы пользователей благодаря простому Python API, обширной документации и понятным командам CLI, которые упрощают обучение, проверку и развертывание.
  • Хорошо поддерживаемая экосистема: Экосистема Ultralytics получает преимущества от активной разработки, сильного сообщества с открытым исходным кодом, частых обновлений и простой интеграции с такими инструментами, как Ultralytics HUB, для сквозного MLOps.
  • Баланс производительности: Модели Ultralytics известны своим превосходным компромиссом между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев, от периферийных устройств до облачных серверов.
  • Эффективность использования памяти: Модели Ultralytics YOLO разработаны для эффективного использования памяти во время обучения и инференса, часто требуя меньше памяти CUDA, чем другие архитектуры. Это делает их более доступными для пользователей с ограниченными аппаратными ресурсами.
  • Универсальность: В отличие от однозадачной направленности EfficientDet и PP-YOLOE+, такие модели, как YOLO11, являются многозадачными, поддерживающими обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных объектов (OBB) в рамках единой унифицированной структуры.
  • Эффективность обучения: Пользователи получают выгоду от эффективных процессов обучения, готовых предварительно обученных весов на наборах данных, таких как COCO, и более быстрого времени сходимости.

Заключение

EfficientDet превосходен в приложениях, где эффективность параметров и FLOP является наивысшим приоритетом, предлагая масштабируемое семейство моделей, подходящих для сред с ограниченными ресурсами. PP-YOLOE+ обеспечивает мощное сочетание высокой точности и скорости в реальном времени, особенно для пользователей, работающих в экосистеме PaddlePaddle.

Однако, для большинства современных разработчиков и исследователей модели Ultralytics, такие как YOLOv10 и YOLO11, представляют собой превосходный выбор. Они предлагают современный баланс производительности, очень удобную и хорошо поддерживаемую экосистему и непревзойденную универсальность в различных задачах компьютерного зрения, что делает их идеальным решением для широкого спектра приложений, от исследований до производства.

Сравнения с другими моделями

Для дальнейшего изучения рассмотрите эти сравнения с участием EfficientDet, PP-YOLOE+ и других соответствующих моделей:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии