Перейти к содержанию

EfficientDet vs. PP-YOLOE+: техническое сравнение

В эволюции компьютерного зрения немногие сравнения так ярко подчеркивают смену философии проектирования, как контраст между EfficientDet от Google и PP-YOLOE+ от Baidu. В то время как EfficientDet стал важной вехой в эффективности параметров за счет масштабирования соединений, PP-YOLOE+ представляет собой современную эру высокоскоростного обнаружения без привязки, оптимизированного для выводов GPU .

В данном анализе рассматриваются их архитектуры, показатели производительности и практические приложения, чтобы помочь разработчикам выбрать подходящий инструмент для конкретных задач по обнаружению объектов.

Прямой анализ производительности

За время, прошедшее с момента выпуска этих двух моделей, ситуация с производительностью значительно изменилась. EfficientDet фокусируется на минимизации FLOP (операций с плавающей запятой) и количества параметров, что делает ее теоретически эффективной. Однако PP-YOLOE+ разработана для практической скорости вычислений на аппаратных ускорителях, таких как GPU, с использованием оптимизаций TensorRT .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Полученные данные позволяют сделать важный вывод: в то время как EfficientDet-d0 является легким, более крупные варианты (d5-d7) страдают от значительных задержек. И наоборот, PP-YOLOE+l достигает средней точности (mAP), сравнимой с EfficientDet-d6 (52,9 против 52,6), но работает в 10 раз быстрее на GPU T4 (8,36 мс против 89,29 мс).

EfficientDet: Масштабируемая эффективность

EfficientDet был представлен командой Google Brain AutoML с целью преодолеть ограничения эффективности предыдущих детекторов. Он построен на основе EfficientNet, применяя метод комбинированного масштабирования, который равномерно масштабирует разрешение, глубину и ширину.

Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le
Organization:Google
Дата: 2019-11-20
Arxiv:1911.09070
GitHub:google
Docs:README

Основные архитектурные особенности

  1. BiFPN (Bidirectional Feature Pyramid Network): В отличие от традиционных FPN, BiFPN позволяет легко объединять многомасштабные признаки. Она вводит обучаемые веса для изучения важности различных входных признаков, многократно применяя многомасштабное слияние признаков сверху вниз и снизу вверх.
  2. Составное масштабирование: Единый коэффициент $\phi$ управляет шириной, глубиной и разрешением сети, что позволяет создать семейство моделей (от D0 до D7), ориентированных на различные ограничения ресурсов.

Сильные и слабые стороны

  • Сильные стороны: отличная эффективность по параметрам; эффективен для процессоров с низким энергопотреблением, где FLOP являются основным узким местом; высокоструктурированный подход к масштабированию.
  • Слабые стороны: Сложные соединения в BiFPN и разделяемые по глубине свертки часто занимают много памяти на GPU, что приводит к более медленному времени вывода в реальном мире, несмотря на низкое количество FLOP.

Знаете ли вы?

Широкое использование в EfficientDet глубинных сепарабельных сверток значительно сокращает количество параметров, но может привести к снижению загрузки GPU по сравнению со стандартными свертками, используемыми в моделях типа YOLO.

Узнайте больше об EfficientDet

PP-YOLOE+: Безъякорный челленджер

PP-YOLOE+, выпущенный компанией Baidu в рамках экосистемы PaddlePaddle , является эволюцией PP-YOLOv2. Его цель - превзойти характеристики YOLOv5 и YOLOX за счет использования полностью безъякорного механизма и передовых стратегий обучения.

Авторы: Авторы PaddlePaddle
Организация:Baidu
Дата: 2022-04-02
Arxiv:2203.16250
GitHub:PaddlePaddle
Docs:PP-YOLOE+ Configs

Основные архитектурные особенности

  1. Безъякорная конструкция: Благодаря отсутствию предопределенных якорных ящиков PP-YOLOE+ упрощает головку обнаружения и снижает нагрузку на настройку гиперпараметров.
  2. CSPRepResNet: В качестве основы используется RepResBlock, который объединяет преимущества остаточных связей во время обучения и перепараметризует их в оптимизированную структуру для вывода.
  3. TAL (Task Alignment Learning): Усовершенствованная стратегия присвоения меток, которая динамически согласовывает оценку классификации и качество локализации.

Сильные и слабые стороны

  • Сильные стороны: современная точность на наборе данныхCOCO ; чрезвычайно высокая скорость работы на оборудовании TensorRT; инновационный дизайн головы.
  • Слабые стороны: Сильно привязан к фреймворку PaddlePaddle , что может создать проблемы с интеграцией для команд, стандартизированных на PyTorch; немного большее количество параметров для небольших моделей по сравнению с EfficientDet-d0.

Преимущество Ultralytics : Единое решение

В то время как EfficientDet обеспечивает теоретическую эффективность, а PP-YOLOE+ - сырую скорость, разработчикам часто требуется решение, в котором производительность сочетается с удобством использования и поддержкой экосистемы. Именно здесь Ultralytics YOLO11 превосходит все остальные.

В отличие от специализированных моделей сравнения, модели Ultralytics разработаны для современного рабочего процесса MLOps, предлагая собственный опыт работы с PyTorch , который легко обучить и развернуть.

Почему стоит выбрать Ultralytics YOLO11?

  • Простота использования: Уделяя особое внимание опыту разработчиков, Ultralytics позволяет перейти от установки к выводам за три строки кода Python . Нет необходимости вручную компилировать сложные библиотеки операторов или конвертировать проприетарные форматы.
  • Универсальность: Один фреймворк поддерживает обнаружение объектов, сегментацию объектов, оценку позы, классификацию и ориентированные граничные поля (OBB).
  • Баланс производительности: YOLO11 оптимизирует компромисс между скоростью и точностью, предоставляя возможность делать выводы в реальном времени как на Edge-устройствах (например, Jetson), так и на облачных GPU.
  • Требования к памяти: Модели Ultralytics YOLO используют оптимизированные архитектуры, которые обычно требуют меньше памяти CUDA во время обучения по сравнению с альтернативами на основе трансформаторов или старыми многомасштабными сетями признаков.
  • Хорошо поддерживаемая экосистема: Опираясь на активное сообщество разработчиков, репозиторий получает частые обновления, обеспечивающие совместимость с последними версиями PyTorch, CUDA и Python.
  • Эффективность обучения: Пользователи могут использовать легкодоступные предварительно обученные веса для быстрой настройки моделей на пользовательских наборах данных, что значительно снижает требования к обучающим данным и затраты на вычисления.

Пример кода: Начало работы с YOLO11

Запуск современной модели не должен быть сложным. Вот как легко вы можете реализовать обнаружение объектов с помощью Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Узнайте больше о YOLO11

Заключение

Выбор между EfficientDet и PP-YOLOE+ во многом зависит от ваших аппаратных ограничений и требований, предъявляемых законодательством.

  • EfficientDet остается актуальным эталоном для исследований в области параметрически эффективного масштабирования и подходит для специфических сценариев CPU, когда пропускная способность памяти ограничена.
  • PP-YOLOE+ - это лучший выбор для развертывания высокопроизводительных GPU , предлагающий значительно лучшие компромиссы между задержкой и точностью, если вам удобно ориентироваться в экосистеме PaddlePaddle .

Однако для подавляющего большинства реальных приложений - от аналитики в "умных городах" до мониторинга сельского хозяйства -Ultralytics YOLO11 является наиболее прагматичным выбором. Он сочетает в себе архитектурные инновации современных безъякорных детекторов с непревзойденным пользовательским интерфейсом, позволяя вам сосредоточиться на решении бизнес-задач, а не на отладке тонкостей фреймворка.

Откройте для себя другие модели

Чтобы узнать больше, ознакомьтесь с этими сравнительными характеристиками:


Комментарии