Перейти к содержанию

PP-YOLOE+ против EfficientDet: подробное изучение архитектур обнаружения объектов

При выборе модели для обнаружения объектов часто приходится выбирать между проверенными старыми архитектурами и новыми оптимизированными фреймворками. В этом сравнении рассматриваются технические нюансы между PP-YOLOE+, усовершенствованным детектором без анкоров от Baidu, и EfficientDet, масштабируемой архитектурой Google, в которой было внедрено сложное масштабирование. Хотя обе архитектуры внесли значительный вклад в развитие компьютерного зрения, их подходы к эффективности и точности существенно различаются.

Анализ производительности и тесты

Компромисс между скоростью вывода и точностью обнаружения, который часто измеряется средней средней точностью (mAP), является основным показателем для оценки этих моделей.

В приведенной ниже таблице показано, что PP-YOLOE+ обычно обеспечивает более низкую задержку на GPU благодаря своей TensorRT, тогда как EfficientDet, несмотря на эффективность параметров, часто страдает от более высокой задержки из-за сложных соединений пирамиды функций.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Архитектура и философия проектирования

Основное различие между этими двумя моделями заключается в том, как они обрабатывают слияние и масштабирование признаков.

EfficientDet: Комбинированное масштабирование и BiFPN

Разработанная командой Google , EfficientDet представила концепцию составного масштабирования, которая равномерно масштабирует разрешение, глубину и ширину сети.

Отличительной особенностью EfficientDet является BiFPN (взвешенная двунаправленная пирамидальная сеть). В отличие от стандартной FPN, BiFPN позволяет осуществлять многомасштабное слияние признаков по принципу «сверху вниз» и «снизу вверх». Хотя это приводит к высокой эффективности параметров (низкие FLOP), нерегулярные схемы доступа к памяти BiFPN могут значительно замедлить вывод на GPU, что делает ее менее подходящей для приложений реального времени, несмотря на ее теоретическую эффективность.

PP-YOLOE+: Улучшенное detectирование без anchor-ов

PP-YOLOE+ — это усовершенствованная версия архитектуры PP-YOLOE, разработанная командой Baidu специально для работы в PaddlePaddle .

В этой модели используется парадигма без анкеров, которая устраняет необходимость в заранее определенных анкерных блоках. Она использует базовую структуру CSPRepResStage и стратегию Task Alignment Learning (TAL) для лучшего согласования классификации и локализации. Версия «+» специально вводит уменьшенную базовую структуру (множитель ширины 0,75) и улучшенные стратегии обучения, что делает ее более конкурентоспособной в режиме с низкими параметрами.

Архитектурная эволюция

PP-YOLOE+ представляет собой переход к «перепараметризованным» архитектурам, в которых сложные структуры времени обучения сводятся к более простым блокам времени вывода. Это контрастирует со статической сложностью графа EfficientDet, обеспечивая более высокую скорость развертывания на таком оборудовании, как NVIDIA TensorRT.

Методологии обучения и экосистема

Выбор платформы часто определяет простоту разработки.

  • PP-YOLOE+ тесно связан с PaddlePaddle . Несмотря на свою мощность, пользователи за пределами этой экосистемы могут столкнуться с трудностями при интеграции со стандартными инструментами MLOps или при конвертации моделей для неродных целей развертывания.
  • EfficientDet основан на TensorFlow (в частности, на библиотеке AutoML). Несмотря на широкую поддержку, репозиторий обновляется реже, чем современные YOLO , и для воспроизведения результатов иногда требуется просмотр устаревших цепочек зависимостей.

Напротив, разработчики, для которых приоритетом являются простота использования и хорошо поддерживаемая экосистема, часто обращаются к Ultralytics. Ultralytics позволяет беспрепятственно проводить обучение на PyTorch, обеспечивая надежную интеграцию с такими инструментами, как Weights & Biases и четкие пути для развертывания моделей.

Идеальные варианты использования

Когда следует выбирать EfficientDet

EfficientDet остается актуальным выбором для академических исследований, где строгим ограничением является не задержка, а эффективность параметров. Он также используется в устаревших мобильных приложениях (около 2020 года), где специальные аппаратные ускорители были оптимизированы для блоков типа MobileNet.

Когда следует выбирать PP-YOLOE+

PP-YOLOE+ отлично подходит для сред, в которых GPU имеет решающее значение, например, для промышленного контроля качества или обработки видео на стороне сервера. Его головка без анкера упрощает пространство поиска гиперпараметров по сравнению со старыми методами на основе анкера.

Когда выбирать Ultralytics

Для разработчиков, стремящихся к балансу производительности, скорости и точности с минимальными инженерными затратами, Ultralytics , такие как YOLO11 и новая YOLO26. Эти модели требуют меньшего объема памяти во время обучения по сравнению с детекторами на основе трансформаторов и обеспечивают широкую универсальность, поддерживая такие задачи, как оценка позы и сегментация, без дополнительных настроек.

Кроме того, эффективность обучения Ultralytics повышается за счет легкодоступных предварительно обученных весов и простого API, который абстрагирует сложный шаблонный код.

from ultralytics import YOLO

# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Perform inference on an image
results = model("path/to/image.jpg")

Узнайте больше о YOLO26

Современный стандарт: Ultralytics

Хотя PP-YOLOE+ и EfficientDet стали важными вехами, в этой области произошли значительные изменения. Выпущенная в 2026 году Ultralytics представляет революционные функции, которые устраняют ограничения предыдущих архитектур.

Сквозной дизайн без NMS

В отличие от EfficientDet и большинства YOLO , которые требуют постобработки с помощью алгоритма Non-Maximum Suppression (NMS), YOLO26 изначально является сквозным решением. Эта конструкция, впервые примененная в YOLOv10, устраняет задержки и сложности, связанные с NMS, обеспечивая более быструю и детерминированную скорость вывода, необходимую для пограничного искусственного интеллекта.

Оптимизировано для периферийных устройств и CPU

YOLO26 разработан для широкого применения. Он оснащен функцией удаления DFL (Distribution Focal Loss), которая упрощает график модели для форматов экспорта, таких как ONNX CoreML. В сочетании с оптимизациями, которые обеспечивают до 43% более быстрое CPU , он является лучшим выбором для устройств от Raspberry Pi до мобильных телефонов.

Продвинутое обучение с MuSGD и ProgLoss

Заимствуя инновации из обучения больших языковых моделей (LLM), YOLO26 использует оптимизатор MuSGD— гибрид SGD Muon. Это приводит к более стабильной динамике обучения и более быстрой конвергенции. Кроме того, внедрение ProgLoss и STAL (Soft Task Alignment Learning) значительно улучшает обнаружение мелких объектов, что было слабым местом в более ранних детекторах, таких как EfficientDet-d0.

Специфика задачи

YOLO26 предназначен не только для ограничительных рамок. Он включает в себя специальные усовершенствования, такие как оценка остаточной логарифмической вероятности (RLE) для высокоточной оценки положения и специализированная угловая потеря для задач ориентированных ограничительных рамок (OBB), обеспечивающие точное обнаружение повернутых объектов на аэрофотоснимках.

Заключение

Как PP-YOLOE+, так и EfficientDet предлагают уникальные преимущества в зависимости от конкретных ограничений аппаратного обеспечения и предпочтений в отношении фреймворка. EfficientDet доказывает, что составное масштабирование является мощной теоретической концепцией, в то время как PP-YOLOE+ демонстрирует практические преимущества в скорости работы архитектур без анкеров и с перепараметризацией на графических процессорах.

Однако для комплексного решения, сочетающего в себе современную точность, простоту развертывания и процветающее сообщество, Ultralytics выделяется как лучший выбор. Благодаря своей сквозной архитектуре NMS и встроенной поддержке Ultralytics , он позволяет разработчикам переходить от концепции к производству с непревзойденной эффективностью.

Чтобы изучить другие высокопроизводительные варианты, ознакомьтесь с документацией по YOLO11 или YOLOv10.


Комментарии