Перейти к содержанию

EfficientDet против PP-YOLOE+: техническое сравнение масштабируемых архитектур обнаружения

В конкурентной среде обнаружения объектов немногие соперничества иллюстрируют эволюцию дизайна нейронных сетей лучше, чем контраст между EfficientDet и PP-YOLOE+. В то время как EfficientDet представил миру концепцию составного масштабирования, PP-YOLOE+ усовершенствовал парадигму без анкеров для промышленных приложений.

В данном руководстве представлен подробный технический анализ этих двух влиятельных моделей с оценкой их архитектурных решений, задержки вывода и пригодности для внедрения. Мы также рассмотрим, как современные альтернативы, такие как Ultralytics и YOLO11 , используют эти основы для обеспечения превосходной простоты использования и передовой производительности.

Интерактивные сравнительные тесты производительности

Чтобы понять, какое место эти модели занимают в текущей иерархии компьютерного зрения, ознакомьтесь с приведенной ниже диаграммой. Она визуализирует компромисс между скоростью (задержкой) и точностью (mAP), помогая вам определить оптимальную модель для ваших аппаратных ограничений.

Таблица сравнения метрических единиц

В следующей таблице представлены подробные показатели производительности на наборе COCO . Обратите внимание на изменение эффективности, особенно в соотношении «параметр/производительность».

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

EfficientDet: пионер в области масштабирования соединений

Разработанная Google , EfficientDet произвела революцию в области проектирования моделей, предложив методику одновременного масштабирования точности и эффективности. До появления EfficientDet масштабирование модели означало произвольное увеличение глубины, ширины или разрешения.

Архитектурные инновации

EfficientDet использует базовую структуру EfficientNet, известную своей высокой эффективностью параметров. Однако его отличительной особенностью является BiFPN (двунаправленная пирамидальная сеть признаков). В отличие от стандартных FPN, которые суммируют признаки без различия, BiFPN применяет обучаемые веса к различным входным признакам, позволяя сети обучаться важности каждого масштаба.

Это сочетается с Compound Scaling, методом на основе коэффициентов, который равномерно масштабирует разрешение, глубину и ширину основной сети, сети признаков и сетей прогнозирования. Такой целостный подход позволяет EfficientDet охватывать широкий спектр ограничений по ресурсам, от мобильных устройств (D0) до высокопроизводительных GPU (D7).

Узнайте больше об EfficientDet

PP-YOLOE+: усовершенствован для промышленного применения

PP-YOLOE+ — это усовершенствованная версияYOLO от PaddlePaddle компании Baidu. Она представляет собой переход к детекторам без анкоров, специально оптимизированным для облачного и пограничного GPU , такого как V100 и T4.

Архитектурные инновации

«Plus» в PP-YOLOE+ означает усовершенствования по сравнению с оригиналом, включая мощную основу на базе CSPRepResNet. Эта архитектура использует перепараметризацию для оптимизации сложных структур времени обучения в простые слои времени вывода, что значительно повышает скорость.

PP-YOLOE+ использует Task Alignment Learning (TAL) — стратегию присвоения меток, которая динамически выбирает положительные образцы на основе комбинации оценок классификации и локализации. Это гарантирует, что прогнозы с высокой степенью достоверности также являются наиболее точными с точки зрения локализации, что является распространенной проблемой в детекторах без якорей.

Узнайте больше о PP-YOLOE+

Глубокое погружение: критические различия

1. Методологии слияния характеристик

BiFPN от EfficientDet теоретически элегантен и позволяет повторно использовать сложные функции. Однако такая нерегулярность в моделях доступа к памяти может замедлять работу аппаратных ускорителей, которые предпочитают однородные матричные операции. В отличие от этого, PP-YOLOE+ использует в своей PANet конструкцию RepResBlock, которая математически эквивалентна сложным блокам во время обучения, но сводится к одной свертке во время вывода, максимально увеличивая GPU .

2. Стабильность обучения

EfficientDet основан на фреймворке AutoML, который может быть вычислительно затратным для репликации или тонкой настройки без использования огромных ресурсов. PP-YOLOE+ использует статический графовый подход, типичный для PaddlePaddle, который является стабильным, но может показаться жестким по сравнению с динамической природой моделей PyTorch, таких как Ultralytics YOLOv8 или YOLO11.

3. Экосистема и обслуживание

Хотя репозиторий Google имеет историческое значение, он поддерживается менее активно по сравнению с проектами, развиваемыми сообществом. PP-YOLOE+ является частью пакета PaddleDetection, который является надежным, но тесно связан с PaddlePaddle . Это может создать крутой кривой обучения для разработчиков, привыкших к PyTorch TensorFlow, что усложняет процесс развертывания модели на нестандартном оборудовании.

Сложность развертывания

Для развертывания моделей из определенных фреймворков, таких как PaddlePaddle требуются специальные инструменты преобразования (например, paddle2onnx), прежде чем их можно будет использовать с универсальными механизмами вывода, такими как TensorRT OpenVINO.

Ultralytics : YOLO26 и YOLO11

В то время как EfficientDet и PP-YOLOE+ проложили путь, в этой области произошел переход к моделям, которые предлагают еще лучший компромисс между скоростью и точностью при значительно более высокой удобстве использования. Ultralytics уделяют приоритетное внимание беспроблемной работе разработчиков («простота использования») наряду с производительностью.

Почему разработчики выбирают Ultralytics

  1. Простота использования: благодаря унифицированному Python вы можете переключаться между YOLO11, YOLO26 и RT-DETR , изменив одну строку.
  2. Хорошо поддерживаемая экосистема: Ultralytics и активное сообщество GitHub гарантируют вам доступ к последним исправлениям ошибок, форматам экспорта и руководствам по развертыванию.
  3. Эффективность использования памяти: Ultralytics славятся низким потреблением памяти во время обучения по сравнению со старыми архитектурами или тяжелыми трансформаторными моделями, что делает их доступными на графических процессорах потребительского уровня.
  4. Универсальность: в отличие от EfficientDet (только обнаружение), Ultralytics изначально поддерживают сегментацию, оценку позы, OBB и классификацию.

В центре внимания: YOLO26

Недавно выпущенный YOLO26 устанавливает новый стандарт на 2026 год. Он включает в себя функции, которые специально устраняют ограничения предыдущих поколений:

  • Нативная сквозная архитектура: YOLO26 — это архитектура NMS. Это полностью устраняет этап подавления не максимальных значений, который часто является узким местом в сценах с большим количеством объектов, и значительно упрощает логику развертывания.
  • MuSGD Optimizer: вдохновленный обучением LLM, этот оптимизатор обеспечивает стабильную конвергенцию даже с огромными наборами данных.
  • ProgLoss + STAL: эти усовершенствованные функции потери улучшают обнаружение мелких объектов, что традиционно является слабым местом YOLO по сравнению с масштабированием высокого разрешения EfficientDet.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Узнайте больше о YOLO26

Приложения в реальном мире

Выбор подходящей модели часто зависит от конкретного применения в отрасли.

Медицинская визуализация

Вариант D7 от EfficientDet исторически был популярен в области анализа медицинских изображений (например, для обнаружения опухолей на рентгеновских снимках), поскольку он эффективно обрабатывает входные данные с очень высоким разрешением. Однако низкая скорость вывода ограничивает его применение офлайн-обработкой. Современные альтернативы, такие как YOLO11 , теперь предпочтительны для диагностических средств в режиме реального времени.

Производство и контроль качества

PP-YOLOE+ отлично подходит для автоматизированных производственных сред, где камеры закреплены, а освещение контролируется. TensorRT оптимизации для TensorRT он подходит для высокоскоростных сборочных линий, где требуется обнаружение дефектов.

Умные города и передовые технологии искусственного интеллекта

Для приложений «умного города», таких как мониторинг дорожного движения, Ultralytics является лучшим выбором. Его на 43 % более быстрая способность CPU имеет решающее значение для периферийных устройств (таких как Raspberry Pi или NVIDIA ), где недоступны специальные высокопроизводительные графические процессоры. Удаление NMS означает, что задержка является детерминированной, что является решающим фактором для систем безопасности в реальном времени.

Заключение

Как EfficientDet, так и PP-YOLOE+ являются важными вехами в истории компьютерного зрения. EfficientDet доказал, что масштабирование может быть научным, а PP-YOLOE+ продемонстрировал мощь анкерных конструкций для GPU .

Однако для разработчиков, начинающих новые проекты в 2026 году, Ultralytics предлагает наиболее привлекательный пакет. Сочетая в себе точность современных головок без анкеров, простоту конструкции NMS и надежную поддержку Ultralytics , он обеспечивает самый быстрый путь от концепции до производства.

Чтобы начать обучение своих собственных современных моделей уже сегодня, посетите Ultralytics .


Комментарии