PP-YOLOE+ против YOLOv7: навигация по архитектурам обнаружения объектов в реальном времени

При создании конвейеров компьютерного зрения выбор подходящей модели обнаружения объектов имеет решающее значение. Две значимые архитектуры 2022 года, PP-YOLOE+ и YOLOv7, представили мощные достижения в области обнаружения объектов в реальном времени. Это техническое сравнение дает глубокий обзор их архитектур, методологий обучения и производительности в реальных условиях, чтобы помочь тебе принимать обоснованные решения для своих приложений.

Обзор моделей

И PP-YOLOE+, и YOLOv7 были разработаны для расширения границ точности и скорости, но они происходят из разных экосистем разработки и философий проектирования.

PP-YOLOE+

Разработанная авторами PaddlePaddle в Baidu, модель PP-YOLOE+ основывается на оригинальной PP-YOLOv2. Она была представлена для обеспечения эффективного и высокоточного детектора объектов, оптимизированного для экосистемы PaddlePaddle.

Узнай больше о PP-YOLOE+

YOLOv7

Разработанная Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao, модель YOLOv7 представила «обучаемый набор бесплатных инструментов» (trainable bag-of-freebies), чтобы установить новые современные стандарты для детекторов объектов реального времени на момент ее выпуска.

Узнай больше о YOLOv7

Архитектурные инновации

Архитектура PP-YOLOE+

PP-YOLOE+ в значительной степени полагается на парадигму без анкоров (anchor-free), что упрощает процесс развертывания, устраняя необходимость настройки якорных рамок (anchor boxes) для пользовательских наборов данных. Она включает в себя мощный бэкенд RepResNet и CSPNet-подобную сеть PAN (Path Aggregation Network) для эффективного слияния признаков на разных масштабах. Кроме того, она использует концепцию Task Alignment Learning (TAL) для динамического согласования задач классификации и локализации во время обучения, обеспечивая высокую точность в различных задачах компьютерного зрения.

Архитектура YOLOv7

YOLOv7 выбрала другой подход, представив сеть Extended Efficient Layer Aggregation Network (E-ELAN). Эта архитектура позволяет сети изучать более разнообразные признаки, не разрушая исходный путь градиента, что ведет к лучшей сходимости. YOLOv7 также широко использует репараметризацию моделей — в частности, плановые репараметризованные свертки — которые объединяют сверточные слои во время вывода для ускорения выполнения без ущерба для точности. Это делает YOLOv7 исключительно сильной в задачах, таких как отслеживание нескольких объектов и сложные системы охранной сигнализации.

Различия в экосистемах

В то время как PP-YOLOE+ тесно интегрирована с фреймворком Baidu PaddlePaddle, YOLOv7 была создана на PyTorch, который исторически предлагает большее сообщество и более широкую готовую совместимость с конвейерами развертывания, такими как ONNX и TensorRT.

Анализ производительности

При балансировке скорости, параметров и точности (mAP) модели соревнуются друг с другом в зависимости от конкретного варианта и целевого оборудования. Ниже приведено полное сравнение их метрик.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Хотя модель PP-YOLOE+x достигает немного более высокого mAP, варианты YOLOv7 предлагают очень сильное соотношение параметров к точности. Архитектура YOLOv7 остается фаворитом для обработки на GPU, где оптимизация TensorRT обеспечивает исключительно низкую задержку.

Преимущество Ultralytics

При обучении и развертывании этих моделей фреймворк, который ты выбираешь, так же важен, как и сама модель. Использование Ultralytics обеспечивает удобство для пользователя благодаря высокоунифицированному Python API, который упрощает весь жизненный цикл машинного обучения.

  • Хорошо поддерживаемая экосистема: Модели Ultralytics YOLO выигрывают от постоянно обновляемой экосистемы, надежной документации и активного сообщества.
  • Требования к памяти: Ultralytics серьезно оптимизирует загрузку данных и режимы обучения. Обучение моделей Ultralytics YOLO обычно требует гораздо меньше памяти CUDA по сравнению с тяжелыми архитектурами на базе Transformer, что позволяет разработчикам использовать большие размеры пакетов на потребительском оборудовании.
  • Эффективность обучения: Используя надежные стратегии аугментации данных и встроенную настройку гиперпараметров, Ultralytics гарантирует, что модели быстро сходятся с готовыми предварительно обученными весами.

Простая реализация API

Обучение модели YOLOv7 с помощью Ultralytics занимает всего несколько строк кода, полностью абстрагируя сложные сценарии обучения:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Новый стандарт: Представляем YOLO26

Хотя PP-YOLOE+ и YOLOv7 являются вехами в обнаружении объектов, ландшафт ИИ быстро развивается. Для любого нового проекта по компьютерному зрению мы настоятельно рекомендуем Ultralytics YOLO26. Выпущенная в январе 2026 года, YOLO26 представляет собой огромный скачок вперед в области edge-first ИИ для зрения.

Почему YOLO26 превосходит старые архитектуры:

  • Сквозной дизайн без NMS: YOLO26 является нативно сквозным (end-to-end). Устраняя постобработку Non-Maximum Suppression (NMS), она гарантирует предсказуемую, детерминированную задержку вывода — прорыв, впервые увиденный в YOLOv10.
  • Удаление DFL: Удаление Distribution Focal Loss упрощает процесс экспорта и значительно улучшает совместимость для маломощных периферийных устройств.
  • До 43% быстрее вывод на CPU: Для сценариев, где отсутствуют выделенные GPU — таких как IoT-датчики умного города — YOLO26 сильно оптимизирована для эффективной работы непосредственно на CPU.
  • Оптимизатор MuSGD: Вдохновленная передовыми методами обучения LLM (такими как Kimi K2 от Moonshot AI), YOLO26 использует гибрид SGD и Muon для невероятно стабильного обучения и быстрой сходимости.
  • ProgLoss + STAL: Эти улучшенные функции потерь приносят значительные достижения в обнаружении мелких объектов, что жизненно важно для таких вариантов использования, как аэросъемка с дронов и обнаружение дефектов на производстве.

Узнай больше о YOLO26

Идеальные варианты использования и сценарии развертывания

Когда использовать PP-YOLOE+

PP-YOLOE+ блистает, когда ты глубоко интегрирован в экосистему Baidu и PaddlePaddle. Если твоя цель развертывания использует специализированное оборудование, предназначенное для моделей Paddle (например, в определенных азиатских производственных конвейерах), PP-YOLOE+ обеспечивает отличную точность и бесшовную интеграцию. Она весьма эффективна для автоматизации промышленного производства.

Когда использовать YOLOv7

YOLOv7 остается отличным выбором для общего высокопроизводительного вывода, особенно при развертывании на оборудовании NVIDIA с использованием TensorRT. Ее интеграция в экосистему PyTorch делает ее очень универсальной для академических исследований и пользовательских коммерческих конвейеров, таких как управление толпой в реальном времени или сложные задачи оценки позы, где структурная целостность сети имеет первостепенное значение.

Другие модели, которые стоит рассмотреть

В зависимости от твоих точных потребностей, тебя также может заинтересовать сравнение этих архитектур с YOLO11 для обеспечения широкой гибкости, готовой к производству, или RT-DETR, если твой проект требует специфических преимуществ vision-трансформеров перед традиционными сверточными сетями.

Заключение

И PP-YOLOE+, и YOLOv7 принесли значительные улучшения в мир обнаружения объектов в реальном времени. В то время как PP-YOLOE+ превосходит в средах, стандартизированных вокруг PaddlePaddle, YOLOv7 предлагает невероятную гибкость и производительность через экосистемы PyTorch и Ultralytics.

Однако, поскольку решения в области компьютерного зрения продолжают развиваться, использование современных инструментов имеет важное значение. Применяя платформу Ultralytics и архитектуры следующего поколения, такие как YOLO26, разработчики могут быть уверены, что их приложения остаются на передовой скорости, точности и простоты использования.

Комментарии