PP-YOLOE+ против YOLOv9: глубокий технический разбор современного детектирования объектов

Ландшафт компьютерного зрения в реальном времени постоянно меняется, а исследователи и разработчики непрерывно расширяют границы точности и скорости вывода. Сравнивая PP-YOLOE+ и YOLOv9, мы рассматриваем две принципиально разные философии архитектуры моделей и дизайна экосистем.

Этот подробный технический обзор анализирует их архитектурные инновации, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь тебе выбрать подходящую модель детектирования объектов для твоего следующего развертывания.

Происхождение моделей и технические основы

Понимание истоков и архитектурных решений этих моделей критически важно для определения их пригодности для твоих проектов в области компьютерного зрения.

Обзор PP-YOLOE+

Разработанная авторами PaddlePaddle в Baidu, модель PP-YOLOE+ была представлена 2 апреля 2022 года. Она развивает предыдущие итерации в рамках фреймворка PaddleDetection для обеспечения высокопроизводительного детектирования объектов.

PP-YOLOE+ представляет надежную архитектуру без использования анкоров (anchor-free), оптимизированную для развертывания в экосистеме PaddlePaddle. Она использует модифицированный бэкбон CSPRepResNet и голову ET-head для улучшения извлечения признаков и регрессии ограничивающих рамок. Хотя модель достигает высокого среднего значения средней точности (mAP), зависимость от фреймворка PaddlePaddle иногда может создавать трудности с интеграцией для разработчиков, привыкших к PyTorch или TensorFlow.

Узнай больше о PP-YOLOE+

Обзор YOLOv9

Представленная Чиен-Яо Ваном и Хун-Юань Марком Ляо из Института информатики Academia Sinica (Тайвань), YOLOv9 знаменует собой значительный скачок в эффективной обработке информационных узких мест в глубоком обучении.

  • Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
  • Организация: Institute of Information Science, Academia Sinica, Тайвань
  • Дата: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

Главный прорыв YOLOv9 — это Programmable Gradient Information (PGI), которая предотвращает потерю данных при прохождении признаков через глубокие нейронные сети. В сочетании с Generalized Efficient Layer Aggregation Network (GELAN), YOLOv9 максимизирует эффективность параметров и вычислительный поток. Кроме того, модель нативно интегрирована в экосистему Ultralytics, что делает ее очень доступной как для исследовательских, так и для коммерческих задач.

Узнай больше о YOLOv9

Другие модели Ultralytics

Если ты ищешь самые современные решения, тебе также могут быть интересны YOLO11 и RT-DETR, которые предлагают разный баланс точности на основе трансформеров и производительности в реальном времени на граничных устройствах (edge).

Сравнение производительности и метрик

Анализируя базовую производительность, YOLOv9 демонстрирует исключительную эффективность параметров. Она достигает сопоставимой или превосходящей точности, требуя при этом меньше параметров и FLOP, что означает меньшие требования к видеопамяти (VRAM) во время обучения модели.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Как видно из таблицы, YOLOv9c достигает высокого показателя 53.0 mAP с существенно меньшим количеством параметров (25.3M), чем сопоставимая модель PP-YOLOE+l (52.2M). Это меньшее потребление памяти делает YOLOv9 лучшим выбором для разработчиков, работающих с ограниченными ресурсами GPU.

Экосистема, универсальность и простота использования

Определяющее преимущество YOLOv9 заключается в ее бесшовной интеграции с отлично поддерживаемой экосистемой Ultralytics. В то время как для работы с PP-YOLOE+ нужно разбираться в сложных конфигурационных файлах PaddlePaddle, YOLOv9 выигрывает за счет упрощенного Python API.

Python API Ultralytics позволяет тебе загружать предобученные веса, управлять аугментацией данных и запускать обучение с минимальным количеством шаблонного кода.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

Более того, экосистема Ultralytics обеспечивает непревзойденную универсальность. Помимо обнаружения ограничивающих рамок, фреймворк нативно поддерживает сегментацию экземпляров, оценку позы и детектирование с ориентированными ограничивающими рамками (OBB). Это делает адаптацию твоей модели к сложным реальным конвейерам невероятно эффективной.

Опции экспорта

Модели, обученные с использованием фреймворка Ultralytics, можно экспортировать в различные форматы, включая TensorRT и OpenVINO, что гарантирует высокооптимизированный вывод на самом разном оборудовании.

Варианты использования и рекомендации

Выбор между PP-YOLOE+ и YOLOv9 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать PP-YOLOE+

PP-YOLOE+ — отличный выбор для:

  • Интеграция с экосистемой PaddlePaddle: организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
  • Развертывание на Paddle Lite Edge: развертывание на оборудовании с высокооптимизированными ядрами вывода специально для двигателя Paddle Lite или вывода Paddle.
  • Высокоточное обнаружение на стороне сервера: сценарии, отдающие приоритет максимальной точности обнаружения на мощных серверных GPU, где зависимость от фреймворка не является проблемой.

Когда выбирать YOLOv9

YOLOv9 рекомендуется для:

  • Исследований информационных узких мест: академических проектов, изучающих архитектуры PGI (Programmable Gradient Information) и GELAN (Generalized Efficient Layer Aggregation Network).
  • Изучения оптимизации градиентного потока: исследований, сфокусированных на понимании и смягчении потери информации в глубоких слоях сети во время обучения.
  • Бенчмаркинга высокоточного детектирования: сценариев, где высокая производительность YOLOv9 на бенчмарке COCO нужна как точка отсчета для архитектурных сравнений.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Взгляд в будущее: преимущество YOLO26

Хотя и PP-YOLOE+, и YOLOv9 являются мощными решениями, недавно выпущенная модель YOLO26 представляет собой определяющий следующий шаг для производственных сред. Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для периферийных вычислений и развертывания в облаке. Мы настоятельно рекомендуем YOLO26 для всех новых проектов в области компьютерного зрения благодаря ее прорывным инновациям:

  • Дизайн End-to-End без NMS: YOLO26 является нативно end-to-end решением, полностью устраняющим необходимость в пост-обработке через Non-Maximum Suppression (NMS). Это значительно упрощает конвейеры развертывания и снижает задержку.
  • До 43% быстрее вывод на CPU: Благодаря специальной оптимизации архитектуры для периферийных вычислений, YOLO26 работает значительно быстрее на оборудовании без выделенных GPU.
  • Удаление DFL: Функция Distribution Focal Loss была удалена, что упростило экспорт и радикально улучшило совместимость с маломощными периферийными устройствами.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (таких как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon обеспечивает высокую стабильность динамики обучения и быструю сходимость.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов — важное обновление для аэросъемки и робототехники.
  • Улучшения для конкретных задач: YOLO26 включает адаптированные архитектуры для специфических задач, такие как multi-scale proto для сегментации и Residual Log-Likelihood Estimation (RLE) для оценки позы.

Ты можешь легко обучать и развертывать модели YOLO26 через платформу Ultralytics, комплексное решение для аннотирования датасетов, обучения в облаке и мониторинга моделей.

Применение в реальных условиях

Выбор между этими архитектурами часто сводится к твоей целевой среде развертывания.

PP-YOLOE+ часто развертывается в промышленных производственных центрах, особенно в регионах, где интеграция PaddlePaddle и аппаратный стек Baidu глубоко внедрены в корпоративную инфраструктуру. Модель превосходно работает в анализе статических изображений, где абсолютная точность важнее строгих ограничений реального времени.

YOLOv9 превосходит аналоги в динамических средах, требующих быстрого вывода в реальном времени. Ее превосходная эффективность параметров делает модель идеальной для автономной навигации дронов и периферийных систем безопасности. Кроме того, меньшее потребление VRAM снижает порог входа для исследователей, обучающих модели на потребительских GPU.

Для достижения наилучшей производительности в задачах управления городским трафиком и высокоскоростной робототехники, более новая модель YOLO26 не имеет равных, предлагая end-to-end эффективность без накладных расходов из-за узких мест NMS.

Комментарии