PP-YOLOE+ против YOLOv9: глубокий технический разбор современного детектирования объектов
Ландшафт компьютерного зрения в реальном времени постоянно меняется, а исследователи и разработчики непрерывно расширяют границы точности и скорости вывода. Сравнивая PP-YOLOE+ и YOLOv9, мы рассматриваем две принципиально разные философии архитектуры моделей и дизайна экосистем.
Этот подробный технический обзор анализирует их архитектурные инновации, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь тебе выбрать подходящую модель детектирования объектов для твоего следующего развертывания.
Происхождение моделей и технические основы
Понимание истоков и архитектурных решений этих моделей критически важно для определения их пригодности для твоих проектов в области компьютерного зрения.
Обзор PP-YOLOE+
Разработанная авторами PaddlePaddle в Baidu, модель PP-YOLOE+ была представлена 2 апреля 2022 года. Она развивает предыдущие итерации в рамках фреймворка PaddleDetection для обеспечения высокопроизводительного детектирования объектов.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: 2203.16250
- GitHub: Репозиторий PaddleDetection
PP-YOLOE+ представляет надежную архитектуру без использования анкоров (anchor-free), оптимизированную для развертывания в экосистеме PaddlePaddle. Она использует модифицированный бэкбон CSPRepResNet и голову ET-head для улучшения извлечения признаков и регрессии ограничивающих рамок. Хотя модель достигает высокого среднего значения средней точности (mAP), зависимость от фреймворка PaddlePaddle иногда может создавать трудности с интеграцией для разработчиков, привыкших к PyTorch или TensorFlow.
Обзор YOLOv9
Представленная Чиен-Яо Ваном и Хун-Юань Марком Ляо из Института информатики Academia Sinica (Тайвань), YOLOv9 знаменует собой значительный скачок в эффективной обработке информационных узких мест в глубоком обучении.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Institute of Information Science, Academia Sinica, Тайвань
- Дата: 2024-02-21
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
Главный прорыв YOLOv9 — это Programmable Gradient Information (PGI), которая предотвращает потерю данных при прохождении признаков через глубокие нейронные сети. В сочетании с Generalized Efficient Layer Aggregation Network (GELAN), YOLOv9 максимизирует эффективность параметров и вычислительный поток. Кроме того, модель нативно интегрирована в экосистему Ultralytics, что делает ее очень доступной как для исследовательских, так и для коммерческих задач.
Сравнение производительности и метрик
Анализируя базовую производительность, YOLOv9 демонстрирует исключительную эффективность параметров. Она достигает сопоставимой или превосходящей точности, требуя при этом меньше параметров и FLOP, что означает меньшие требования к видеопамяти (VRAM) во время обучения модели.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Как видно из таблицы, YOLOv9c достигает высокого показателя 53.0 mAP с существенно меньшим количеством параметров (25.3M), чем сопоставимая модель PP-YOLOE+l (52.2M). Это меньшее потребление памяти делает YOLOv9 лучшим выбором для разработчиков, работающих с ограниченными ресурсами GPU.
Экосистема, универсальность и простота использования
Определяющее преимущество YOLOv9 заключается в ее бесшовной интеграции с отлично поддерживаемой экосистемой Ultralytics. В то время как для работы с PP-YOLOE+ нужно разбираться в сложных конфигурационных файлах PaddlePaddle, YOLOv9 выигрывает за счет упрощенного Python API.
Python API Ultralytics позволяет тебе загружать предобученные веса, управлять аугментацией данных и запускать обучение с минимальным количеством шаблонного кода.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")Более того, экосистема Ultralytics обеспечивает непревзойденную универсальность. Помимо обнаружения ограничивающих рамок, фреймворк нативно поддерживает сегментацию экземпляров, оценку позы и детектирование с ориентированными ограничивающими рамками (OBB). Это делает адаптацию твоей модели к сложным реальным конвейерам невероятно эффективной.
Варианты использования и рекомендации
Выбор между PP-YOLOE+ и YOLOv9 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.
Когда выбирать PP-YOLOE+
PP-YOLOE+ — отличный выбор для:
- Интеграция с экосистемой PaddlePaddle: организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
- Развертывание на Paddle Lite Edge: развертывание на оборудовании с высокооптимизированными ядрами вывода специально для двигателя Paddle Lite или вывода Paddle.
- Высокоточное обнаружение на стороне сервера: сценарии, отдающие приоритет максимальной точности обнаружения на мощных серверных GPU, где зависимость от фреймворка не является проблемой.
Когда выбирать YOLOv9
YOLOv9 рекомендуется для:
- Исследований информационных узких мест: академических проектов, изучающих архитектуры PGI (Programmable Gradient Information) и GELAN (Generalized Efficient Layer Aggregation Network).
- Изучения оптимизации градиентного потока: исследований, сфокусированных на понимании и смягчении потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга высокоточного детектирования: сценариев, где высокая производительность YOLOv9 на бенчмарке COCO нужна как точка отсчета для архитектурных сравнений.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:
- Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.
Взгляд в будущее: преимущество YOLO26
Хотя и PP-YOLOE+, и YOLOv9 являются мощными решениями, недавно выпущенная модель YOLO26 представляет собой определяющий следующий шаг для производственных сред. Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для периферийных вычислений и развертывания в облаке. Мы настоятельно рекомендуем YOLO26 для всех новых проектов в области компьютерного зрения благодаря ее прорывным инновациям:
- Дизайн End-to-End без NMS: YOLO26 является нативно end-to-end решением, полностью устраняющим необходимость в пост-обработке через Non-Maximum Suppression (NMS). Это значительно упрощает конвейеры развертывания и снижает задержку.
- До 43% быстрее вывод на CPU: Благодаря специальной оптимизации архитектуры для периферийных вычислений, YOLO26 работает значительно быстрее на оборудовании без выделенных GPU.
- Удаление DFL: Функция Distribution Focal Loss была удалена, что упростило экспорт и радикально улучшило совместимость с маломощными периферийными устройствами.
- Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (таких как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon обеспечивает высокую стабильность динамики обучения и быструю сходимость.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов — важное обновление для аэросъемки и робототехники.
- Улучшения для конкретных задач: YOLO26 включает адаптированные архитектуры для специфических задач, такие как multi-scale proto для сегментации и Residual Log-Likelihood Estimation (RLE) для оценки позы.
Ты можешь легко обучать и развертывать модели YOLO26 через платформу Ultralytics, комплексное решение для аннотирования датасетов, обучения в облаке и мониторинга моделей.
Применение в реальных условиях
Выбор между этими архитектурами часто сводится к твоей целевой среде развертывания.
PP-YOLOE+ часто развертывается в промышленных производственных центрах, особенно в регионах, где интеграция PaddlePaddle и аппаратный стек Baidu глубоко внедрены в корпоративную инфраструктуру. Модель превосходно работает в анализе статических изображений, где абсолютная точность важнее строгих ограничений реального времени.
YOLOv9 превосходит аналоги в динамических средах, требующих быстрого вывода в реальном времени. Ее превосходная эффективность параметров делает модель идеальной для автономной навигации дронов и периферийных систем безопасности. Кроме того, меньшее потребление VRAM снижает порог входа для исследователей, обучающих модели на потребительских GPU.
Для достижения наилучшей производительности в задачах управления городским трафиком и высокоскоростной робототехники, более новая модель YOLO26 не имеет равных, предлагая end-to-end эффективность без накладных расходов из-за узких мест NMS.