PP-YOLOE+ против YOLOv9: Глубокий технический анализ современных методов обнаружения объектов
Ландшафт компьютерного зрения в реальном времени постоянно меняется, поскольку исследователи и разработчики постоянно расширяют границы точности и скорости вывода. При сравнении PP-YOLOE+ и YOLOv9 мы рассматриваем две различные философии в архитектуре моделей и дизайне экосистем.
Это всеобъемлющее техническое сравнение анализирует их архитектурные инновации, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь вам выбрать правильную модель обнаружения объектов для вашего следующего развертывания.
Происхождение модели и технические основы
Понимание истоков и архитектурных решений этих моделей имеет решающее значение для определения их применимости в ваших проектах компьютерного зрения.
Обзор PP-YOLOE+
Разработанный авторами PaddlePaddle в Baidu, PP-YOLOE+ был представлен 2 апреля 2022 года. Он основан на предыдущих итерациях в рамках фреймворка PaddleDetection для обеспечения высокопроизводительного обнаружения объектов.
- Авторы: Авторы PaddlePaddle
- Организация:Baidu
- Дата: 2022-04-02
- Arxiv:2203.16250
- GitHub:Репозиторий PaddleDetection
PP-YOLOE+ представляет надежную безанкерную архитектуру, сильно оптимизированную для развертывания в экосистеме PaddlePaddle. Он использует модифицированный backbone CSPRepResNet и ET-head для улучшения извлечения признаков и регрессии ограничивающих рамок. Хотя он достигает высокой средней точности (mAP), его зависимость от фреймворка PaddlePaddle иногда может создавать трудности при интеграции для разработчиков, привыкших к PyTorch или TensorFlow.
Обзор YOLOv9
Представленный Чиен-Яо Вангом и Хонг-Юань Марком Ляо из Института информатики Academia Sinica, Тайвань, YOLOv9 знаменует собой значительный шаг в эффективном решении проблем информационных узких мест в глубоком обучении.
- Авторы: Чен-Яо Ванг и Хонг-Юань Марк Ляо
- Организация: Institute of Information Science, Academia Sinica, Taiwan
- Дата: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
Главным прорывом YOLOv9 является программируемая градиентная информация (PGI), которая предотвращает потерю данных при прохождении признаков через глубокие нейронные сети. В сочетании с обобщенной эффективной сетью агрегации слоев (GELAN) YOLOv9 максимизирует эффективность параметров и вычислительный поток. Кроме того, она нативно интегрирована в экосистему Ultralytics, что делает ее легкодоступной как для исследований, так и для коммерческих применений.
Другие модели Ultralytics
Если вы изучаете передовые решения, вас также могут заинтересовать YOLO11 и RT-DETR, которые предлагают различное соотношение точности на основе трансформеров и производительности на периферийных устройствах в реальном времени.
Сравнение производительности и метрик
При анализе чистой производительности YOLOv9 демонстрирует исключительную эффективность использования параметров. Он достигает сопоставимой или превосходящей точности, требуя при этом меньшего количества параметров и FLOPs, что приводит к снижению требований к VRAM во время обучения модели.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Как видно из таблицы, YOLOv9c достигает высокого показателя 53.0 mAP при значительно меньшем количестве параметров (25.3M) по сравнению с сопоставимым PP-YOLOE+l (52.2M). Это сниженное потребление памяти делает YOLOv9 превосходным выбором для разработчиков, работающих с ограниченными ресурсами GPU.
Экосистема, универсальность и простота использования
Ключевое преимущество YOLOv9 заключается в ее бесшовной интеграции с хорошо поддерживаемой экосистемой Ultralytics. В то время как PP-YOLOE+ требует работы со сложными конфигурационными файлами PaddlePaddle, YOLOv9 выигрывает от упрощенного Python API.
The Python API Ultralytics позволяет разработчикам загружать предварительно обученные веса, управлять аугментацией данных и инициировать обучение с минимальным шаблонным кодом.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")
Кроме того, экосистема Ultralytics обеспечивает беспрецедентную универсальность. Помимо детектирования ограничивающих рамок, фреймворк нативно поддерживает сегментацию экземпляров, оценку позы и детектирование ориентированных ограничивающих рамок (OBB). Это делает адаптацию вашей модели к сложным реальным конвейерам невероятно эффективной.
Параметры экспорта
Модели, обученные с использованием фреймворка Ultralytics, могут быть экспортированы в различные форматы, включая TensorRT и OpenVINO, обеспечивая высокооптимизированный вывод на различном оборудовании.
Сценарии использования и рекомендации
Выбор между PP-YOLOE+ и YOLOv9 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда следует выбирать PP-YOLOE+
PP-YOLOE+ является отличным выбором для:
- Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
- Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
- Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.
Когда выбирать YOLOv9
YOLOv9 рекомендуется для:
- Исследования информационного узкого места: Академические проекты, изучающие архитектуры Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Исследования по оптимизации потока градиентов: Исследования, направленные на понимание и снижение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинг обнаружения с высокой точностью: Сценарии, где высокая производительность YOLOv9 в бенчмарке COCO необходима в качестве эталонной точки для архитектурных сравнений.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Взгляд в будущее: Преимущество YOLO26
Хотя PP-YOLOE+ и YOLOv9 являются мощными, недавно выпущенная YOLO26 представляет собой окончательный следующий шаг для производственных сред. Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для граничных вычислений и облачных развертываний. Мы настоятельно рекомендуем YOLO26 для всех новых проектов компьютерного зрения благодаря ее прорывным инновациям:
- Сквозная архитектура без NMS: YOLO26 изначально является сквозной, полностью устраняя необходимость в постобработке Non-Maximum Suppression (NMS). Это значительно упрощает конвейеры развертывания и снижает задержку.
- До 43% более быстрая инференция на CPU: За счет специальной оптимизации архитектуры для периферийных вычислений, YOLO26 значительно быстрее работает на оборудовании без выделенных GPU.
- Удаление DFL: Distribution Focal Loss был удален, что упрощает экспорт и значительно улучшает совместимость с маломощными периферийными устройствами.
- Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (такими как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon обеспечивает высокостабильную динамику обучения и быструю сходимость.
- ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что является важным улучшением для аэрофотосъемки и робототехники.
- Специализированные улучшения: YOLO26 включает настраиваемые архитектуры для конкретных задач, такие как многомасштабный прототип для сегментации и оценка остаточного логарифмического правдоподобия (RLE) для оценки позы.
Вы можете легко обучать и развертывать модели YOLO26 через Ultralytics Platform — комплексное решение для аннотирования наборов данных, облачного обучения и мониторинга моделей.
Приложения в реальном мире
Выбор между этими архитектурами часто сводится к вашей целевой среде развертывания.
PP-YOLOE+ часто развертывается в промышленных производственных центрах, особенно в регионах, где интеграция PaddlePaddle и аппаратный стек Baidu глубоко внедрены в корпоративную инфраструктуру. Он превосходно справляется с анализом статических изображений, где абсолютная точность имеет приоритет над строгими ограничениями реального времени.
YOLOv9 превосходно работает в динамических средах, требующих быстрого инференса в реальном времени. Его превосходная параметрическая эффективность делает его идеальным для автономной навигации дронов и граничных систем безопасности. Кроме того, его более низкое потребление VRAM снижает порог входа для исследователей, обучающихся на потребительских GPU.
Для достижения абсолютно лучшей производительности в области управления дорожным движением в умных городах и высокоскоростной робототехники, новая YOLO26 не имеет себе равных, предлагая сквозную эффективность без накладных расходов, связанных с узкими местами NMS.