Link to this sectionPP-YOLOE+ против YOLOv9#
Ландшафт компьютерного зрения реального времени постоянно меняется, а исследователи и разработчики непрерывно расширяют границы точности и скорости вывода. Сравнивая PP-YOLOE+ и YOLOv9, мы рассматриваем две принципиально разные философии в архитектуре моделей и проектировании экосистем.
В этом подробном техническом сравнении анализируются их архитектурные инновации, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь тебе выбрать подходящую модель обнаружения объектов для твоего следующего проекта.
Link to this sectionИстория моделей и технические основы#
Понимание происхождения и архитектурных решений этих моделей имеет решающее значение для определения того, насколько хорошо они вписываются в твои проекты компьютерного зрения.
Link to this sectionОбзор PP-YOLOE+#
Разработанная авторами PaddlePaddle в Baidu, модель PP-YOLOE+ была представлена 2 апреля 2022 года. Она базируется на предыдущих итерациях в рамках фреймворка PaddleDetection для обеспечения высокопроизводительного обнаружения объектов.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: 2203.16250
- GitHub: Репозиторий PaddleDetection
PP-YOLOE+ представляет надежную архитектуру без использования якорей (anchor-free), сильно оптимизированную для развертывания внутри экосистемы PaddlePaddle. Она использует модифицированный бэкбон CSPRepResNet и ET-head для улучшения извлечения признаков и регрессии ограничивающих рамок. Несмотря на достижение высокого среднего значения точности (mAP), зависимость от фреймворка PaddlePaddle иногда может создавать трудности при интеграции для разработчиков, привыкших к PyTorch или TensorFlow.
Link to this sectionОбзор YOLOv9#
Представленная Чиен-Яо Вангом и Хун-Юань Марком Ляо из Института информационных наук Academia Sinica на Тайване, модель YOLOv9 знаменует собой значительный скачок в эффективном устранении «узких мест» передачи информации в глубоком обучении.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Институт информатики, Academia Sinica, Тайвань
- Дата: 2024-02-21
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
Ключевым прорывом YOLOv9 является программируемая градиентная информация (PGI), которая предотвращает потерю данных при прохождении признаков через глубокие нейронные сети. В сочетании с обобщенной эффективной сетью агрегации слоев (GELAN), YOLOv9 максимизирует эффективность параметров и вычислительный поток. Кроме того, она изначально интегрирована в экосистему Ultralytics, что делает её легкодоступной как для исследований, так и для коммерческих приложений.
Link to this sectionСравнение производительности и метрик#
При анализе «чистой» производительности YOLOv9 демонстрирует исключительную эффективность параметров. Она достигает сопоставимой или превосходящей точности, требуя при этом меньше параметров и операций FLOPs, что означает меньшие требования к видеопамяти (VRAM) во время обучения модели.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Как видно из таблицы, YOLOv9c достигает высокого показателя 53.0 mAP с существенно меньшим количеством параметров (25.3M), чем сопоставимая PP-YOLOE+l (52.2M). Это более низкое потребление памяти делает YOLOv9 лучшим выбором для разработчиков, работающих с ограниченными ресурсами GPU.
Link to this sectionЭкосистема, универсальность и простота использования#
Главное преимущество YOLOv9 заключается в её бесшовной интеграции с активно поддерживаемой экосистемой Ultralytics. В то время как для работы с PP-YOLOE+ требуется разбираться в сложных конфигурационных файлах PaddlePaddle, YOLOv9 предлагает упрощенный Python API.
Python API Ultralytics позволяет разработчикам загружать предобученные веса, управлять аугментацией данных и запускать обучение с минимальным количеством шаблонного кода.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")Более того, экосистема Ultralytics обеспечивает непревзойденную универсальность. Помимо обнаружения объектов в ограничивающих рамках, фреймворк изначально поддерживает сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB). Это делает адаптацию твоей модели к сложным реальным пайплайнам невероятно эффективной.
Link to this sectionСценарии использования и рекомендации#
Выбор между PP-YOLOE+ и YOLOv9 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать PP-YOLOE+#
PP-YOLOE+ — это сильный выбор в следующих случаях:
- Интеграция с экосистемой PaddlePaddle: Организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
- Развертывание на периферии с Paddle Lite: Развертывание на оборудовании с высокооптимизированными ядрами вывода, специально предназначенными для движка Paddle Lite или Paddle.
- Серверное обнаружение с высокой точностью: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, где зависимость от фреймворка не является проблемой.
Link to this sectionКогда стоит выбрать YOLOv9#
YOLOv9 рекомендуется для:
- Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionВзгляд в будущее: преимущество YOLO26#
Хотя PP-YOLOE+ и YOLOv9 являются мощными инструментами, недавно выпущенная модель YOLO26 представляет собой окончательный следующий шаг для производственных сред. Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для вычислений на Edge и развертывания в облаке. Мы настоятельно рекомендуем YOLO26 для всех новых проектов компьютерного зрения из-за её революционных инноваций:
- Сквозной дизайн без NMS: YOLO26 является полноценной сквозной моделью, полностью исключающей необходимость в постобработке Non-Maximum Suppression (NMS). Это значительно упрощает пайплайны развертывания и снижает задержку.
- До 43% быстрее при выводе на CPU: Благодаря специальной оптимизации архитектуры для вычислений на Edge, YOLO26 работает значительно быстрее на оборудовании без выделенных GPU.
- Удаление DFL: Распределение функции фокусных потерь (Distribution Focal Loss) было удалено, что упростило экспорт и радикально улучшило совместимость с маломощными Edge-устройствами.
- Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (такими как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon обеспечивает высокую стабильность динамики обучения и быструю сходимость.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что является критически важным обновлением для аэросъемки и робототехники.
- Улучшения для конкретных задач: YOLO26 включает специализированные архитектуры для определенных задач, такие как multi-scale proto для сегментации и Residual Log-Likelihood Estimation (RLE) для оценки позы.
Ты можешь легко обучать и развертывать модели YOLO26 через Платформу Ultralytics — комплексное решение для разметки наборов данных, облачного обучения и мониторинга моделей.
Link to this sectionПрименение в реальных условиях#
Выбор между этими архитектурами часто сводится к твоей целевой среде развертывания.
PP-YOLOE+ часто внедряется в центрах промышленного производства, особенно в регионах, где интеграция PaddlePaddle и аппаратный стек Baidu глубоко встроены в корпоративную инфраструктуру. Она превосходно справляется с анализом статических изображений, где абсолютная точность важнее строгих ограничений реального времени.
YOLOv9 превосходит конкурентов в динамических средах, требующих быстрого вывода в реальном времени. Ее превосходная эффективность параметров делает её идеальной для автономной навигации дронов и систем безопасности на Edge-устройствах. Более того, меньшее потребление видеопамяти снижает порог входа для исследователей, обучающих модели на потребительских GPU.
Для достижения наилучшей производительности в задачах управления дорожным движением в умных городах и высокоскоростной робототехнике, новая модель YOLO26 не имеет равных, обеспечивая сквозную эффективность без накладных расходов из-за «узких мест» NMS.