Перейти к содержанию

PP-YOLOE+ против YOLOv9: Глубокий технический анализ современных методов обнаружения объектов

Ландшафт компьютерного зрения в реальном времени постоянно меняется, поскольку исследователи и разработчики постоянно расширяют границы точности и скорости вывода. При сравнении PP-YOLOE+ и YOLOv9 мы рассматриваем две различные философии в архитектуре моделей и дизайне экосистем.

Это всеобъемлющее техническое сравнение анализирует их архитектурные инновации, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь вам выбрать правильную модель обнаружения объектов для вашего следующего развертывания.

Происхождение модели и технические основы

Понимание истоков и архитектурных решений этих моделей имеет решающее значение для определения их применимости в ваших проектах компьютерного зрения.

Обзор PP-YOLOE+

Разработанный авторами PaddlePaddle в Baidu, PP-YOLOE+ был представлен 2 апреля 2022 года. Он основан на предыдущих итерациях в рамках фреймворка PaddleDetection для обеспечения высокопроизводительного обнаружения объектов.

PP-YOLOE+ представляет надежную безанкерную архитектуру, сильно оптимизированную для развертывания в экосистеме PaddlePaddle. Он использует модифицированный backbone CSPRepResNet и ET-head для улучшения извлечения признаков и регрессии ограничивающих рамок. Хотя он достигает высокой средней точности (mAP), его зависимость от фреймворка PaddlePaddle иногда может создавать трудности при интеграции для разработчиков, привыкших к PyTorch или TensorFlow.

Узнайте больше о PP-YOLOE+

Обзор YOLOv9

Представленный Чиен-Яо Вангом и Хонг-Юань Марком Ляо из Института информатики Academia Sinica, Тайвань, YOLOv9 знаменует собой значительный шаг в эффективном решении проблем информационных узких мест в глубоком обучении.

  • Авторы: Чен-Яо Ванг и Хонг-Юань Марк Ляо
  • Организация: Institute of Information Science, Academia Sinica, Taiwan
  • Дата: 2024-02-21
  • Arxiv:2402.13616
  • GitHub:WongKinYiu/yolov9

Главным прорывом YOLOv9 является программируемая градиентная информация (PGI), которая предотвращает потерю данных при прохождении признаков через глубокие нейронные сети. В сочетании с обобщенной эффективной сетью агрегации слоев (GELAN) YOLOv9 максимизирует эффективность параметров и вычислительный поток. Кроме того, она нативно интегрирована в экосистему Ultralytics, что делает ее легкодоступной как для исследований, так и для коммерческих применений.

Узнайте больше о YOLOv9

Другие модели Ultralytics

Если вы изучаете передовые решения, вас также могут заинтересовать YOLO11 и RT-DETR, которые предлагают различное соотношение точности на основе трансформеров и производительности на периферийных устройствах в реальном времени.

Сравнение производительности и метрик

При анализе чистой производительности YOLOv9 демонстрирует исключительную эффективность использования параметров. Он достигает сопоставимой или превосходящей точности, требуя при этом меньшего количества параметров и FLOPs, что приводит к снижению требований к VRAM во время обучения модели.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Как видно из таблицы, YOLOv9c достигает высокого показателя 53.0 mAP при значительно меньшем количестве параметров (25.3M) по сравнению с сопоставимым PP-YOLOE+l (52.2M). Это сниженное потребление памяти делает YOLOv9 превосходным выбором для разработчиков, работающих с ограниченными ресурсами GPU.

Экосистема, универсальность и простота использования

Ключевое преимущество YOLOv9 заключается в ее бесшовной интеграции с хорошо поддерживаемой экосистемой Ultralytics. В то время как PP-YOLOE+ требует работы со сложными конфигурационными файлами PaddlePaddle, YOLOv9 выигрывает от упрощенного Python API.

The Python API Ultralytics позволяет разработчикам загружать предварительно обученные веса, управлять аугментацией данных и инициировать обучение с минимальным шаблонным кодом.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

Кроме того, экосистема Ultralytics обеспечивает беспрецедентную универсальность. Помимо детектирования ограничивающих рамок, фреймворк нативно поддерживает сегментацию экземпляров, оценку позы и детектирование ориентированных ограничивающих рамок (OBB). Это делает адаптацию вашей модели к сложным реальным конвейерам невероятно эффективной.

Параметры экспорта

Модели, обученные с использованием фреймворка Ultralytics, могут быть экспортированы в различные форматы, включая TensorRT и OpenVINO, обеспечивая высокооптимизированный вывод на различном оборудовании.

Сценарии использования и рекомендации

Выбор между PP-YOLOE+ и YOLOv9 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать PP-YOLOE+

PP-YOLOE+ является отличным выбором для:

  • Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
  • Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
  • Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.

Когда выбирать YOLOv9

YOLOv9 рекомендуется для:

  • Исследования информационного узкого места: Академические проекты, изучающие архитектуры Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
  • Исследования по оптимизации потока градиентов: Исследования, направленные на понимание и снижение потери информации в глубоких слоях сети во время обучения.
  • Бенчмаркинг обнаружения с высокой точностью: Сценарии, где высокая производительность YOLOv9 в бенчмарке COCO необходима в качестве эталонной точки для архитектурных сравнений.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Взгляд в будущее: Преимущество YOLO26

Хотя PP-YOLOE+ и YOLOv9 являются мощными, недавно выпущенная YOLO26 представляет собой окончательный следующий шаг для производственных сред. Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для граничных вычислений и облачных развертываний. Мы настоятельно рекомендуем YOLO26 для всех новых проектов компьютерного зрения благодаря ее прорывным инновациям:

  • Сквозная архитектура без NMS: YOLO26 изначально является сквозной, полностью устраняя необходимость в постобработке Non-Maximum Suppression (NMS). Это значительно упрощает конвейеры развертывания и снижает задержку.
  • До 43% более быстрая инференция на CPU: За счет специальной оптимизации архитектуры для периферийных вычислений, YOLO26 значительно быстрее работает на оборудовании без выделенных GPU.
  • Удаление DFL: Distribution Focal Loss был удален, что упрощает экспорт и значительно улучшает совместимость с маломощными периферийными устройствами.
  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (такими как Kimi K2 от Moonshot AI), этот гибрид SGD и Muon обеспечивает высокостабильную динамику обучения и быструю сходимость.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что является важным улучшением для аэрофотосъемки и робототехники.
  • Специализированные улучшения: YOLO26 включает настраиваемые архитектуры для конкретных задач, такие как многомасштабный прототип для сегментации и оценка остаточного логарифмического правдоподобия (RLE) для оценки позы.

Вы можете легко обучать и развертывать модели YOLO26 через Ultralytics Platform — комплексное решение для аннотирования наборов данных, облачного обучения и мониторинга моделей.

Приложения в реальном мире

Выбор между этими архитектурами часто сводится к вашей целевой среде развертывания.

PP-YOLOE+ часто развертывается в промышленных производственных центрах, особенно в регионах, где интеграция PaddlePaddle и аппаратный стек Baidu глубоко внедрены в корпоративную инфраструктуру. Он превосходно справляется с анализом статических изображений, где абсолютная точность имеет приоритет над строгими ограничениями реального времени.

YOLOv9 превосходно работает в динамических средах, требующих быстрого инференса в реальном времени. Его превосходная параметрическая эффективность делает его идеальным для автономной навигации дронов и граничных систем безопасности. Кроме того, его более низкое потребление VRAM снижает порог входа для исследователей, обучающихся на потребительских GPU.

Для достижения абсолютно лучшей производительности в области управления дорожным движением в умных городах и высокоскоростной робототехники, новая YOLO26 не имеет себе равных, предлагая сквозную эффективность без накладных расходов, связанных с узкими местами NMS.


Комментарии