Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 против PP-YOLOE+#

Ландшафт детектирования объектов в реальном времени продолжает стремительно развиваться, предлагая инженерам в области компьютерного зрения широкий выбор для развертывания высокоточных моделей на граничных (edge) и облачных инфраструктурах. Двумя заметными моделями в этой области являются YOLOv9 и PP-YOLOE+. Хотя обе они расширяют границы точности и скорости, они происходят из разных исследовательских линий и программных экосистем.

В этом подробном техническом сравнении исследуются их архитектуры, методологии обучения, показатели производительности и идеальные сценарии применения в реальном мире. Мы также рассмотрим, как более широкая экосистема Ultralytics предоставляет значительные преимущества разработчикам, которые отдают приоритет простоте использования, эффективности памяти и универсальности развертывания.

Link to this sectionПроисхождение моделей и технические характеристики#

Понимание истории этих моделей помогает контекстуализировать их архитектурные решения и зависимости от фреймворков.

Link to this sectionYOLOv9: Решение проблемы информационного узкого места#

Представленный в начале 2024 года, YOLOv9 решает проблему потери данных, возникающую при прохождении информации через глубокие нейронные сети. Это высокооптимизированная сверточная нейронная сеть, разработанная для максимизации эффективности параметров.

Узнай больше о YOLOv9

Link to this sectionPP-YOLOE+: Развитие экосистемы Paddle#

Выпущенная Baidu в 2022 году, PP-YOLOE+ является итеративным улучшением PP-YOLOv2. Она использует парадигму без анкоров (anchor-free) и внедряет стратегию динамического назначения меток для улучшения сходимости и точности в рамках фреймворка PaddlePaddle.

Узнай больше о PP-YOLOE+

Link to this sectionАрхитектурное сравнение#

Link to this sectionProgrammable Gradient Information против CSPRepResStage#

Ключевым новшеством в YOLOv9 является Programmable Gradient Information (PGI). PGI выступает в качестве вспомогательного фреймворка контроля, гарантируя, что жизненно важная градиентная информация сохраняется и точно передается обратно на мелкие слои во время обучения. Это сочетается с Generalized Efficient Layer Aggregation Network (GELAN), которая объединяет сильные стороны CSPNet и ELAN для обеспечения высокой точности при резком снижении вычислительных затрат (FLOPs).

PP-YOLOE+ опирается на специализированный бэкбон под названием CSPRepResStage. Он использует методы репараметризации (аналогичные тем, что можно увидеть в RepVGG) для ускорения инференса путем объединения сверточных слоев во время развертывания. Кроме того, он использует Efficient Task-aligned head (ET-head) для балансировки задач классификации и регрессии.

Хотя PP-YOLOE+ является надежной, архитектура GELAN модели YOLOv9 обычно требует меньшего объема памяти как во время обучения, так и при инференсе, что делает её исключительно подходящей для периферийных AI-устройств.

Link to this sectionСравнение производительности#

При оценке моделей для продакшена критически важен баланс между mAP (средней точностью), скоростью инференса и размером модели.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionАнализ#

  • Эффективность параметров: YOLOv9 достигает значительно более высокой эффективности. Например, YOLOv9c достигает mAP 53,0% при использовании всего 25,3 млн параметров, в то время как PP-YOLOE+l требует более чем вдвое больше параметров (52,2 млн) для достижения чуть более низкого mAP 52,9%. Это радикально снижает требования к памяти для YOLOv9.
  • Скорость инференса: Модели YOLOv9 демонстрируют отличную оптимизацию для аппаратных ускорителей, таких как TensorRT, обеспечивая конкурентоспособную скорость инференса на GPU NVIDIA T4, что критически важно для инференса в реальном времени.

Link to this sectionМетодологии обучения и экосистема#

Выбор между этими моделями часто сводится к программной экосистеме.

Link to this sectionPP-YOLOE+ и PaddlePaddle#

PP-YOLOE+ тесно связана с пакетом PaddleDetection. Несмотря на свою мощность, она требует, чтобы пользователи ориентировались в сложной конфигурационной среде, управляемой через командную строку. Для команд, глубоко погруженных в экосистемы PyTorch или TensorFlow, переход на PaddlePaddle создает значительные трудности и требует больше времени на обучение.

Link to this sectionПреимущество Ultralytics: оптимизированные рабочие процессы#

В отличие от неё, YOLOv9 работает в рамках тщательно проработанной экосистемы Ultralytics. Созданная для разработчиков и исследователей, Ultralytics ставит во главу угла исключительную простоту использования. Python API полностью абстрагирует сложный шаблонный код.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
model.export(format="onnx")

Этот рабочий процесс подчеркивает превосходную эффективность обучения моделей Ultralytics. Родная поддержка аугментации данных, распределенного обучения и автоматического логирования на таких платформах, как Weights & Biases или MLflow, является стандартом.

Изучи последние достижения в Vision AI

Хотя YOLOv9 предлагает исключительную производительность, мы настоятельно рекомендуем рассмотреть недавно выпущенный Ultralytics YOLO26 для новых проектов. YOLO26 отличается нативным дизайном End-to-End без NMS, что радикально упрощает развертывание. Благодаря удалению DFL (Distribution Focal Loss удален для упрощения экспорта и лучшей совместимости с периферийными/маломощными устройствами), он обеспечивает до 43% более быстрый инференс на CPU для граничных вычислений. Работая на оптимизаторе MuSGD, он обеспечивает стабильное обучение и быструю сходимость. Кроме того, ProgLoss + STAL предоставляет улучшенные функции потерь с заметными улучшениями в распознавании мелких объектов, что критически важно для IoT, робототехники и аэрофотосъемки.

Link to this sectionУниверсальность и поддержка задач#

Современные проекты по компьютерному зрению редко ограничиваются простыми ограничивающими рамками (BBox).

PP-YOLOE+ в основном разработана для стандартного обнаружения объектов. Адаптация её архитектуры для других задач требует обширной индивидуальной инженерной доработки.

Напротив, фреймворк Ultralytics является многозадачным центром силы. Используя унифицированный API, разработчики могут без усилий переключаться со стандартного обнаружения объектов на сложную сегментацию экземпляров, высокоточное оценивание позы, детектирование с ориентированными ограничивающими рамками (OBB) для аэрофотосъемки и классификацию изображений. Эта беспрецедентная универсальность — причина, по которой корпоративные команды постоянно выбирают модели Ultralytics, такие как YOLOv9, YOLO11 и YOLO26.

Link to this sectionИдеальные варианты использования и приложения#

  • Аналитика умного города и управление дорожным движением: Высокая эффективность параметров и низкая задержка YOLOv9 (и последующего YOLO26) делают их идеальными для развертывания на ограниченном аппаратном обеспечении (например, устройствах NVIDIA Jetson) для мониторинга транспортного потока и городской безопасности.
  • Розничные системы инвентаризации: Для обнаружения плотных конфигураций мелких предметов на полках PGI в YOLOv9 эффективно сохраняет мелкозернистые пространственные детали, превосходя PP-YOLOE+ в задачах обнаружения мелких объектов.
  • Устаревшие системы: PP-YOLOE+ остается жизнеспособным вариантом исключительно для команд, которым строго предписано использовать программный стек Baidu/PaddlePaddle в существующей устаревшей инфраструктуре.

Для исследователей, изучающих архитектуры на основе Transformer, Ultralytics также нативно поддерживает RT-DETR в рамках того же простого в использовании API, гарантируя, что у тебя всегда есть доступ к оптимальной модели для твоих конкретных требований к развертыванию.

Комментарии