Перейти к содержанию

PP-YOLOE+ против YOLO26: Глубокий анализ архитектур обнаружения объектов в реальном времени

Ландшафт компьютерного зрения в реальном времени пережил огромный рост, обусловленный потребностью в масштабируемых, эффективных и высокоточных моделях обнаружения объектов. Две выдающиеся архитектуры в этой области — это PP-YOLOE+, мощный детектор из экосистемы PaddlePaddle, и Ultralytics YOLO26, новейшая передовая модель, переопределяющая развертывание на периферии и эффективность обучения.

Это всеобъемлющее руководство сравнивает эти две модели, подчеркивая их архитектуры, метрики производительности, методологии обучения и идеальные сценарии использования, чтобы помочь вам принять обоснованное решение для вашего следующего проекта в области ИИ.

Технические характеристики и авторство

Понимание истоков и философии проектирования, лежащих в основе этих моделей, обеспечивает важный контекст для их применения в реальных условиях.

Детали PP-YOLOE+:

Узнайте больше о PP-YOLOE+

Детали YOLO26:

Узнайте больше о YOLO26

Архитектурные инновации

Архитектура PP-YOLOE+

Основываясь на своем предшественнике PP-YOLOv2, PP-YOLOE+ представляет собой надежную конструкцию, разработанную для промышленных приложений. Он использует бэкенд CSPRepResNet и ET-голову (Efficient Task-aligned head) для баланса скорости и точности. PP-YOLOE+ использует динамическое присвоение меток (TAL) и легко интегрируется с фреймворком PaddlePaddle от Baidu, что делает его высокооптимизированным для GPU NVIDIA, таких как T4 и V100. Однако его сильная зависимость от экосистемы PaddlePaddle может создавать трудности для разработчиков, использующих PyTorch рабочие процессы.

Архитектура YOLO26: Революция с приоритетом периферийных устройств

Выпущенный в начале 2026 года, Ultralytics YOLO26 полностью переосмысливает конвейер обнаружения в реальном времени, делая огромный акцент на простоте развертывания и эффективности на периферии.

Ключевые нововведения YOLO26 включают:

  • Сквозная архитектура без NMS: YOLO26 изначально является сквозной, полностью исключая необходимость постобработки методом Non-Maximum Suppression (NMS). Этот прорыв, впервые примененный в YOLOv10, обеспечивает постоянную задержку вывода независимо от загруженности сцены, что значительно упрощает развертывание.
  • Удаление DFL: Удаление Distribution Focal Loss (DFL) в YOLO26 значительно упрощает выходную головную часть. Это обеспечивает гораздо лучшую совместимость с периферийными устройствами и микроконтроллерами.
  • До 43% более быстрый инференс на CPU: Благодаря удалению DFL и структурным оптимизациям YOLO26 сильно оптимизирован для сред без выделенных GPU, достигая до 43% более высокой скорости инференса на CPU по сравнению с YOLO11.
  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM, такими как используемые Moonshot AI, YOLO26 представляет гибрид SGD и Muon. Это обеспечивает беспрецедентную стабильность обучения и более быструю сходимость для задач компьютерного зрения.
  • ProgLoss + STAL: Передовые функции потерь целенаправленно улучшают распознавание мелких объектов, что критически важно для операций с дронами и граничных датчиков IoT.

Улучшения, специфичные для задачи, в YOLO26

Помимо стандартных ограничивающих рамок, YOLO26 представляет специфические улучшения для всех задач компьютерного зрения. Он использует функцию потерь семантической сегментации и многомасштабное прототипирование для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для оценки позы и специализированную функцию потерь угла для решения проблем границ при обнаружении ориентированных ограничивающих рамок (OBB).

Производительность и метрики

В таблице ниже представлен всесторонний обзор сравнения PP-YOLOE+ с YOLO26 для различных размеров моделей. Модели YOLO26 явно доминируют по чистой скорости, эффективности параметров и общей средней средней точности (mAP).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Примечание: Значения, выделенные жирным шрифтом, подчеркивают наилучшие показатели метрик среди всех моделей.

Анализ

  • Требования к памяти и эффективность: YOLO26 требует значительно меньше параметров и FLOPs для достижения более высоких показателей mAP. Например, модель YOLO26n (Nano) достигает 40.9 mAP всего с 2.4 млн параметров, превосходя модель PP-YOLOE+t при примерно вдвое меньшем размере. Это приводит к снижению использования памяти как во время обучения, так и во время развертывания.
  • Скорость инференса: При экспорте с использованием TensorRT YOLO26 доминирует по метрикам задержки. Удаление NMS гарантирует, что время инференса в 1.7 мс на GPU T4 остается идеально стабильным, тогда как PP-YOLOE+ зависит от потенциально изменчивого времени постобработки.

Преимущество Ultralytics: Экосистема и простота использования

Хотя сырые метрики важны, опыт разработчика часто определяет успех проекта. Платформа Ultralytics предоставляет хорошо поддерживаемую экосистему, которая полностью превосходит старые фреймворки.

  1. Простота использования: Ultralytics абстрагирует от сложного шаблонного кода. Обучение YOLO26 занимает всего несколько строк Python, избегая плотных файлов конфигурации, требуемых PP-YOLOE+.
  2. Универсальность: PP-YOLOE+ — это в первую очередь архитектура для обнаружения объектов. YOLO26 предлагает готовую поддержку для сегментации, классификации, оценки позы и OBB.
  3. Эффективность обучения: Модели Ultralytics YOLO требуют значительно меньше памяти CUDA по сравнению с громоздкими моделями-трансформерами, такими как RT-DETR или старыми архитектурами, что позволяет исследователям обучать передовые модели на потребительском оборудовании.

Другие модели Ultralytics

Хотя YOLO26 является вершиной текущих исследований, экосистема Ultralytics также включает YOLO11 и YOLOv8. Обе модели остаются высокопроизводительными и пользуются огромной поддержкой сообщества, что делает их идеальными для пользователей, переходящих со старых, устаревших систем.

Пример кода: Обучение YOLO26

Начало работы с Ultralytics не вызывает затруднений. Вот полностью исполняемый пример, демонстрирующий, как загрузить, обучить и проверить модель YOLO26:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset using the new MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=16,
    optimizer="auto",  # MuSGD is automatically engaged for YOLO26
)

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
print(f"Model successfully exported to: {export_path}")

Идеальные варианты использования

Когда следует выбирать PP-YOLOE+

  • Устаревшая инфраструктура PaddlePaddle: Если предприятие уже глубоко интегрировано в технологический стек Baidu и использует оборудование, предварительно настроенное для Paddle Inference, PP-YOLOE+ является безопасным и стабильным выбором.
  • Азиатские производственные центры: Многие конвейеры машинного зрения в Азии имеют надежную, уже существующую поддержку PP-YOLOE+ для автоматизированного detect дефектов.

Когда выбирать YOLO26

  • Периферийные вычисления и IoT: 43% более быстрый инференс на CPU и удаление DFL делают YOLO26 бесспорным чемпионом для развертывания на Raspberry Pi, мобильных телефонах и встраиваемых устройствах.
  • Переполненные сцены и умные города: Архитектура End-to-End NMS-Free гарантирует стабильную задержку в плотных средах, таких как управление парковками и мониторинг трафика, где традиционный NMS привел бы к узким местам.
  • Многозадачные проекты: Если ваш конвейер требует отслеживания объектов, оценки поз людей или генерации пиксельно-точных масок, YOLO26 справляется со всем этим в рамках единого унифицированного пакета python.

Заключение

Хотя PP-YOLOE+ остается высокопроизводительным детектором в рамках своей специфической экосистемы, выпуск YOLO26 изменил парадигму. Объединив оптимизации обучения, вдохновленные LLM (MuSGD), с неустанно оптимизированной архитектурой без NMS, Ultralytics создала модель, которая является одновременно высокоточной и легко развертываемой. Для современных разработчиков, ищущих оптимальный баланс скорости, точности и удобства разработки, YOLO26 является окончательным выбором.


Комментарии