Перейти к содержанию

PP-YOLOE+ против YOLO26: Глубокое погружение в современные детекторы объектов

Ландшафт обнаружения объектов постоянно развивается, при этом исследователи расширяют границы точности, скорости и эффективности. В этом всестороннем анализе сравниваются две значимые модели: PP-YOLOE+, передовой детектор от команды PaddlePaddle компании Baidu, и YOLO26, новейшая передовая модель от Ultralytics.

В то время как PP-YOLOE+ при своем выпуске представил ключевые инновации в безанкерном обнаружении, YOLO26 знаменует собой прорыв нового поколения, предлагая нативные сквозные возможности, упрощенное развертывание и превосходную производительность для современных периферийных приложений.

PP-YOLOE+: Улучшенное detectирование без anchor-ов

PP-YOLOE+ — это обновленная версия PP-YOLOE, разработанная командой PaddlePaddle компании Baidu. Выпущенная в 2022 году, она сосредоточена на улучшении сходимости обучения и производительности последующих задач за счет мощной архитектуры backbone и эффективной конструкции head.

Детали PP-YOLOE+:

Архитектура и методология

PP-YOLOE+ основан на архитектуре backbone CSPRepResNet, которая использует дизайн с большим ядром для захвата более богатых признаков. Он использует стратегию TAL (Task Alignment Learning) для динамического назначения меток, обеспечивая высококачественное выравнивание между задачами классификации и локализации.

Ключевые архитектурные особенности включают:

  • Безанкерный дизайн: Устраняет необходимость в предопределенных анкерных боксах, сокращая настройку гиперпараметров.
  • Эффективная согласованная с задачей голова (ET-Head): Оптимизирует компромисс между скоростью и точностью.
  • Динамическое назначение меток: Использует стратегию мягкого назначения меток для повышения стабильности обучения.

Будучи инновационным для своего времени, PP-YOLOE+ полагается на традиционное подавление немаксимумов (NMS) для постобработки. Этот шаг добавляет задержку во время инференса и усложняет конвейеры развертывания, поскольку реализации NMS могут различаться на разных аппаратных платформах, таких как TensorRT или ONNX Runtime.

YOLO26: Новый стандарт для периферийного ИИ

Выпущенный в начале 2026 года, YOLO26 разработан с нуля для решения проблем развертывания, характерных для предыдущих поколений. Он представляет собой нативную сквозную архитектуру без NMS, что делает его значительно быстрее и проще в развертывании на устройствах с ограниченными ресурсами.

Детали YOLO26:

Архитектура и инновации

YOLO26 выходит за рамки традиционных анкерных или безанкерных парадигм, интегрируя логику назначения меток и декодирования непосредственно в структуру модели.

  • Сквозная архитектура без NMS: Прогнозируя однозначные соответствия во время обучения, YOLO26 полностью устраняет необходимость в NMS. Этот прорыв, впервые реализованный в YOLOv10, приводит к предсказуемой задержке и упрощенной логике экспорта.
  • Удаление DFL: Удаление Distribution Focal Loss упрощает выходные головы, делая модель более удобной для 8-битного квантования и развертывания на периферии.
  • Оптимизатор MuSGD: Гибрид SGD и Muon, вдохновленный обучением LLM (Kimi K2), обеспечивает стабильную сходимость и улучшенную обобщающую способность.
  • ProgLoss + STAL: Новые функции потерь специально нацелены на обнаружение мелких объектов, что является распространенной слабостью в ранних детекторах.

Узнайте больше о YOLO26

Почему сквозной подход важен

Традиционные детекторы объектов выводят тысячи кандидатных боксов, требуя NMS для фильтрации дубликатов. NMS является вычислительно затратным и трудным для оптимизации на аппаратных ускорителях (таких как TPU или NPU). Сквозной дизайн YOLO26 выводит конечные боксы напрямую, устраняя это узкое место и ускоряя инференс до 43% на CPU.

Сравнение производительности

При сравнении производительности YOLO26 демонстрирует явное преимущество в эффективности, особенно для инференса на CPU и упрощенных рабочих процессов развертывания. В то время как PP-YOLOE+ остается сильной академической базовой моделью, YOLO26 предлагает более высокий mAPval при меньшем количестве параметров и значительно меньшей задержке.

В таблице ниже представлены метрики производительности на наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Основные выводы

  1. Эффективность: YOLO26n достигает более высокой точности (40.9 mAP), чем PP-YOLOE+t (39.9 mAP), используя при этом значительно меньше FLOPs (5.4B против 19.15B). Это делает YOLO26 заметно лучше для мобильных и автономных приложений.
  2. Масштабируемость: В самом крупном масштабе YOLO26x превосходит PP-YOLOE+x почти на 3.0 mAP, сохраняя при этом меньшее количество параметров (55.7M против 98.42M).
  3. Скорость инференса: Удаление NMS и DFL позволяет YOLO26 работать до 43% быстрее на CPU, что является критически важной метрикой для таких устройств, как Raspberry Pi, или обычных облачных инстансов, где GPU недоступны.

Удобство использования и экосистема

Истинная ценность модели выходит за рамки сырых метрик и определяется тем, насколько легко ее можно интегрировать в производство.

Преимущества экосистемы Ultralytics

Ultralytics уделяет приоритетное внимание простоте использования и бесшовному опыту разработчиков. Благодаря простому API на python пользователи могут перейти от установки к обучению за считанные минуты.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for deployment
path = model.export(format="onnx")

Экосистема Ultralytics также включает:

Эффективность обучения

YOLO26 разработан для снижения потребления памяти во время обучения. Новый оптимизатор MuSGD стабилизирует динамику обучения, часто требуя меньше эпох для достижения сходимости по сравнению с расписанием, необходимым для PP-YOLOE+. Это приводит к снижению затрат на облачные вычисления и ускорению циклов итераций для исследований и разработок.

Идеальные варианты использования

Когда выбирать PP-YOLOE+

  • Устаревшие рабочие процессы PaddlePaddle: Если ваша существующая инфраструктура тесно связана с фреймворком Baidu PaddlePaddle и движками вывода, PP-YOLOE+ остается совместимым выбором.
  • Академические исследования: Для исследователей, специально изучающих стратегии назначения без якорей в семействе архитектур ResNet.

Когда стоит выбрать YOLO26

  • Развертывание на периферии в реальном времени: Для приложений на Android, iOS или встроенных системах Linux, где важна каждая миллисекунда задержки.
  • Обнаружение мелких объектов: Сочетание ProgLoss и STAL делает YOLO26 превосходным для таких задач, как анализ изображений с дронов или обнаружение дефектов в производстве.
  • Требования к многозадачности: Если ваш проект требует переключения между detect, segment и оценкой позы без изучения нового API или кодовой базы.
  • Быстрое прототипирование: Принцип «все включено» в пакете Ultralytics позволяет стартапам и корпоративным командам быстрее переходить от данных к развертыванию.

Заключение

В то время как PP-YOLOE+ служил мощным детектором без якорей в начале 2020-х годов, YOLO26 представляет будущее компьютерного зрения. Устраняя узкое место NMS, оптимизируя скорость CPU и предоставляя унифицированный интерфейс для нескольких задач компьютерного зрения, YOLO26 предлагает более надежное, эффективное и удобное решение для современных задач ИИ.

Для разработчиков, стремящихся интегрировать передовые возможности компьютерного зрения с минимальными трудностями, Ultralytics YOLO26 является рекомендуемым выбором.

Узнать больше

Интересуют другие архитектуры? Изучите YOLO11, нашу модель предыдущего поколения, которая по-прежнему полностью поддерживается, или ознакомьтесь с RT-DETR для решений по detect на основе трансформеров.


Комментарии