PP-YOLOE+ против YOLO26: Глубокое погружение в современные детекторы объектов
Ландшафт обнаружения объектов постоянно развивается, при этом исследователи расширяют границы точности, скорости и эффективности. В этом всестороннем анализе сравниваются две значимые модели: PP-YOLOE+, передовой детектор от команды PaddlePaddle компании Baidu, и YOLO26, новейшая передовая модель от Ultralytics.
В то время как PP-YOLOE+ при своем выпуске представил ключевые инновации в безанкерном обнаружении, YOLO26 знаменует собой прорыв нового поколения, предлагая нативные сквозные возможности, упрощенное развертывание и превосходную производительность для современных периферийных приложений.
PP-YOLOE+: Улучшенное detectирование без anchor-ов
PP-YOLOE+ — это обновленная версия PP-YOLOE, разработанная командой PaddlePaddle компании Baidu. Выпущенная в 2022 году, она сосредоточена на улучшении сходимости обучения и производительности последующих задач за счет мощной архитектуры backbone и эффективной конструкции head.
Детали PP-YOLOE+:
- Авторы: Авторы PaddlePaddle
- Организация:Baidu
- Дата: 2022-04-02
- Arxiv:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- Документация:Документация PP-YOLOE+
Архитектура и методология
PP-YOLOE+ основан на архитектуре backbone CSPRepResNet, которая использует дизайн с большим ядром для захвата более богатых признаков. Он использует стратегию TAL (Task Alignment Learning) для динамического назначения меток, обеспечивая высококачественное выравнивание между задачами классификации и локализации.
Ключевые архитектурные особенности включают:
- Безанкерный дизайн: Устраняет необходимость в предопределенных анкерных боксах, сокращая настройку гиперпараметров.
- Эффективная согласованная с задачей голова (ET-Head): Оптимизирует компромисс между скоростью и точностью.
- Динамическое назначение меток: Использует стратегию мягкого назначения меток для повышения стабильности обучения.
Будучи инновационным для своего времени, PP-YOLOE+ полагается на традиционное подавление немаксимумов (NMS) для постобработки. Этот шаг добавляет задержку во время инференса и усложняет конвейеры развертывания, поскольку реализации NMS могут различаться на разных аппаратных платформах, таких как TensorRT или ONNX Runtime.
YOLO26: Новый стандарт для периферийного ИИ
Выпущенный в начале 2026 года, YOLO26 разработан с нуля для решения проблем развертывания, характерных для предыдущих поколений. Он представляет собой нативную сквозную архитектуру без NMS, что делает его значительно быстрее и проще в развертывании на устройствах с ограниченными ресурсами.
Детали YOLO26:
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2026-01-14
- Документация:Документация Ultralytics YOLO26
- GitHub:https://github.com/ultralytics/ultralytics
Архитектура и инновации
YOLO26 выходит за рамки традиционных анкерных или безанкерных парадигм, интегрируя логику назначения меток и декодирования непосредственно в структуру модели.
- Сквозная архитектура без NMS: Прогнозируя однозначные соответствия во время обучения, YOLO26 полностью устраняет необходимость в NMS. Этот прорыв, впервые реализованный в YOLOv10, приводит к предсказуемой задержке и упрощенной логике экспорта.
- Удаление DFL: Удаление Distribution Focal Loss упрощает выходные головы, делая модель более удобной для 8-битного квантования и развертывания на периферии.
- Оптимизатор MuSGD: Гибрид SGD и Muon, вдохновленный обучением LLM (Kimi K2), обеспечивает стабильную сходимость и улучшенную обобщающую способность.
- ProgLoss + STAL: Новые функции потерь специально нацелены на обнаружение мелких объектов, что является распространенной слабостью в ранних детекторах.
Почему сквозной подход важен
Традиционные детекторы объектов выводят тысячи кандидатных боксов, требуя NMS для фильтрации дубликатов. NMS является вычислительно затратным и трудным для оптимизации на аппаратных ускорителях (таких как TPU или NPU). Сквозной дизайн YOLO26 выводит конечные боксы напрямую, устраняя это узкое место и ускоряя инференс до 43% на CPU.
Сравнение производительности
При сравнении производительности YOLO26 демонстрирует явное преимущество в эффективности, особенно для инференса на CPU и упрощенных рабочих процессов развертывания. В то время как PP-YOLOE+ остается сильной академической базовой моделью, YOLO26 предлагает более высокий mAPval при меньшем количестве параметров и значительно меньшей задержке.
В таблице ниже представлены метрики производительности на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Основные выводы
- Эффективность: YOLO26n достигает более высокой точности (40.9 mAP), чем PP-YOLOE+t (39.9 mAP), используя при этом значительно меньше FLOPs (5.4B против 19.15B). Это делает YOLO26 заметно лучше для мобильных и автономных приложений.
- Масштабируемость: В самом крупном масштабе YOLO26x превосходит PP-YOLOE+x почти на 3.0 mAP, сохраняя при этом меньшее количество параметров (55.7M против 98.42M).
- Скорость инференса: Удаление NMS и DFL позволяет YOLO26 работать до 43% быстрее на CPU, что является критически важной метрикой для таких устройств, как Raspberry Pi, или обычных облачных инстансов, где GPU недоступны.
Удобство использования и экосистема
Истинная ценность модели выходит за рамки сырых метрик и определяется тем, насколько легко ее можно интегрировать в производство.
Преимущества экосистемы Ultralytics
Ultralytics уделяет приоритетное внимание простоте использования и бесшовному опыту разработчиков. Благодаря простому API на python пользователи могут перейти от установки к обучению за считанные минуты.
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
path = model.export(format="onnx")
Экосистема Ultralytics также включает:
- Подробная документация: Обширные руководства по обучению, валидации и развертыванию.
- Широкая поддержка задач: В отличие от PP-YOLOE+, который в основном ориентирован на detect, YOLO26 поддерживает сегментацию экземпляров, оценку позы, классификацию и ориентированные ограничивающие рамки (obb) в рамках единой платформы.
- Активное сообщество: Благодаря частым обновлениям и обширной пользовательской базе, поиск решений для граничных случаев происходит быстрее через GitHub Issues или Discord сообщества.
Эффективность обучения
YOLO26 разработан для снижения потребления памяти во время обучения. Новый оптимизатор MuSGD стабилизирует динамику обучения, часто требуя меньше эпох для достижения сходимости по сравнению с расписанием, необходимым для PP-YOLOE+. Это приводит к снижению затрат на облачные вычисления и ускорению циклов итераций для исследований и разработок.
Идеальные варианты использования
Когда выбирать PP-YOLOE+
- Устаревшие рабочие процессы PaddlePaddle: Если ваша существующая инфраструктура тесно связана с фреймворком Baidu PaddlePaddle и движками вывода, PP-YOLOE+ остается совместимым выбором.
- Академические исследования: Для исследователей, специально изучающих стратегии назначения без якорей в семействе архитектур ResNet.
Когда стоит выбрать YOLO26
- Развертывание на периферии в реальном времени: Для приложений на Android, iOS или встроенных системах Linux, где важна каждая миллисекунда задержки.
- Обнаружение мелких объектов: Сочетание ProgLoss и STAL делает YOLO26 превосходным для таких задач, как анализ изображений с дронов или обнаружение дефектов в производстве.
- Требования к многозадачности: Если ваш проект требует переключения между detect, segment и оценкой позы без изучения нового API или кодовой базы.
- Быстрое прототипирование: Принцип «все включено» в пакете Ultralytics позволяет стартапам и корпоративным командам быстрее переходить от данных к развертыванию.
Заключение
В то время как PP-YOLOE+ служил мощным детектором без якорей в начале 2020-х годов, YOLO26 представляет будущее компьютерного зрения. Устраняя узкое место NMS, оптимизируя скорость CPU и предоставляя унифицированный интерфейс для нескольких задач компьютерного зрения, YOLO26 предлагает более надежное, эффективное и удобное решение для современных задач ИИ.
Для разработчиков, стремящихся интегрировать передовые возможности компьютерного зрения с минимальными трудностями, Ultralytics YOLO26 является рекомендуемым выбором.
Узнать больше
Интересуют другие архитектуры? Изучите YOLO11, нашу модель предыдущего поколения, которая по-прежнему полностью поддерживается, или ознакомьтесь с RT-DETR для решений по detect на основе трансформеров.