YOLO26 против PP-YOLOE+: усовершенствованное обнаружение объектов с эффективностью нового поколения
Выбор правильной архитектуры обнаружения объектов является критически важным решением для разработчиков, создающих приложения компьютерного зрения. В этом руководстве представлено подробное техническое сравнение двух влиятельных моделей: Ultralytics и PP-YOLOE+. Хотя обе модели представляют собой важные вехи в эволюции обнаружения в реальном времени, они отвечают разным инженерным философиям и средам развертывания.
Ultralytics , выпущенный в январе 2026 года, представляет собой нативную архитектуру NMS, оптимизированную для CPU и простоты использования. В отличие от него, PP-YOLOE+, разработанный PaddlePaddle, фокусируется на усовершенствовании обнаружения без анкоров в экосистеме Baidu. В этом анализе подробно рассматриваются их архитектуры, показатели производительности и идеальные сценарии использования, чтобы помочь вам выбрать лучший инструмент для вашего проекта.
Резюме: основные различия
| Функциональность | Ultralytics YOLO26 | PP-YOLOE+ |
|---|---|---|
| Архитектура | Сквозной (NMS) | Без якоря (требуется NMS) |
| Скорость инференса | Оптимизировано для CPU Edge (до 43% быстрее) | Оптимизировано для GPU PaddleLite |
| Фреймворк | PyTorch нативный), экспорт в нескольких форматах | PaddlePaddle |
| Фокус обучения | Простота использования, низкое потребление памяти, оптимизатор MuSGD | Высокая точность, управляемая конфигурацией |
| Задачи | detect, segment, Поза, obb, classify | Обнаружение (основное), другие через отдельные конфигурации |
Ultralytics : революция «Edge-First»
Ultralytics представляет собой сдвиг парадигмы в YOLO . Благодаря устранению немаксимального подавления (NMS) и распределенного фокального убытка (DFL), YOLO26 достигает оптимизированного конвейера развертывания, который является нативным от начала до конца. Такой выбор конструкции значительно снижает изменчивость задержки, что делает его особенно эффективным для приложений искусственного интеллекта на периферии, где предсказуемое время выполнения имеет первостепенное значение.
Основные архитектурные инновации
Архитектура YOLO26 определяется ее ориентацией на эффективность и стабильность обучения:
- Полная NMS: в отличие от традиционных детекторов, которые выдают тысячи кандидатов в виде прямоугольников, требующих сложной постобработки, YOLO26 напрямую предсказывает окончательный набор объектов. Этот прорыв, впервые реализованный в YOLOv10, упрощает процесс экспорта в такие форматы, как ONNX TensorRT.
- MuSGD Optimizer: Вдохновленный инновациями в области обучения LLM от Moonshot AI's Kimi K2, YOLO26 использует гибрид SGD и Muon. Это приводит к более быстрой конвергенции и более стабильному обучению, даже с меньшими размерами партий.
- ProgLoss + STAL: Внедрение Progressive Loss (ProgLoss) и Soft-Target Anchor Loss (STAL) обеспечивает заметные улучшения в распознавании мелких объектов. Это имеет решающее значение для таких секторов, как сельское хозяйство, где обнаружение вредителей или удаленных культур требует высокой точности.
PP-YOLOE+: PaddlePaddle
PP-YOLOE+ — это усовершенствованная версия PP-YOLOv2, построенная на основе PaddlePaddle . Она использует философию без анкеров, чтобы избежать настройки гиперпараметров, связанных с анкерными коробками. Она объединяет мощную основу (CSPRepResNet) и эффективную головку (ET-head) для обеспечения баланса между скоростью и точностью, в частности на аппаратном обеспечении, поддерживаемом PaddleLite.
Основные характеристики
- CSPRepResNet Backbone: использует свертки с большим ядром для захвата эффективных рецептивных полей, улучшая возможности извлечения признаков.
- TAL (Task Alignment Learning): включает в себя стратегии динамического присвоения меток для согласования задач классификации и локализации во время обучения.
- Интеграция с экосистемой Paddle: глубокая интеграция с такими инструментами, как PaddleSlim для квантования, что делает его отличным выбором для разработчиков, уже использующих программный стек Baidu.
Ориентиры производительности
В следующей таблице представлено сравнение моделей на COCO . YOLO26 демонстрирует превосходную эффективность, особенно в CPU , где его архитектура снижает накладные расходы до 43%.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Идеальные варианты использования и внедрения
Выбор между этими моделями часто зависит от вашего оборудования для развертывания и предпочтений в отношении рабочего процесса.
Когда выбрать Ultralytics
YOLO26 разработан для разработчиков, которым нужна универсальность и скорость. Благодаря меньшему объему памяти, необходимому для обучения, он доступен даже тем, кто не имеет GPU корпоративного уровня.
- Пограничные устройства (Raspberry Pi, мобильные устройства): благодаря удалению DFL и конструкции NMS YOLO26 является лучшим выбором для CPU и NPU. Узнайте, как эффективно развертывать на пограничных устройствах.
- Аналитика видео в реальном времени: для мониторинга «умных» городов стабильная задержка YOLO26 гарантирует, что во время пикового трафика не будет пропущено ни одного кадра.
- Мультимодальные проекты: если ваш проект требует оценки позы или ориентированных ограничительных прямоугольников (OBB) наряду со стандартным обнаружением, YOLO26 предлагает все эти задачи в одной библиотеке.
Когда следует выбирать PP-YOLOE+
- PaddlePaddle : если ваша производственная среда уже построена на PaddleServing, использование PP-YOLOE+ минимизирует проблемы с интеграцией.
- Серверные GPU : PP-YOLOE+ может быть очень эффективным в сценариях с высокой пропускной способностью на NVIDIA при оптимизации с помощью TensorRT PaddleInference, особенно для обработки статических изображений.
Преимущество экосистемы
Ultralytics беспроблемный переход от нуля до героя. С помощью Ultralytics вы можете маркировать данные, обучать в облаке и развертывать в любом формате (TFLite, ONNX, CoreML) без написания сложных скриптов экспорта.
Методы обучения: простота или индивидуальный подход
Опыт обучения значительно различается в этих двух средах. Ultralytics простоте использования и автоматизации, в то время как PaddlePaddle требует более подробного управления конфигурацией.
Рабочий процесс Ultralytics
Обучение YOLO26 упрощено до нескольких строк Python или одной CLI . Фреймворк автоматически обрабатывает эволюцию гиперпараметров и проверки наборов данных.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Эта простота распространяется и на Ultralytics , где вы можете удаленно управлять наборами данных и контролировать обучение. Оптимизатор MuSGD работает в фоновом режиме, обеспечивая более быструю конвергенцию вашей модели и сокращая расходы на вычисления.
PP-YOLOE+ Рабочий процесс обучения
Обучение PP-YOLOE+ обычно включает в себя редактирование конфигурационных файлов YAML в репозитории PaddleDetection. Несмотря на свою гибкость, этот подход может быть сложным для тех, кто не знаком со специфическим синтаксисом системы конфигурации Paddle. Он в значительной степени опирается на традиционный SGD импульсом и требует ручной настройки графиков скорости обучения для достижения оптимальных результатов на пользовательских наборах данных.
Универсальность и сложные задачи
Основным отличием является объем задач, поддерживаемых из коробки.
Ultralytics — это настоящий многозадачный обучающийся алгоритм. Помимо обнаружения объектов, он включает в себя специализированные архитектуры для:
- Сегментация экземпляров: с семантической потерей сегментации и многомасштабным прототипом для точных масок.
- Оценка позы: использование оценки остаточной логарифмической вероятности (RLE) для точной регрессии ключевых точек.
- OBB: Использование специального угла потери для обработки повернутых объектов на аэрофотоснимках.
PP-YOLOE+ в первую очередь является детектором объектов. Хотя библиотека PaddleDetection поддерживает и другие задачи, для их решения часто используются совершенно другие архитектуры моделей (например, Mask R-CNN для сегментации), а не унифицированная архитектура YOLO, что усложняет развертывание многозадачных конвейеров.
Заключение
При сравнении YOLO26 и PP-YOLOE+ выбор очевиден для большинства современных сценариев разработки. Хотя PP-YOLOE+ остается сильным вариантом для существующих экосистем Baidu/Paddle, Ultralytics предлагает более комплексное, эффективное и удобное для пользователя решение.
Благодаря своей сквозной конструкции NMS, YOLO26 устраняет узкие места постобработки, обеспечивая на 43 % более быстрое CPU . В сочетании с надежной Ultralytics и способностью обрабатывать различные задачи, такие как сегментация и оценка позы, YOLO26 является рекомендуемым выбором для разработчиков, которые хотят обеспечить будущее своих приложений компьютерного зрения в 2026 году.
Для тех, кто заинтересован в изучении других моделей, в Ultralytics также рассматриваются YOLO11 и RT-DETR, что гарантирует вам наличие подходящего инструмента для решения любой задачи.
YOLO26 Подробная информация:
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 14.01.2026
GitHub: Ultralytics
PP-YOLOE+ Детали:
Автор: PaddlePaddle
Организация: Baidu
Дата: 2022-04-02
Arxiv: 2203.16250
GitHub: PaddleDetection Repository