PP-YOLOE+ против YOLO26: передовые технологии обнаружения объектов
В быстро развивающейся области компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для обеспечения баланса между точностью, скоростью и простотой развертывания. В этом сравнении рассматриваются PP-YOLOE+, усовершенствованная версия PP-YOLOE от PaddlePaddle, и YOLO26, новейшая прорывная технология от Ultralytics, оптимизированная для периферийных устройств. Обе модели представляют собой важные вехи в области обнаружения в реальном времени, но они предназначены для разных экосистем и потребностей развертывания.
Сравнение визуальных характеристик
На следующем графике показаны компромиссы между PP-YOLOE+ и YOLO26 в плане производительности, где особо выделены улучшения в области задержки и точности, достигнутые благодаря новой архитектуре.
Обзор модели
PP-YOLOE+
PP-YOLOE+ — это обновленная версия PP-YOLOE, разработанная PaddlePaddle в Baidu. Она основана на парадигме без якорей и представляет собой унифицированную архитектуру «облако-периферия», которая хорошо работает на различных аппаратных платформах. Она направлена на оптимизацию компромисса между точностью и скоростью вывода, особенно в PaddlePaddle .
- Авторы: Авторы PaddlePaddle
- Организация:Baidu
- Дата: 2 апреля 2022 г.
- Arxiv:2203.16250
- GitHub:PaddleDetection
- Документация:Документация PP-YOLOE+
YOLO26
YOLO26 — это последняя версия YOLO от Ultralytics, разработанная для повышения эффективности пограничных вычислений. Выпущенная в январе 2026 года, она представляет собой нативную сквозную архитектуру NMS, устраняющую необходимость в постобработке с помощью Non-Maximum Suppression. Благодаря значительным оптимизациям, таким как удаление Distribution Focal Loss (DFL) и внедрение оптимизатора MuSGD, YOLO26 специально разработан для высокоскоростного вывода на CPU и устройствах с низким энергопотреблением.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 14 января 2026 года
- GitHub:Репозиторий Ultralytics
- Документация:Документация YOLO26
Техническая архитектура и инновации
Архитектурные различия между этими двумя моделями определяют их пригодность для выполнения конкретных задач.
Архитектура PP-YOLOE+
PP-YOLOE+ использует базовую структуру CSPRepResNet и сеть пирамиды признаков (FPN) с сетью агрегации путей (PAN) для многомасштабного слияния признаков. Ключевые инновации включают:
- Конструкция без якорей: устраняет необходимость настройки гиперпараметров якорной коробки, упрощая процесс обучения.
- Task Alignment Learning (TAL): явно согласовывает задачи классификации и локализации, улучшая качество выбора положительных образцов.
- ET-Head: эффективная головка, ориентированная на задачу, которая снижает вычислительную нагрузку при сохранении точности.
Однако PP-YOLOE+ полагается на традиционную NMS , которая может вносить изменчивость задержки в зависимости от количества обнаруженных объектов в сцене.
YOLO26 Инновации
YOLO26 представляет собой сдвиг парадигмы в сторону сквозного обнаружения.
- ДизайнNMS: генерируя строго одно предсказание на объект, YOLO26 полностью устраняет NMS . Это имеет решающее значение для развертывания на периферийных устройствах, где логика постобработки может стать узким местом.
- MuSGD Optimizer: вдохновленный обучением больших языковых моделей (LLM), этот гибрид SGD Muon (от Moonshot AI) стабилизирует обучение и ускоряет сходимость.
- ProgLoss + STAL: интеграция Progressive Loss и Soft Task Alignment Loss значительно повышает эффективность обнаружения мелких объектов, что является распространенной проблемой в аэрофотосъемке и робототехнике.
- Удаление DFL: удаление распределительной фокальной потери упрощает граф модели, упрощая экспорт в такие форматы, как ONNX и TFLite более чистым и более совместимым с различными аппаратными ускорителями.
Стабильность обучения с MuSGD
Оптимизатор MuSGD в YOLO26 обеспечивает стабильность обучения LLM в компьютерном зрении. Благодаря адаптивному управлению импульсом и градиентами он снижает необходимость в тщательной настройке гиперпараметров, позволяя пользователям достигать оптимальной точности за меньшее количество эпох по сравнению со стандартными SGD AdamW.
Метрики производительности
В таблице ниже сравниваются результаты PP-YOLOE+ и YOLO26 на наборе COCO .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Основные выводы:
- Эффективность: модели YOLO26 требуют меньшего количества FLOP и параметров для достижения более высокой точности. Например, YOLO26x достигает впечатляющих 57,5 mAP с помощью всего 55,7 млн параметров, тогда как PP-YOLOE+x требует 98,42 млн параметров для достижения 54,7 mAP.
- Скорость вывода: YOLO26 демонстрирует превосходную скорость на графических процессорах (T4 TensorRT), при этом модель Nano работает со скоростью всего 1,7 мс. CPU также заслуживает внимания: она обеспечивает на 43 % более быстрый CPU по сравнению с предыдущими поколениями, что делает ее идеальной для устройств без специальных ускорителей.
- Точность: во всех масштабах, от Nano/Tiny до Extra Large, YOLO26 превосходит PP-YOLOE+ по mAP наборе COCO .
Экосистема и простота использования
При выборе модели окружающая экосистема так же важна, как и сырые показатели.
Преимущества экосистемы Ultralytics
Ultralytics , включая YOLO26, используют преимущества унифицированной, ориентированной на пользователя платформы.
- Оптимизированный API: единый Python позволяет легко переключаться между функциями обнаружения, сегментации, оценки позы, классификации и OBB.
- Ultralytics : Ultralytics предлагает решение без кода для управления наборами данных, маркировки и обучения в один клик в облаке.
- Документация: Обширная и часто обновляемая документация помогает пользователям на каждом этапе, от установки до развертывания на периферийных устройствах, таких как Raspberry Pi.
- Эффективность использования памяти: YOLO26 разработан с учетом эффективного использования памяти во время обучения, что позволяет использовать более крупные пакеты данных на потребительских графических процессорах по сравнению с альтернативными решениями, требующими большого объема памяти.
Экосистема PaddlePaddle
PP-YOLOE+ глубоко интегрирован в PaddlePaddle Baidu PaddlePaddle . Несмотря на свою мощность, он часто требует использования специального набора инструментов (PaddleDetection), который может быть сложен для освоения пользователям, привыкшим к PyTorch. Он отлично подходит для сред, в которых приоритетом является интеграция PaddlePaddle (например, чипами Baidu Kunlun).
Случаи использования и приложения
Аналитика в реальном времени на периферии
Для приложений, работающих на периферийных устройствах, таких как интеллектуальные камеры или дроны, YOLO26 является явным победителем. Его сквозная конструкция NMS обеспечивает предсказуемую задержку, что имеет решающее значение для систем безопасности. Уменьшенное количество FLOP позволяет ему эффективно работать на оборудовании с батарейным питанием.
Промышленная автоматизация
В производственных условиях, требующих высокой точности, таких как контроль качества, обе модели подходят. Однако функция ProgLoss в YOLO26 улучшает обнаружение мелких дефектов, что дает ей преимущество в обнаружении мелких недостатков на производственных линиях.
Сложные задачи зрительного восприятия
В то время как PP-YOLOE+ ориентирован в первую очередь на обнаружение, YOLO26 из коробки поддерживает более широкий спектр задач.
- Сегментация экземпляров: для точного маскирования объектов.
- Оценка позы: крайне важно для распознавания человеческой деятельности.
- Ориентированные ограничительные рамки (OBB): необходимы для аэрофотосъемки и логистики перевозок, где объекты поворачиваются.
Многофункциональность
В отличие от PP-YOLOE+, который требует разных архитектур моделей для разных задач, Ultralytics просто менять задачу. Например, переключение на yolo26n-pose.pt мгновенно включает обнаружение ключевых точек с помощью того же привычного API.
Пример кода: Начало работы с YOLO26
Обучение и развертывание YOLO26 невероятно просто благодаряPython Ultralytics . Следующий фрагмент кода демонстрирует, как загрузить предварительно обученную модель и выполнить инференцию по изображению.
from ultralytics import YOLO
# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")
# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
for result in results:
result.show() # Display predictions on screen
result.save("output.jpg") # Save annotated image to disk
Заключение
И PP-YOLOE+, и YOLO26 являются впечатляющим вкладом в развитие компьютерного зрения. PP-YOLOE+ остается надежным выбором для команд, которые уже инвестировали в PaddlePaddle .
Однако для подавляющего большинства разработчиков и исследователей Ultralytics предлагает превосходный пакет. Его сквозная архитектура упрощает процессы развертывания, а современная точность и рекордная скорость делают его наиболее универсальной моделью на 2026 год. В сочетании с надежной поддержкой Ultralytics и такими функциями, как Ultralytics , YOLO26 значительно сокращает время от концепции до производства.
Для пользователей, интересующихся другими современными архитектурами, в документации также описаны отличные альтернативы, такие как YOLO11 и основанная на трансформере RT-DETR.