YOLO11 против PP-YOLOE+: техническое сравнение детекторов реального времени

Выбор оптимальной архитектуры нейронной сети критически важен при развертывании приложений компьютерного зрения в производстве. В этом техническом обзоре мы рассматриваем две известные модели в области обнаружения объектов в реальном времени: Ultralytics YOLO11 и PP-YOLOE+ от Baidu. Обе архитектуры обеспечивают высокую производительность, но подходят к решению задач точности, скорости вывода и развития экосистемы разработчиков совершенно по-разному.

Ниже представлена интерактивная диаграмма, демонстрирующая границы производительности этих моделей, чтобы помочь тебе определить лучший вариант для ограничений твоего оборудования.

Происхождение моделей и техническая преемственность

Понимание происхождения и принципов проектирования этих моделей дает ценный контекст для оценки их сильных сторон и идеальных сценариев использования.

Подробности о YOLO11

Разработанная Ultralytics, YOLO11 представляет собой высоко оптимизированную итерацию серии YOLO, приоритетом которой является баланс между высокоскоростным выводом, экстремальной эффективностью параметров и непревзойденной простотой использования. Она широко известна своими унифицированными многозадачными возможностями и удобным для разработчиков Python API.

Узнай больше о YOLO11

Детали PP-YOLOE+

PP-YOLOE+ — это эволюционная версия PP-YOLOv2, построенная на базе фреймворка PaddlePaddle. Она внедряет архитектурные изменения, такие как бэкбон CSPRepResNet и алгоритм Task Alignment Learning (TAL), чтобы расширить границы точности, особенно на мощных GPU.

Узнай больше о PP-YOLOE+

Архитектурные различия

Фундаментальные архитектурные решения YOLO11 и PP-YOLOE+ отражают их различные приоритеты в ландшафте компьютерного зрения.

YOLO11 построена на высоко оптимизированном бэкбоне и детектирующей голове без анкоров (anchor-free). Она использует блоки C3k2 и Spatial Pyramid Pooling - Fast (SPPF) для захвата многомасштабных признаков с минимальными вычислительными затратами. Эта архитектура очень выгодна для сокращения задержки вывода на устройствах с ограниченными ресурсами, таких как edge NPU и мобильные CPU. Кроме того, YOLO11 изначально разработана для многозадачного обучения, поддерживая сегментацию экземпляров, оценку позы и обнаружение с помощью ориентированных ограничивающих рамок (OBB) сразу «из коробки».

PP-YOLOE+ представляет бэкбон CSPRepResNet и эффективную голову Task-aligned (ET-head). Она активно использует методы перепараметризации (rep-parameterization) для увеличения репрезентативной способности во время обучения, сворачивая эти параметры в стандартные свертки для вывода. Хотя это дает впечатляющую среднюю точность (mAP), результирующие модели, как правило, более тяжелы по количеству параметров и объему памяти, что делает их более подходящими для развертывания на мощных серверных GPU, а не на легких edge-устройствах.

Многозадачная универсальность

Если твоему проекту требуется выход за рамки стандартных прямоугольных рамок, Ultralytics YOLO11 предоставляет встроенную поддержку сегментации, оценки позы и классификации в рамках одного и того же API, что значительно снижает накладные расходы на разработку по сравнению с интеграцией нескольких различных репозиториев.

Производительность и бенчмарки

При оценке производительности мы смотрим на точность (mAP), скорость вывода на различном оборудовании и эффективность модели (параметры и FLOPs). В таблице ниже выделены сравнительные показатели, при этом наиболее эффективные или самые высокие значения выделены жирным шрифтом.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Анализ

YOLO11 демонстрирует явное преимущество в балансе производительности и эффективности параметров. Например, YOLO11m достигает более высокого значения mAP (51.5), чем PP-YOLOE+m (49.8), используя при этом меньше параметров (20.1 млн против 23.43 млн) и достигая значительно более высокой скорости вывода на TensorRT (4.7 мс против 5.56 мс). Легкий характер моделей YOLO11 по своей сути приводит к меньшим требованиям к памяти как во время обучения модели, так и при развертывании.

Экосистема обучения и простота использования

Истинная ценность модели часто заключается в том, насколько легко разработчики могут обучить ее на собственных наборах данных компьютерного зрения и развернуть в продакшене.

Преимущество Ultralytics

Ultralytics отдает приоритет оптимизированному опыту разработчика. Обучение YOLO11 управляется через простой Python API или CLI, абстрагируя сложный шаблонный код. Платформа Ultralytics еще больше улучшает это, предоставляя обучение без кода, автоматизированное управление наборами данных и экспорт в один клик в такие форматы, как ONNX, CoreML и TensorRT.

Более того, модели YOLO обладают высокой эффективностью использования памяти во время обучения, избегая огромных затрат VRAM, типичных для архитектур на основе трансформеров или тяжелых перепараметризованных моделей, что позволяет проводить обучение на потребительском оборудовании.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Экосистема PP-YOLOE+

PP-YOLOE+ работает в экосистеме PaddleDetection. Хотя этот фреймворк мощный и глубоко интегрирован с промышленными решениями Baidu, он требует от разработчиков использования специфического фреймворка глубокого обучения PaddlePaddle. Это может создать более крутую кривую обучения для команд, которые уже стандартизированы на PyTorch. Кроме того, экспорт моделей PP-YOLOE+ в стандартные универсальные форматы для edge-устройств может потребовать дополнительных шагов конвертации по сравнению с родными конвейерами экспорта, имеющимися в рабочих процессах Ultralytics.

Идеальные сценарии использования

Выбор между этими моделями зависит от твоей конкретной среды развертывания.

  • Choose YOLO11 for agile development, edge computing, and mobile applications. Its high inference speed, low memory footprint, and extensive export capabilities make it ideal for tasks like real-time retail inventory management on standard CPUs, drone-based aerial imagery analysis, and complex multi-task pipelines.
  • Выбирай PP-YOLOE+, если весь твой производственный конвейер уже глубоко инвестирован в экосистему PaddlePaddle или если ты развертываешь на мощных выделенных серверах вывода, где ограничения по памяти и совместимость оборудования (вне оптимизированного оборудования Paddle) не являются главными проблемами.

Следующее поколение: представляем YOLO26

Хотя YOLO11 остается невероятно мощной, область ИИ развивается быстро. Для обеспечения абсолютного лидерства в области обнаружения объектов Ultralytics представила новую модель YOLO26. Выпущенная в январе 2026 года, YOLO26 опирается на успехи своих предшественников, обеспечивая беспрецедентную эффективность и точность.

Ключевые инновации YOLO26:

  • Сквозной дизайн без NMS: YOLO26 нативно исключает постпроцессинг подавления немаксимумов (NMS). Это значительно ускоряет вывод и упрощает логику развертывания — архитектурный скачок, впервые внедренный в YOLOv10.
  • До 43% быстрее вывод на CPU: оптимизировано специально для edge-устройств без GPU, что обеспечивает работу в реальном времени на менее мощном оборудовании.
  • Оптимизатор MuSGD: вдохновленный стабильностью обучения больших языковых моделей (LLM), этот гибрид SGD и Muon обеспечивает более быструю сходимость и более стабильное обучение.
  • ProgLoss + STAL: улучшенные функции потерь кардинально повышают качество распознавания мелких объектов, что критически важно для применения дронов и систем видеонаблюдения.
  • Удаление DFL: удаление Distribution Focal Loss упрощает экспорт модели и значительно улучшает совместимость с широким спектром edge-устройств.

Для новых проектов, где приоритет отдается скорости, простоте экспорта и максимальной точности, мы настоятельно рекомендуем использовать возможности YOLO26 через платформу Ultralytics.

Если ты оцениваешь другие архитектуры, тебя также может заинтересовать сравнение YOLO11 с RT-DETR или исследование того, как классическая модель YOLOv8 показывает себя в современных бенчмарках.

Комментарии