Перейти к содержанию

YOLO11 vs PP-YOLOE+: Техническое сравнение детекторов реального времени

Выбор оптимальной архитектуры нейронной сети имеет решающее значение при развертывании приложений компьютерного зрения в производстве. В этом техническом сравнении мы рассмотрим две выдающиеся модели в области обнаружения объектов в реальном времени: Ultralytics YOLO11 и PP-YOLOE+ от Baidu. Обе архитектуры обеспечивают надежную производительность, но они подходят к решению проблем точности, скорости вывода и экосистемы разработчиков совершенно по-разному.

Ниже представлена интерактивная диаграмма, демонстрирующая границы производительности этих моделей, чтобы помочь вам определить оптимальный вариант для ваших аппаратных ограничений.

Истоки модели и техническое происхождение

Понимание истоков и философии проектирования этих моделей обеспечивает ценный контекст для понимания их соответствующих сильных сторон и идеальных сценариев использования.

Детали YOLO11

Разработанный Ultralytics, YOLO11 представляет собой высокоразвитую итерацию серии YOLO, приоритетом которого является баланс между высокоскоростным выводом, исключительной эффективностью параметров и беспрецедентной простотой использования. Он широко известен своими унифицированными многозадачными возможностями и удобным для разработчиков Python API.

Узнайте больше о YOLO11

PP-YOLOE+ Детали

PP-YOLOE+ является развитой версией PP-YOLOv2, построенной на фреймворке PaddlePaddle. Он вводит архитектурные изменения, такие как бэкбон CSPRepResNet и Task Alignment Learning (TAL), чтобы расширить границы точности, особенно на высокопроизводительных GPU.

Узнайте больше о PP-YOLOE+

Архитектурные различия

Фундаментальные архитектурные решения YOLO11 и PP-YOLOE+ отражают их различные приоритеты в области компьютерного зрения.

YOLO11 построен на высокооптимизированном backbone и безъякорной голове обнаружения. Он использует блоки C3k2 и Spatial Pyramid Pooling - Fast (SPPF) для захвата многомасштабных признаков с минимальными вычислительными затратами. Эта конструкция весьма выгодна для снижения задержки инференса на устройствах с ограниченными ресурсами, таких как периферийные NPU и мобильные CPU. Кроме того, YOLO11 изначально разработан для многозадачного обучения, поддерживая сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB) из коробки.

PP-YOLOE+ представляет основу CSPRepResNet и эффективную голову, выровненную по задачам (ET-head). Он активно использует методы репараметризации для увеличения представительной способности во время обучения, одновременно сворачивая эти параметры в стандартные свёртки для инференса. Хотя это даёт впечатляющую среднюю точность (mAP), полученные модели, как правило, тяжелее с точки зрения параметров и объёма памяти, что делает их более подходящими для развёртывания на мощных серверных GPU, а не на легковесных периферийных устройствах.

Многозадачная универсальность

Если ваш проект требует выхода за рамки стандартных ограничивающих рамок, Ultralytics YOLO11 обеспечивает нативную поддержку segment, оценки позы и классификации в рамках одного и того же API, значительно сокращая затраты на разработку по сравнению с интеграцией нескольких различных репозиториев.

Производительность и сравнительное тестирование

При оценке производительности мы рассматриваем точность (mAP), скорость инференса на различном оборудовании и эффективность модели (параметры и FLOPs). В таблице ниже представлены сравнительные метрики, при этом наиболее эффективные или высокопроизводительные значения выделены жирным шрифтом.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Анализ

YOLO11 демонстрирует явное преимущество в Баланс производительности и параметрическая эффективность. Например, YOLO11m достигает более высокого mAP (51.5), чем PP-YOLOE+m (49.8) при использовании меньшего количества параметров (20.1M против 23.43M) и достижении значительно более высоких скоростей вывода на TensorRT (4.7 мс против 5.56 мс). Легковесная природа моделей YOLO11 по своей сути приводит к более низким требованиям к памяти во время как обучение модели и развертывание.

Экосистема обучения и простота использования

Истинная ценность модели часто заключается в том, насколько легко разработчики могут обучать ее на пользовательских наборах данных компьютерного зрения и развертывать в продакшене.

Преимущество Ultralytics

Ultralytics уделяет первостепенное внимание оптимизации опыта разработчиков. Обучение YOLO11 осуществляется через простой API Python или CLI, что позволяет абстрагироваться от сложного шаблонного кода. Ultralytics Platform дополнительно улучшает этот процесс, предлагая обучение без кода, автоматизированное управление наборами данных и экспорт в один клик в такие форматы, как ONNX, CoreML и TensorRT.

Кроме того, модели YOLO очень эффективны по памяти во время обучения, избегая массивных накладных расходов VRAM, характерных для архитектур на основе трансформеров или моделей с тяжелой репараметризацией, что позволяет проводить обучение на оборудовании потребительского класса.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Экосистема PP-YOLOE+

PP-YOLOE+ работает в экосистеме PaddleDetection. Хотя этот фреймворк мощный и глубоко интегрирован с промышленными решениями Baidu, он требует от разработчиков использования специфического фреймворка глубокого обучения PaddlePaddle. Это может привести к более длительному обучению для команд, уже использующих PyTorch. Кроме того, экспорт моделей PP-YOLOE+ в стандартные универсальные форматы для периферийных устройств может потребовать дополнительных шагов преобразования по сравнению с нативными конвейерами экспорта, используемыми в рабочих процессах Ultralytics.

Идеальные варианты использования

Выбор между этими моделями зависит от вашей специфической среды развертывания.

  • Выберите YOLO11 для гибкой разработки, граничных вычислений и мобильных приложений. Высокая скорость инференса, низкое потребление памяти и широкие возможности экспорта делают его идеальным для таких задач, как управление розничными запасами в реальном времени на стандартных CPU, анализ аэрофотоснимков с дронов и сложные многозадачные конвейеры.
  • Выберите PP-YOLOE+, если весь ваш производственный конвейер уже значительно интегрирован в экосистему PaddlePaddle или если вы развертываете на высокопроизводительных, выделенных серверах для инференса, где ограничения памяти и аппаратная совместимость (вне оптимизированного оборудования Paddle) не являются основными проблемами.

Следующее поколение: Представляем YOLO26

Хотя YOLO11 остается невероятно мощным, область ИИ быстро развивается. Для абсолютного передового края в обнаружении объектов Ultralytics представила новый YOLO26. Выпущенный в январе 2026 года, YOLO26 основывается на успехах своих предшественников, чтобы обеспечить беспрецедентную эффективность и точность.

Ключевые инновации YOLO26:

  • Сквозная архитектура без NMS: YOLO26 изначально исключает постобработку Non-Maximum Suppression (NMS). Это значительно ускоряет инференс и упрощает логику развертывания, что является архитектурным прорывом, впервые реализованным в YOLOv10.
  • До 43% более быстрый инференс на CPU: Специально оптимизированный для периферийных устройств без GPU, обеспечивающий производительность в реальном времени на маломощном оборудовании.
  • Оптимизатор MuSGD: Вдохновленный стабильностью обучения LLM, этот гибрид SGD и Muon обеспечивает более быструю сходимость и более стабильное обучение.
  • ProgLoss + STAL: Улучшенные функции потерь значительно улучшают распознавание мелких объектов, что критически важно для приложений с дронами и систем видеонаблюдения.
  • Удаление DFL: Удаление Distribution Focal Loss упрощает экспорт модели и значительно улучшает совместимость с широким спектром периферийных устройств.

Для новых проектов, приоритетом которых являются скорость, бесшовный экспорт и максимальная точность, мы настоятельно рекомендуем использовать возможности YOLO26 через платформу Ultralytics.

Если вы оцениваете другие архитектуры, вас также может заинтересовать сравнение YOLO11 с RT-DETR или изучение того, как устаревший YOLOv8 выдерживает современные бенчмарки.


Комментарии