Перейти к содержанию

Глубокое погружение в обнаружение объектов в реальном времени: PP-YOLOE+ против YOLO11

Ландшафт компьютерного зрения постоянно развивается, движимый потребностью в более быстрых, точных и эффективных моделях. Для разработчиков и исследователей, решающих задачи обнаружения объектов, выбор правильной архитектуры имеет решающее значение. В этом всестороннем сравнении мы рассмотрим нюансы между двумя выдающимися моделями: PP-YOLOE+ и Ultralytics YOLO11.

Анализируя их архитектуры, метрики производительности и идеальные сценарии использования, это руководство призвано предоставить необходимые сведения для принятия обоснованного решения при следующем развертывании машинного обучения.

Происхождение моделей и технические обзоры

Обе модели основаны на тщательных академических исследованиях и обширной инженерной работе, но они происходят из совершенно разных экосистем. Давайте рассмотрим фундаментальные детали каждой модели.

Обзор PP-YOLOE+

Разработанный исследователями Baidu, PP-YOLOE+ является итерацией более раннего PP-YOLOE, разработанной для расширения границ обнаружения в реальном времени в экосистеме PaddlePaddle.

Узнайте больше о PP-YOLOE+

Обзор YOLO11

YOLO11, созданный Ultralytics, представляет собой значительный шаг вперед в удобстве использования и точности. Он основан на наследии весьма успешных архитектур, оптимизирован для беспрепятственного взаимодействия разработчиков и многозадачной универсальности.

Узнайте больше о YOLO11

Вы знали?

Ultralytics YOLO11 поддерживает не только обнаружение объектов. Из коробки вы можете выполнять сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB), используя тот же самый API.

Сравнение архитектуры и производительности

При сравнении этих двух детекторов мы должны смотреть не только на сырые цифры, но и понимать, как их архитектурные решения влияют на реальное развертывание модели.

Архитектура PP-YOLOE+

PP-YOLOE+ в значительной степени опирается на фреймворк PaddlePaddle. Он представляет мощную безанкерную парадигму, используя бэкбон RepResNet и модифицированную сеть агрегации путей (PAN). Вариант «+» улучшил своего предшественника за счет включения предварительного обучения на крупномасштабных наборах данных (например, Objects365) и улучшенного TaskAlignedAssigner. Хотя он достигает высокой средней точности (mAP), жесткая зависимость от PaddlePaddle может создавать трудности для команд, привыкших к средам PyTorch или TensorFlow.

Архитектура YOLO11

Ultralytics YOLO11 изначально построен на PyTorch, промышленном стандарте для современного глубокого обучения. Его архитектура в значительной степени ориентирована на баланс производительности, достигая выгодного компромисса между скоростью и точностью, подходящего для различных сценариев развертывания в реальном мире. YOLO11 оснащен оптимизированным модулем C2f для лучшего потока градиентов и разделенной головой, которая эффективно обрабатывает задачи классификации и регрессии по отдельности. Кроме того, YOLO11 разработан для снижения требований к памяти, демонстрируя значительно меньшее использование памяти во время обучения и вывода по сравнению со сложными трансформерными моделями, такими как RT-DETR.

Таблица метрик производительности

В следующей таблице подчеркиваются различия в производительности для различных масштабов моделей. Обратите внимание, как YOLO11 обычно достигает сопоставимого или лучшего mAP, значительно сокращая количество параметров и FLOPs.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Сценарии использования и рекомендации

Выбор между PP-YOLOE+ и YOLO11 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать PP-YOLOE+

PP-YOLOE+ является отличным выбором для:

  • Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
  • Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
  • Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.

Когда следует выбирать YOLO11

YOLO11 рекомендуется для:

  • Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
  • Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
  • Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Преимущество Ultralytics

Хотя академические бенчмарки важны, долгосрочный успех проекта ИИ во многом зависит от экосистемы, окружающей модель. Платформа Ultralytics предлагает явные преимущества как для разработчиков, так и для предприятий.

  1. Простота использования: Ultralytics абстрагирует сложности глубокого обучения. Оптимизированный пользовательский интерфейс и простой Python API позволяют разработчикам обучать пользовательские модели всего несколькими строками кода. Это выгодно отличается от сложных файлов конфигурации, часто требуемых PP-YOLOE+.
  2. Хорошо поддерживаемая экосистема: В отличие от многих репозиториев, ориентированных только на исследования, экосистема Ultralytics активно развивается. Она может похвастаться мощной поддержкой сообщества, частыми обновлениями и обширной интеграцией с такими инструментами, как Weights & Biases и Comet ML.
  3. Универсальность: YOLO11 предоставляет единую унифицированную среду для множества задач компьютерного зрения, устраняя необходимость изучения различных библиотек для классификации, segment или detect ограничивающих рамок.
  4. Эффективность обучения: Эффективные процессы обучения моделей YOLO экономят как время, так и вычислительные затраты. Используя предварительно обученные веса на наборе данных COCO, модели быстро сходятся даже на потребительском оборудовании.

Сравнение кода обучения

Чтобы проиллюстрировать простоту использования, вот как вы обучаете современную модель YOLO11. Она автоматически обрабатывает всю аугментацию данных, логирование и оркестрацию оборудования:

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run a quick inference test on a public image
inference_results = model("https://ultralytics.com/images/bus.jpg")
inference_results[0].show()

Настройка эквивалентного конвейера в PaddleDetection требует ручной навигации по сложным XML-конфигурациям и выполнения длинных строк командной строки, что может замедлить циклы гибкой разработки.

Взгляд в будущее: Появление YOLO26

Хотя YOLO11 остается исключительно мощным инструментом, область ИИ быстро развивается. Выпущенный в январе 2026 года, YOLO26 представляет собой абсолютный передовой край в линейке Ultralytics и является рекомендуемой моделью для всех новых проектов.

YOLO26 представляет несколько новаторских инноваций:

  • Сквозная архитектура без NMS: Основываясь на концепциях, впервые примененных в YOLOv10, YOLO26 изначально является сквозной (end-to-end) системой. Она полностью исключает постобработку Non-Maximum Suppression (NMS), что значительно упрощает развертывание и существенно снижает изменчивость задержки.
  • До 43% более быстрая инференция на CPU: За счет стратегического удаления Distribution Focal Loss (DFL) модель становится значительно легче. Эта оптимизация делает ее лучшим выбором для периферийных вычислений и маломощных IoT-устройств.
  • Оптимизатор MuSGD: YOLO26 привносит инновации в обучение LLM в компьютерное зрение. Используя оптимизатор MuSGD (гибрид SGD и Muon), он достигает высокостабильной динамики обучения и более быстрой сходимости.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают значительные улучшения в распознавании мелких объектов, что является критически важной особенностью для изображений с дронов и воздушного наблюдения.

Заключение и практические применения

При выборе между PP-YOLOE+ и YOLO11 (или более новой YOLO26) решение зависит от вашей экосистемы развертывания.

PP-YOLOE+ проявляет себя в специфических промышленных средах, особенно в азиатских производственных центрах, где оборудование глубоко интегрировано с технологическим стеком Baidu и библиотекой PaddlePaddle. Он отлично подходит для анализа статических изображений, где максимальный mAP является единственным приоритетом.

YOLO11 и YOLO26, однако, предлагают гораздо более универсальный и удобный для разработчиков подход. Их меньшее количество параметров и высокие скорости делают их идеальными для:

  • Умная розничная торговля: Обработка видеопотоков в реальном времени для автоматизированных касс и управления запасами.
  • Автономная робототехника: Обеспечивая высокоскоростное избегание препятствий на встраиваемых устройствах с ограниченными ресурсами.
  • Безопасность и видеонаблюдение: Обеспечение надёжного многозадачного анализа (например, отслеживание и оценка позы) за один высокоэффективный проход инференса.

Для современных инженеров ИИ, ищущих надежность, обширную поддержку сообщества и простые конвейеры развертывания в такие форматы, как ONNX и TensorRT, экосистема Ultralytics остается бесспорным выбором.


Комментарии