Link to this sectionГлубокое погружение в обнаружение объектов в реальном времени: PP-YOLOE+ против YOLO11#
Ландшафт компьютерного зрения постоянно развивается, движимый потребностью в более быстрых, точных и эффективных моделях. Для разработчиков и исследователей, решающих задачи обнаружения объектов, выбор правильной архитектуры имеет решающее значение. В этом всестороннем сравнении мы изучим нюансы двух известных моделей: PP-YOLOE+ и Ultralytics YOLO11.
Разбирая их архитектуры, показатели производительности и идеальные варианты использования, это руководство поможет тебе получить знания, необходимые для принятия обоснованного решения для твоего следующего развертывания машинного обучения.
Link to this sectionПроисхождение моделей и технический обзор#
Обе модели выросли из серьезных академических исследований и обширной инженерной работы, но они происходят из совершенно разных экосистем. Давай взглянем на фундаментальные детали каждой модели.
Link to this sectionОбзор PP-YOLOE+#
Разработанная исследователями Baidu, модель PP-YOLOE+ является итерацией более ранней PP-YOLOE, созданной для расширения границ обнаружения в реальном времени в экосистеме PaddlePaddle.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: Репозиторий PaddleDetection
- Документация: Документация PP-YOLOE+
Link to this sectionОбзор YOLO11#
YOLO11, созданная Ultralytics, представляет собой значительный скачок вперед в удобстве использования и точности. Она опирается на наследие высокоэффективных архитектур, оптимизируя опыт разработчика для беспрепятственной работы и многозадачности.
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: Репозиторий Ultralytics на GitHub
- Документация: Официальная документация YOLO11
Ultralytics YOLO11 поддерживает не только обнаружение объектов. «Из коробки» ты можешь выполнять сегментацию экземпляров, оценку позы и обнаружение с помощью ориентированных ограничивающих рамок (OBB), используя один и тот же API.
Link to this sectionАрхитектурное сравнение и сравнение производительности#
При сравнении этих двух детекторов мы должны смотреть дальше «сухих» цифр и понять, как их архитектурный выбор влияет на реальное развертывание модели.
Link to this sectionАрхитектура PP-YOLOE+#
PP-YOLOE+ сильно полагается на фреймворк PaddlePaddle. Она представляет мощную парадигму без анкоров (anchor-free), используя бэкбон RepResNet и модифицированную сеть Path Aggregation Network (PAN). Вариант «+» улучшил предшественника за счет включения предварительного обучения на крупномасштабных наборах данных (таких как Objects365) и улучшенного TaskAlignedAssigner. Хотя модель достигает высокого среднего значения средней точности (mAP), жесткая зависимость от PaddlePaddle может создать трудности для команд, привыкших к средам PyTorch или TensorFlow.
Link to this sectionАрхитектура YOLO11#
Ultralytics YOLO11 построена нативно на PyTorch, отраслевом стандарте современного глубокого обучения. Ее архитектура сильно сфокусирована на балансе производительности, достигая выгодного компромисса между скоростью и точностью, подходящего для различных реальных сценариев развертывания. YOLO11 оснащена оптимизированным модулем C3k2 для лучшего градиентного потока и развязанной «головой» (decoupled head), которая эффективно обрабатывает задачи классификации и регрессии по отдельности. Кроме того, YOLO11 спроектирована для снижения требований к памяти, демонстрируя значительно меньшее использование памяти во время обучения и вывода по сравнению со сложными моделями на базе Transformer, такими как RT-DETR.
Link to this sectionТаблица показателей производительности#
Следующая таблица подчеркивает различия в производительности для различных масштабов моделей. Заметь, как YOLO11 в целом достигает сопоставимого или лучшего mAP, значительно сокращая количество параметров и FLOPs.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionСценарии использования и рекомендации#
Выбор между PP-YOLOE+ и YOLO11 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать PP-YOLOE+#
PP-YOLOE+ — это сильный выбор в следующих случаях:
- Интеграция с экосистемой PaddlePaddle: Организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
- Развертывание на периферии с Paddle Lite: Развертывание на оборудовании с высокооптимизированными ядрами вывода, специально предназначенными для движка Paddle Lite или Paddle.
- Серверное обнаружение с высокой точностью: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, где зависимость от фреймворка не является проблемой.
Link to this sectionКогда выбирать YOLO11#
YOLO11 рекомендуется для:
- Производственного развертывания на периферии: коммерческих приложений на устройствах типа Raspberry Pi или NVIDIA Jetson, где надежность и активная поддержка имеют первостепенное значение.
- Многозадачных приложений компьютерного зрения: проектов, требующих детектирования, сегментации, оценки позы и OBB в рамках одной унифицированной среды.
- Быстрого прототипирования и развертывания: команд, которым нужно быстро перейти от сбора данных к производству, используя оптимизированный Python API Ultralytics.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionПреимущество Ultralytics#
Хотя академические бенчмарки важны, долгосрочный успех ИИ-проекта сильно зависит от экосистемы вокруг модели. Платформа Ultralytics предлагает явные преимущества как для разработчиков, так и для предприятий.
- Простота использования: Ultralytics абстрагирует сложности глубокого обучения. Улучшенный пользовательский интерфейс и простой Python API позволяют разработчикам обучать пользовательские модели всего несколькими строками кода. Это контрастирует со сложными конфигурационными файлами, часто требуемыми для PP-YOLOE+.
- Хорошо поддерживаемая экосистема: В отличие от многих репозиториев, предназначенных только для исследований, экосистема Ultralytics активно развивается. Она может похвастаться сильной поддержкой сообщества, частыми обновлениями и обширной интеграцией с такими инструментами, как Weights & Biases и Comet ML.
- Универсальность: YOLO11 предоставляет единый унифицированный фреймворк для множества задач компьютерного зрения, устраняя необходимость изучать разные библиотеки для классификации, сегментации или обнаружения с помощью ограничивающих рамок.
- Эффективность обучения: Эффективные процессы обучения моделей YOLO экономят как время, так и вычислительные затраты. Используя предварительно обученные веса на наборе данных COCO, модели быстро сходятся даже на потребительском оборудовании.
Link to this sectionСравнение кода обучения#
Чтобы проиллюстрировать простоту использования, вот как ты можешь обучить современную модель YOLO11. Она автоматически обрабатывает все данные аугментации, логирование и оркестрацию оборудования:
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run a quick inference test on a public image
inference_results = model("https://ultralytics.com/images/bus.jpg")
inference_results[0].show()Настройка аналогичного конвейера в PaddleDetection требует ручного управления сложными XML-конфигурациями и выполнения длинных командных строк, что может замедлить циклы гибкой разработки.
Link to this sectionВзгляд в будущее: появление YOLO26#
Хотя YOLO11 остается исключительно мощным инструментом, область ИИ движется быстро. Выпущенная в январе 2026 года, YOLO26 представляет собой абсолютный передний край линейки Ultralytics и является рекомендуемой моделью для всех новых проектов.
YOLO26 представляет несколько революционных инноваций:
- Сквозной дизайн без NMS: Основываясь на концепциях, впервые предложенных в YOLOv10, YOLO26 является нативно сквозной моделью. Она полностью исключает пост-обработку Non-Maximum Suppression (NMS), что делает развертывание намного проще и значительно снижает вариативность задержки.
- До 43% быстрее при выводе на CPU: Благодаря стратегическому удалению Distribution Focal Loss (DFL) модель становится намного легче. Эта оптимизация делает ее главным выбором для периферийных вычислений и маломощных устройств IoT.
- Оптимизатор MuSGD: YOLO26 привносит инновации обучения LLM в компьютерное зрение. Используя оптимизатор MuSGD (гибрид SGD и Muon), она достигает высокостабильной динамики обучения и более быстрой сходимости.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов — критически важная функция для съемки с дронов и воздушного наблюдения.
Link to this sectionЗаключение и реальные приложения#
При выборе между PP-YOLOE+ и YOLO11 (или более новой YOLO26) выбор зависит от твоей экосистемы развертывания.
PP-YOLOE+ блистает в специфических промышленных средах, особенно в азиатских производственных центрах, где оборудование глубоко интегрировано со стеком технологий Baidu и библиотекой PaddlePaddle. Она отлично подходит для анализа статических изображений, где максимальный mAP является единственным приоритетом.
YOLO11 и YOLO26, однако, предлагают гораздо более универсальный и дружелюбный к разработчикам подход. Их меньшее количество параметров и высокая скорость делают их идеальными для:
- Умная розница: Обработка видеопотоков в реальном времени для автоматизированной кассы и управления запасами.
- Автономная робототехника: Обеспечение высокоскоростного избегания препятствий на встроенных устройствах с ограниченными ресурсами.
- Безопасность и наблюдение: Обеспечение надежного многозадачного анализа (например, трекинг и оценка позы) за один, высокоэффективный проход вывода.
Для современных инженеров ИИ, ищущих надежность, обширную поддержку сообщества и прямолинейные конвейеры развертывания в такие форматы, как ONNX и TensorRT, экосистема Ultralytics остается бесспорным выбором.