Link to this sectionYOLO11 против PP-YOLOE+#
Выбор оптимальной архитектуры нейронной сети имеет решающее значение при развертывании приложений компьютерного зрения в рабочей среде. В этом техническом сравнении мы рассматриваем две известные модели в области обнаружения объектов в реальном времени: Ultralytics YOLO11 и PP-YOLOE+ от Baidu. Обе архитектуры обеспечивают высокую производительность, но они подходят к решению задач точности, скорости вывода и экосистемы разработчиков по-разному.
Ниже представлена интерактивная диаграмма, демонстрирующая границы производительности этих моделей, чтобы помочь тебе определить лучший вариант для ограничений твоего оборудования.
Link to this sectionПроисхождение моделей и техническая родословная#
Понимание происхождения и принципов проектирования этих моделей дает ценный контекст для их соответствующих сильных сторон и идеальных вариантов использования.
Link to this sectionДетали YOLO11#
Разработанный Ultralytics, YOLO11 представляет собой высоко оптимизированную итерацию серии YOLO, отдающую приоритет балансу высокоскоростного вывода, экстремальной эффективности параметров и непревзойденной простоте использования. Он широко известен своими унифицированными многозадачными возможностями и дружественным к разработчикам Python API.
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: Документация YOLO11
Link to this sectionПодробности PP-YOLOE+#
PP-YOLOE+ — это эволюционировавшая версия PP-YOLOv2, построенная на базе фреймворка PaddlePaddle. Она внедряет архитектурные изменения, такие как бэкбон CSPRepResNet и Task Alignment Learning (TAL), чтобы раздвинуть границы точности, особенно на мощных GPU.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Документация: Документация по конфигурации PP-YOLOE+
Link to this sectionАрхитектурные различия#
Фундаментальные архитектурные решения YOLO11 и PP-YOLOE+ отражают их различные приоритеты в ландшафте компьютерного зрения.
YOLO11 построен на высокооптимизированном бэкбоне и безъякорной (anchor-free) детектирующей головке. Он использует блоки C3k2 и Spatial Pyramid Pooling - Fast (SPPF) для захвата признаков разного масштаба с минимальными вычислительными затратами. Эта архитектура очень выгодна для снижения задержки вывода на устройствах с ограниченными ресурсами, таких как периферийные NPU и мобильные CPU. Кроме того, YOLO11 изначально разработан для многозадачного обучения, поддерживая сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB) сразу «из коробки».
PP-YOLOE+ внедряет бэкбон CSPRepResNet и Efficient Task-aligned head (ET-head). Он активно использует методы rep-параметризации для увеличения репрезентативной способности во время обучения, сворачивая эти параметры в стандартные свертки для вывода. Хотя это дает впечатляющую среднюю точность (mAP), итоговые модели, как правило, тяжелее с точки зрения параметров и потребления памяти, что делает их более подходящими для развертывания на мощных серверных GPU, а не на легких периферийных устройствах.
Если твой проект требует выхода за рамки стандартных ограничивающих рамок, Ultralytics YOLO11 предоставляет встроенную поддержку сегментации, оценки позы и классификации в рамках того же самого API, что радикально снижает накладные расходы на разработку по сравнению с интеграцией нескольких отдельных репозиториев.
Link to this sectionПроизводительность и бенчмарки#
При оценке производительности мы смотрим на точность (mAP), скорость вывода на разном оборудовании и эффективность модели (параметры и FLOPs). Таблица ниже выделяет сравнительные метрики, где наиболее эффективные или самые высокие показатели выделены жирным шрифтом.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Link to this sectionАнализ#
YOLO11 демонстрирует явное преимущество в балансе производительности и эффективности параметров. Например, YOLO11m достигает более высокого mAP (51.5), чем PP-YOLOE+m (49.8), при использовании меньшего количества параметров (20.1M против 23.43M) и достигая значительно более высокой скорости вывода на TensorRT (4.7 мс против 5.56 мс). Легковесная природа моделей YOLO11 естественным образом приводит к меньшим требованиям к памяти как во время обучения модели, так и при развертывании.
Link to this sectionЭкосистема обучения и простота использования#
Истинная ценность модели часто заключается в том, насколько легко разработчики могут обучить ее на пользовательских датасетах компьютерного зрения и развернуть в рабочей среде.
Link to this sectionПреимущество Ultralytics#
Ultralytics отдает приоритет упрощенному опыту разработчика. Обучение YOLO11 управляется через простой Python API или CLI, абстрагируя сложный шаблонный код. Платформа Ultralytics дополнительно улучшает этот процесс, предоставляя обучение без кода, автоматизированное управление датасетами и экспорт в один клик в такие форматы, как ONNX, CoreML и TensorRT.
Более того, модели YOLO обладают высокой эффективностью использования памяти во время обучения, позволяя избежать огромных затрат VRAM, типичных для архитектур на основе трансформеров или тяжелых репараметризованных моделей, что делает возможным обучение на оборудовании потребительского уровня.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionЭкосистема PP-YOLOE+#
PP-YOLOE+ работает в рамках экосистемы PaddleDetection. Хотя этот фреймворк мощный и глубоко интегрирован с промышленными решениями Baidu, он требует от разработчиков использования специфического фреймворка глубокого обучения PaddlePaddle. Это может создать более высокий порог вхождения для команд, которые уже стандартизированы на PyTorch. Кроме того, экспорт моделей PP-YOLOE+ в стандартные универсальные форматы для периферийных устройств может потребовать дополнительных шагов конвертации по сравнению с нативными конвейерами экспорта, найденными в рабочих процессах Ultralytics.
Link to this sectionИдеальные варианты использования#
Выбор между этими моделями зависит от твоей конкретной среды развертывания.
- Выбирай YOLO11 для гибкой разработки, периферийных вычислений и мобильных приложений. Его высокая скорость вывода, низкие требования к памяти и широкие возможности экспорта делают его идеальным для таких задач, как управление запасами в розничной торговле на стандартных CPU, анализ аэрофотоснимков с дронов и сложные многозадачные конвейеры.
- Выбирай PP-YOLOE+, если весь твой производственный конвейер уже сильно инвестирован в экосистему PaddlePaddle, или если ты развертываешь решения на мощных специализированных серверах вывода, где ограничения по памяти и аппаратная совместимость (помимо оптимизированного оборудования Paddle) не являются первостепенными задачами.
Link to this sectionСледующее поколение: представляем YOLO26#
Хотя YOLO11 остается невероятно мощным, сфера ИИ развивается быстро. Для обеспечения самого передового уровня в обнаружении объектов Ultralytics представила новый YOLO26. Выпущенный в январе 2026 года, YOLO26 развивает успехи своих предшественников, обеспечивая беспрецедентную эффективность и точность.
Ключевые инновации YOLO26:
- End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This significantly speeds up inference and simplifies deployment logic, an architectural leap first pioneered in YOLOv10.
- До 43% более быстрый вывод на CPU: Оптимизирован специально для периферийных устройств без GPU, обеспечивая производительность в реальном времени на менее мощном оборудовании.
- Оптимизатор MuSGD: Вдохновленный стабильностью обучения LLM, этот гибрид SGD и Muon обеспечивает более быструю сходимость и более стабильное обучение.
- ProgLoss + STAL: Улучшенные функции потерь кардинально улучшают распознавание мелких объектов, что критически важно для применения дронов и видеонаблюдения в целях безопасности.
- Удаление DFL: Удаление Distribution Focal Loss упрощает экспорт модели и значительно улучшает совместимость с широким спектром периферийных устройств.
Для новых проектов, в которых приоритет отдается скорости, бесшовному экспорту и максимальной точности, мы настоятельно рекомендуем использовать возможности YOLO26 через Платформу Ultralytics.
Если ты оцениваешь другие архитектуры, тебе также может быть интересно сравнить YOLO11 с RT-DETR или изучить, как устаревший YOLOv8 показывает себя в современных тестах.