YOLOX против PP-YOLOE+: Всестороннее техническое сравнение
При проектировании надежного конвейера компьютерного зрения выбор подходящей модели обнаружения объектов является критически важным решением. Ландшафт детекторов объектов реального времени является высококонкурентным, с многочисленными архитектурами, стремящимися предложить оптимальный баланс между скоростью инференса и точностью обнаружения. В этом техническом сравнении мы оценим две выдающиеся модели: YOLOX и PP-YOLOE+. Изучая их архитектурные проекты, методологии обучения и метрики производительности, мы стремимся предоставить разработчикам и исследователям информацию, необходимую для выбора правильного инструмента для их сред развертывания.
Архитектурные инновации и проектирование
Обе модели были разработаны для устранения конкретных проблем, выявленных в предыдущих итерациях YOLO, однако они используют принципиально разные подходы к решению компромисса между скоростью и точностью.
YOLOX: Наведение мостов между исследованиями и промышленностью
Разработанный Чжэн Гэ, Сунтао Лю, Фэн Ваном, Цзэмином Ли и Цзянь Сунем в Megvii, YOLOX был выпущен 18 июля 2021 года. Он ознаменовал значительный сдвиг в семействе YOLO, полностью перейдя на безанкерную архитектуру. Вы можете ознакомиться с основополагающим исследованием в их официальной статье на Arxiv и исходным кодом в репозитории YOLOX на GitHub.
YOLOX интегрирует разделенную головку, разделяющую задачи классификации и регрессии, что значительно улучшает скорость сходимости во время обучения. Кроме того, он представил передовые стратегии присвоения меток, такие как SimOTA, для динамического назначения положительных образцов. Это делает модель высокоэффективной, особенно в средах граничного ИИ, где вычислительные ресурсы строго ограничены.
PP-YOLOE+: Высокопроизводительное промышленное detect
Представленный авторами PaddlePaddle из Baidu 2 апреля 2022 года, PP-YOLOE+ представляет собой высокооптимизированное развитие серии PP-YOLO. Подробно описанный в их публикации на Arxiv, PP-YOLOE+ глубоко интегрирован в экосистему Baidu и требует использования фреймворка PaddlePaddle. Конфигурации модели можно найти в репозитории PaddleDetection на GitHub.
PP-YOLOE+ опирается на мощный backbone CSPRepResNet и использует Efficient Task-aligned head (ET-head) в сочетании с Task Alignment Learning (TAL). Эта архитектура достигает выдающейся средней точности (mAP) на наборе данных COCO, что делает ее грозным выбором для обнаружения промышленных дефектов и интенсивной серверной обработки, где точность приоритетнее минимальных зависимостей.
Ориентиры производительности
Понимание того, как эти модели работают в различных масштабах, имеет решающее значение для развертывания. В таблице ниже представлены ключевые метрики, включая mAP и скорости инференса при экспорте в TensorRT.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Рекомендации по развертыванию
Хотя PP-YOLOE+x достигает наивысшей абсолютной точности, YOLOX предлагает чрезвычайно легкие варианты (Nano и Tiny), которые очень подходят для микроконтроллеров с низким энергопотреблением и устаревшего мобильного оборудования.
Сценарии использования и рекомендации
Выбор между YOLOX и PP-YOLOE+ зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда следует выбирать YOLOX
YOLOX является отличным выбором для:
- Исследования безъякорного detect: Академические исследования, использующие чистую, безъякорную архитектуру YOLOX в качестве основы для экспериментов с новыми головами detect или функциями потерь.
- Сверхлегкие граничные устройства: Развертывание на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый объем (0,91 млн параметров) варианта YOLOX-Nano.
- Исследования по назначению меток SimOTA: Исследовательские проекты, изучающие стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.
Когда следует выбирать PP-YOLOE+
PP-YOLOE+ рекомендуется для:
- Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
- Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
- Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Преимущество Ultralytics: Представляем YOLO26
Хотя YOLOX и PP-YOLOE+ предлагают явные преимущества, быстрая эволюция ИИ требует инструментов, которые сочетают передовую точность с беспрецедентной простотой использования. Именно здесь модели Ultralytics, в частности недавно выпущенная Ultralytics YOLO26, превосходят устаревшие исследовательские репозитории.
Выпущенный в январе 2026 года, YOLO26 устанавливает новый стандарт для современного обнаружения объектов и не только, предлагая опыт разработки, который просто не имеет аналогов среди конкурирующих фреймворков.
Почему разработчики выбирают YOLO26
- Сквозная архитектура без NMS: Основываясь на концепциях, впервые примененных в YOLOv10, YOLO26 изначально является сквозной (end-to-end) системой. Полностью исключая постобработку с подавлением немаксимумов (NMS), она обеспечивает высокую стабильность задержки и значительно упрощает конвейеры экспорта для периферийных сред.
- Оптимизация следующего поколения: Стабильность обучения революционизирована оптимизатором MuSGD, гибридом SGD и Muon (вдохновленным методологиями LLM, такими как Kimi K2 от Moonshot AI). Это гарантирует более быструю сходимость. Кроме того, YOLO26 использует ProgLoss + STAL для значительного улучшения распознавания мелких объектов, что является ключевой особенностью для приложений, связанных с аэрофотосъемкой и робототехникой.
- Непревзойденная аппаратная эффективность: Удаление Distribution Focal Loss (DFL) в YOLO26 значительно снижает требования к памяти. Она обеспечивает до 43% более быструю инференцию на CPU, что делает ее окончательным выбором для устройств без выделенного ускорения GPU.
- Экстремальная универсальность: В отличие от PP-YOLOE+, который строго ориентирован на detect, YOLO26 предлагает унифицированную поддержку для множества задач. Он включает специализированную функцию потерь для семантической сегментации для сегментации экземпляров, оценку остаточного логарифмического правдоподобия (RLE) для точной оценки позы и усовершенствованные механизмы угловых потерь для Oriented Bounding Boxes (obb).
Бесшовная интеграция в экосистему
Ultralytics устраняет сложности, связанные с установкой фреймворков. Используя унифицированный Python API или интуитивно понятную платформу Ultralytics, вы можете обучать, валидировать и экспортировать модели всего несколькими строками кода.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")
Для пользователей, оценивающих другие надежные архитектуры в экосистеме Ultralytics, YOLO11 остается очень надежным выбором для устаревших развертываний, в то время как трансформер-основанный RT-DETR предоставляет отличные возможности для тех, кто ищет решения на основе механизмов внимания.
Обзор
Выбор между YOLOX и PP-YOLOE+ часто сводится к основным ограничениям вашего фреймворка — предпочитаете ли вы гибкость на основе PyTorch или глубокую интеграцию с PaddlePaddle от Baidu. Однако для организаций, стремящихся обеспечить перспективность своей инфраструктуры ИИ, Ultralytics YOLO26 предлагает значительно превосходящую альтернативу. Благодаря революционному дизайну без NMS, легкому потреблению памяти и всесторонней универсальности задач, YOLO26 позволяет командам создавать более быстрые, умные и эффективные приложения компьютерного зрения с беспрецедентной легкостью.