YOLOX против PP-YOLOE+: глубокий анализ object detection без якорных фреймов
В быстро развивающейся области обнаружения объектов в реальном времени архитектуры без анкеров стали мощной альтернативой традиционным методам на основе анкеров. В этом анализе сравниваются две известные модели без анкеров: YOLOX (от Megvii) и PP-YOLOE+ (отPaddlePaddle). Мы исследуем их уникальные архитектурные инновации, тесты производительности и соображения по развертыванию, чтобы помочь разработчикам выбрать подходящий инструмент для своих приложений компьютерного зрения.
Хотя обе платформы предлагают значительные улучшения по сравнению с предыдущими YOLO , разработчики, ищущие унифицированную платформу для обучения, развертывания и управления жизненным циклом, часто обращаются к Ultralytics . С выпуском YOLO26пользователи получают доступ к сквозному обнаружению NMS, значительно более быстрому CPU и бесшовной интеграции с современными рабочими процессами MLOps.
YOLOX: Простота и производительность
YOLOX, выпущенный в 2021 году, ознаменовал возвращение к архитектурной простоте. Благодаря отделению головки детектора и удалению анкерных коробок, он решил такие распространенные проблемы, как несбалансированная положительная/отрицательная выборка, и при этом достиг передовых для своего времени результатов.
Подробности о YOLOX:
Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun
Megvii
18 июля 2021 г.
Arxiv | GitHub | Документация
Ключевые архитектурные особенности
- Разделенная головка: в отличие от предыдущих YOLO (таких как YOLOv3), где классификация и локализация выполнялись в единой головке, YOLOX разделяет эти задачи. Такое разделение снижает конфликт между двумя целями, что приводит к более быстрой конвергенции и повышению точности.
- Конструкция без анкеров: благодаря прямому прогнозированию ограничительных рамок без заранее определенных анкеров YOLOX упрощает процесс проектирования, устраняя необходимость в эвристической настройке анкеров (например, кластеризация K-средних по меткам набора данных).
- SimOTA: динамическая стратегия присвоения меток, называемая SimOTA (Simplified Optimal Transport Assignment), автоматически присваивает объекты реальной действительности наиболее подходящим прогнозам, повышая стабильность обучения.
PP-YOLOE+: усовершенствованный для промышленного применения
PP-YOLOE+, эволюцияYOLO от PaddlePaddle компании Baidu, разработана специально для развертывания в облаке и на периферии. Она уделяет особое внимание скорости вывода на конкретных аппаратных бэкэндах, таких как TensorRT OpenVINO.
PP-YOLOE+ Подробности:
PaddlePaddle
Baidu
2 апреля 2022 г.
Arxiv | GitHub | Docs
Ключевые архитектурные особенности
- CSPRepResNet Backbone: эта магистраль сочетает в себе эффективность CSPNet с возможностями остаточного обучения ResNet, оптимизированными с помощью методов перепараметризации для повышения скорости вывода без потери точности.
- TAL (Task Alignment Learning): Заменяя SimOTA, TAL явно согласовывает оценку классификации и качество локализации, гарантируя, что обнаружения с высокой степенью достоверности также имеют высокий показатель пересечения над объединением (IoU) с фактическими данными.
- Эффективная задачно-ориентированная головка (ET-Head): упрощенная конструкция головки, которая снижает вычислительную нагрузку, сохраняя при этом преимущества развязанного прогнозирования.
Сравнение метрик производительности
В следующей таблице приведены результаты сравнительного анализа YOLOX и PP-YOLOE+ на COCO . В ней показаны компромиссы между размером модели (параметрами), вычислительными затратами (FLOP) и скоростью инференса на различных аппаратных конфигурациях.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Анализ результатов
- Точность: PP-YOLOE+ обычно достигает более высоких показателейmAPval для моделей сопоставимых размеров (S, M, L, X) благодаря использованию новой стратегии Task Alignment Learning (TAL).
- Легкие модели: YOLOX-Nano чрезвычайно легкая (0,91 Мб параметров), что делает ее отличным кандидатом для устройств с серьезными ограничениями по ресурсам, где важен каждый килобайт.
- Вычислительная эффективность: модели PP-YOLOE+ обычно демонстрируют более низкие значения FLOP при аналогичных уровнях точности, что свидетельствует о лучшей оптимизации для операций умножения матриц, часто используемых в GPU .
Ultralytics : за пределами тестов
Хотя сырые тесты важны, опыт разработчиков и поддержка экосистемы имеют решающее значение для успешной реализации проекта. Именно здесь на помощь приходят Ultralytics , такие как YOLO11 и передовая YOLO26, отличаются от других.
Простота использования и экосистема
Python Ultralytics стандартизирует рабочий процесс обучения, валидации и развертывания. Для переключения между моделями требуется изменить только одну строку, тогда как переход с YOLOX (PyTorch) на PP-YOLOE+ (PaddlePaddle) предполагает изучение совершенно других фреймворков и синтаксисов API.
from ultralytics import YOLO
# Load a model: Switch easily between generations
model = YOLO("yolo26n.pt")
# Train on any supported dataset with one command
results = model.train(data="coco8.yaml", epochs=100)
Пользователи Ultralytics также получают преимущества от интегрированного управления наборами данных, инструментов автоматической аннотации и экспорта в один клик в такие форматы, как TFLite и CoreML, что упрощает путь от прототипа до производства.
Баланс производительности с YOLO26
Для разработчиков, стремящихся к идеальному балансу, YOLO26 представляет несколько прорывных нововведений, которых нет в YOLOX или PP-YOLOE+:
- Полная NMS: благодаря устранению постобработки с помощью алгоритма Non-Maximum Suppression (NMS) YOLO26 сокращает задержку вывода и сложность развертывания.
- MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную конвергенцию и более быстрое обучение.
- Улучшенное обнаружение мелких объектов: благодаря ProgLoss и STAL (Soft Task Alignment Learning) YOLO26 отлично справляется со сложными задачами, такими как обработка аэрофотоснимков или мониторинг IoT.
- CPU : удаление Distribution Focal Loss (DFL) позволяет ускорить CPU до 43%, что делает его идеальным решением для периферийных устройств без специальных ускорителей ИИ.
Почему стоит выбрать Ultralytics?
Ultralytics обычно требуют меньше GPU во время обучения по сравнению с архитектурами на основе трансформаторов, такими как RT-DETR. Такая эффективность делает доступ к передовым технологиям искусственного интеллекта более демократичным, позволяя проводить обучение на потребительском оборудовании.
Сценарии использования и рекомендации
Когда следует выбирать YOLOX
YOLOX — отличный выбор для:
- Академические исследования: его чистая архитектура без якорей служит простой базой для экспериментов с новыми детектирующими головками или функциями потерь.
- Устаревшие периферийные устройства: Вариант YOLOX-Nano невероятно мал, подходит для микроконтроллеров или старых мобильных устройств, где основным ограничением является объем памяти.
Когда следует выбирать PP-YOLOE+
PP-YOLOE+ рекомендуется в следующих случаях:
- PaddlePaddle : Ваша существующая инфраструктура построена на экосистеме Baidu.
- Поддержка конкретного оборудования: вы развертываете систему на оборудовании, которое имеет высокооптимизированные ядра, специально предназначенные для Paddle Lite или механизма вывода Paddle.
Когда выбирать Ultralytics YOLO26)
Для большинства коммерческих и прикладных исследовательских проектов YOLO26 является лучшим выбором по следующим причинам:
- Универсальность: в отличие от YOLOX, который в первую очередь является детектором, Ultralytics задачи сегментации экземпляров, оценки позы и ориентированной ограничивающей рамки (OBB) в рамках одной библиотеки.
- Готовность к производству: встроенная поддержка экспорта в ONNX, TensorRTи OpenVINO гарантируют эффективную работу вашей модели на любом целевом оборудовании.
- Активная поддержка: огромное сообщество и частые обновления обеспечивают совместимость с последними CUDA , Python и аппаратными ускорителями.
Приложения в реальном мире
Аналитика розничной торговли
В розничной торговле камеры контролируют наличие товаров на полках. YOLO26 особенно эффективен в этом случае благодаря высокой точности распознавания мелких объектов (ProgLoss) и низкой CPU , что позволяет розничным продавцам обрабатывать видеопотоки локально на серверах магазинов без использования дорогостоящих графических процессоров.
Автономная инспекция дронами
Для инспекции сельского хозяйства или инфраструктуры требуются легкие модели дронов. YOLOX-Nano имеет небольшие размеры, а YOLO26n предлагает более выгодный компромисс, обеспечивая значительно более высокую точность обнаружения болезней сельскохозяйственных культур или структурных трещин при сохранении частоты кадров в реальном времени на встроенных полетных контроллерах.
Умное управление дорожным движением в городах
Системы мониторинга дорожного движения должны точно подсчитывать количество автомобилей и пешеходов. PP-YOLOE+ может хорошо справляться с этой задачей, если развернут на специализированных пограничных устройствах, оптимизированных для Paddle. Однако YOLO26 упрощает эту задачу благодаря своей конструкции NMS, предотвращая «двойной подсчет» автомобилей в условиях интенсивного дорожного движения — распространенную проблему традиционных детекторов на основе якорей, требующих сложной настройки после обработки.
Заключение
Как YOLOX, так и PP-YOLOE+ внесли значительный вклад в развитие технологии обнаружения объектов. YOLOX доказал, что простота без использования якорей может обеспечить результаты высшего уровня, а PP-YOLOE+ расширил границы скорости вывода на определенном оборудовании. Однако для комплексного решения, сочетающего в себе современную точность, простоту использования и универсальные возможности развертывания, Ultralytics выделяется как современный стандарт. Его инновационные функции, такие как оптимизатор MuSGD и архитектура NMS, делают его перспективным выбором на 2026 год и далее.
Для дальнейшего изучения эффективных моделей рекомендуем ознакомиться с документацией по YOLOv8 или YOLOv10.