Перейти к содержанию

YOLOX против PP-YOLOE+: глубокий анализ object detection без якорных фреймов

В быстро развивающейся области обнаружения объектов в реальном времени архитектуры без анкеров стали мощной альтернативой традиционным методам на основе анкеров. В этом анализе сравниваются две известные модели без анкеров: YOLOX (от Megvii) и PP-YOLOE+ (отPaddlePaddle). Мы исследуем их уникальные архитектурные инновации, тесты производительности и соображения по развертыванию, чтобы помочь разработчикам выбрать подходящий инструмент для своих приложений компьютерного зрения.

Хотя обе платформы предлагают значительные улучшения по сравнению с предыдущими YOLO , разработчики, ищущие унифицированную платформу для обучения, развертывания и управления жизненным циклом, часто обращаются к Ultralytics . С выпуском YOLO26пользователи получают доступ к сквозному обнаружению NMS, значительно более быстрому CPU и бесшовной интеграции с современными рабочими процессами MLOps.

YOLOX: Простота и производительность

YOLOX, выпущенный в 2021 году, ознаменовал возвращение к архитектурной простоте. Благодаря отделению головки детектора и удалению анкерных коробок, он решил такие распространенные проблемы, как несбалансированная положительная/отрицательная выборка, и при этом достиг передовых для своего времени результатов.

Подробности о YOLOX:
Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun
Megvii
18 июля 2021 г.
Arxiv | GitHub | Документация

Узнайте больше о YOLOX

Ключевые архитектурные особенности

  • Разделенная головка: в отличие от предыдущих YOLO (таких как YOLOv3), где классификация и локализация выполнялись в единой головке, YOLOX разделяет эти задачи. Такое разделение снижает конфликт между двумя целями, что приводит к более быстрой конвергенции и повышению точности.
  • Конструкция без анкеров: благодаря прямому прогнозированию ограничительных рамок без заранее определенных анкеров YOLOX упрощает процесс проектирования, устраняя необходимость в эвристической настройке анкеров (например, кластеризация K-средних по меткам набора данных).
  • SimOTA: динамическая стратегия присвоения меток, называемая SimOTA (Simplified Optimal Transport Assignment), автоматически присваивает объекты реальной действительности наиболее подходящим прогнозам, повышая стабильность обучения.

PP-YOLOE+: усовершенствованный для промышленного применения

PP-YOLOE+, эволюцияYOLO от PaddlePaddle компании Baidu, разработана специально для развертывания в облаке и на периферии. Она уделяет особое внимание скорости вывода на конкретных аппаратных бэкэндах, таких как TensorRT OpenVINO.

PP-YOLOE+ Подробности:
PaddlePaddle
Baidu
2 апреля 2022 г.
Arxiv | GitHub | Docs

Узнайте больше о PP-YOLOE+

Ключевые архитектурные особенности

  • CSPRepResNet Backbone: эта магистраль сочетает в себе эффективность CSPNet с возможностями остаточного обучения ResNet, оптимизированными с помощью методов перепараметризации для повышения скорости вывода без потери точности.
  • TAL (Task Alignment Learning): Заменяя SimOTA, TAL явно согласовывает оценку классификации и качество локализации, гарантируя, что обнаружения с высокой степенью достоверности также имеют высокий показатель пересечения над объединением (IoU) с фактическими данными.
  • Эффективная задачно-ориентированная головка (ET-Head): упрощенная конструкция головки, которая снижает вычислительную нагрузку, сохраняя при этом преимущества развязанного прогнозирования.

Сравнение метрик производительности

В следующей таблице приведены результаты сравнительного анализа YOLOX и PP-YOLOE+ на COCO . В ней показаны компромиссы между размером модели (параметрами), вычислительными затратами (FLOP) и скоростью инференса на различных аппаратных конфигурациях.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Анализ результатов

  • Точность: PP-YOLOE+ обычно достигает более высоких показателейmAPval для моделей сопоставимых размеров (S, M, L, X) благодаря использованию новой стратегии Task Alignment Learning (TAL).
  • Легкие модели: YOLOX-Nano чрезвычайно легкая (0,91 Мб параметров), что делает ее отличным кандидатом для устройств с серьезными ограничениями по ресурсам, где важен каждый килобайт.
  • Вычислительная эффективность: модели PP-YOLOE+ обычно демонстрируют более низкие значения FLOP при аналогичных уровнях точности, что свидетельствует о лучшей оптимизации для операций умножения матриц, часто используемых в GPU .

Ultralytics : за пределами тестов

Хотя сырые тесты важны, опыт разработчиков и поддержка экосистемы имеют решающее значение для успешной реализации проекта. Именно здесь на помощь приходят Ultralytics , такие как YOLO11 и передовая YOLO26, отличаются от других.

Простота использования и экосистема

Python Ultralytics стандартизирует рабочий процесс обучения, валидации и развертывания. Для переключения между моделями требуется изменить только одну строку, тогда как переход с YOLOX (PyTorch) на PP-YOLOE+ (PaddlePaddle) предполагает изучение совершенно других фреймворков и синтаксисов API.

from ultralytics import YOLO

# Load a model: Switch easily between generations
model = YOLO("yolo26n.pt")

# Train on any supported dataset with one command
results = model.train(data="coco8.yaml", epochs=100)

Пользователи Ultralytics также получают преимущества от интегрированного управления наборами данных, инструментов автоматической аннотации и экспорта в один клик в такие форматы, как TFLite и CoreML, что упрощает путь от прототипа до производства.

Баланс производительности с YOLO26

Для разработчиков, стремящихся к идеальному балансу, YOLO26 представляет несколько прорывных нововведений, которых нет в YOLOX или PP-YOLOE+:

  • Полная NMS: благодаря устранению постобработки с помощью алгоритма Non-Maximum Suppression (NMS) YOLO26 сокращает задержку вывода и сложность развертывания.
  • MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную конвергенцию и более быстрое обучение.
  • Улучшенное обнаружение мелких объектов: благодаря ProgLoss и STAL (Soft Task Alignment Learning) YOLO26 отлично справляется со сложными задачами, такими как обработка аэрофотоснимков или мониторинг IoT.
  • CPU : удаление Distribution Focal Loss (DFL) позволяет ускорить CPU до 43%, что делает его идеальным решением для периферийных устройств без специальных ускорителей ИИ.

Почему стоит выбрать Ultralytics?

Ultralytics обычно требуют меньше GPU во время обучения по сравнению с архитектурами на основе трансформаторов, такими как RT-DETR. Такая эффективность делает доступ к передовым технологиям искусственного интеллекта более демократичным, позволяя проводить обучение на потребительском оборудовании.

Сценарии использования и рекомендации

Когда следует выбирать YOLOX

YOLOX — отличный выбор для:

  • Академические исследования: его чистая архитектура без якорей служит простой базой для экспериментов с новыми детектирующими головками или функциями потерь.
  • Устаревшие периферийные устройства: Вариант YOLOX-Nano невероятно мал, подходит для микроконтроллеров или старых мобильных устройств, где основным ограничением является объем памяти.

Когда следует выбирать PP-YOLOE+

PP-YOLOE+ рекомендуется в следующих случаях:

  • PaddlePaddle : Ваша существующая инфраструктура построена на экосистеме Baidu.
  • Поддержка конкретного оборудования: вы развертываете систему на оборудовании, которое имеет высокооптимизированные ядра, специально предназначенные для Paddle Lite или механизма вывода Paddle.

Когда выбирать Ultralytics YOLO26)

Для большинства коммерческих и прикладных исследовательских проектов YOLO26 является лучшим выбором по следующим причинам:

  • Универсальность: в отличие от YOLOX, который в первую очередь является детектором, Ultralytics задачи сегментации экземпляров, оценки позы и ориентированной ограничивающей рамки (OBB) в рамках одной библиотеки.
  • Готовность к производству: встроенная поддержка экспорта в ONNX, TensorRTи OpenVINO гарантируют эффективную работу вашей модели на любом целевом оборудовании.
  • Активная поддержка: огромное сообщество и частые обновления обеспечивают совместимость с последними CUDA , Python и аппаратными ускорителями.

Приложения в реальном мире

Аналитика розничной торговли

В розничной торговле камеры контролируют наличие товаров на полках. YOLO26 особенно эффективен в этом случае благодаря высокой точности распознавания мелких объектов (ProgLoss) и низкой CPU , что позволяет розничным продавцам обрабатывать видеопотоки локально на серверах магазинов без использования дорогостоящих графических процессоров.

Автономная инспекция дронами

Для инспекции сельского хозяйства или инфраструктуры требуются легкие модели дронов. YOLOX-Nano имеет небольшие размеры, а YOLO26n предлагает более выгодный компромисс, обеспечивая значительно более высокую точность обнаружения болезней сельскохозяйственных культур или структурных трещин при сохранении частоты кадров в реальном времени на встроенных полетных контроллерах.

Умное управление дорожным движением в городах

Системы мониторинга дорожного движения должны точно подсчитывать количество автомобилей и пешеходов. PP-YOLOE+ может хорошо справляться с этой задачей, если развернут на специализированных пограничных устройствах, оптимизированных для Paddle. Однако YOLO26 упрощает эту задачу благодаря своей конструкции NMS, предотвращая «двойной подсчет» автомобилей в условиях интенсивного дорожного движения — распространенную проблему традиционных детекторов на основе якорей, требующих сложной настройки после обработки.

Узнайте больше о YOLO26

Заключение

Как YOLOX, так и PP-YOLOE+ внесли значительный вклад в развитие технологии обнаружения объектов. YOLOX доказал, что простота без использования якорей может обеспечить результаты высшего уровня, а PP-YOLOE+ расширил границы скорости вывода на определенном оборудовании. Однако для комплексного решения, сочетающего в себе современную точность, простоту использования и универсальные возможности развертывания, Ultralytics выделяется как современный стандарт. Его инновационные функции, такие как оптимизатор MuSGD и архитектура NMS, делают его перспективным выбором на 2026 год и далее.

Для дальнейшего изучения эффективных моделей рекомендуем ознакомиться с документацией по YOLOv8 или YOLOv10.


Комментарии