Перейти к содержанию

PP-YOLOE+ против YOLOX: техническое сравнение для обнаружения объектов

Выбор оптимальной модели обнаружения объектов — это критически важный шаг в любом проекте компьютерного зрения, требующий тщательного баланса точности, скорости и сложности развертывания. На этой странице представлено подробное техническое сравнение между PP-YOLOE+ и YOLOX, двумя известными детекторами без привязки к якорям. Мы проанализируем их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящий вариант для ваших нужд.

PP-YOLOE+: Высокая точность из экосистемы PaddlePaddle

PP-YOLOE+, улучшенная версия PP-YOLOE, была разработана Baidu в рамках их фреймворка PaddlePaddle. Представленный в апреле 2022 года, это одноэтапный детектор без anchor boxes, разработанный для высокой точности и эффективности, с сильным акцентом на промышленные приложения.

Архитектура и ключевые особенности

PP-YOLOE+ основывается на парадигме без anchor boxes, которая упрощает конвейер обнаружения, устраняя необходимость в предопределенных anchor boxes. Это уменьшает количество гиперпараметров и сложность модели.

  • Эффективные компоненты: Архитектура использует ResNet backbone, Path Aggregation Network (PAN) neck для эффективного объединения признаков и decoupled head, который разделяет задачи классификации и локализации.
  • Обучение выравниванию задач (TAL): Ключевым нововведением является использование TAL, специализированной функции потерь, предназначенной для лучшего выравнивания задач классификации и локализации. Это выравнивание имеет решающее значение для повышения точности обнаружения, особенно для плотно упакованных или перекрывающихся объектов.

Узнайте больше о PP-YOLOE+

Сильные и слабые стороны

Преимущества:

  • Высокая точность: Более крупные варианты, такие как PP-YOLOE+x, достигают очень высоких показателей mAP на датасете COCO.
  • Anchor-Free Design: Упрощает архитектуру модели и уменьшает необходимость в сложной настройке гиперпараметров, связанных с anchor boxes.
  • Интеграция PaddlePaddle: Тесно интегрирован в экосистему PaddlePaddle, что делает его естественным выбором для разработчиков, уже использующих этот фреймворк.

Слабые стороны:

  • Зависимость от экосистемы: Ее основная оптимизация для фреймворка PaddlePaddle может быть ограничением для пользователей, которые не являются частью этой экосистемы, что потенциально увеличивает усилия по интеграции.
  • Сообщество и ресурсы: Несмотря на хорошую документацию в своей экосистеме, он может иметь менее обширную поддержку сообщества и сторонние ресурсы по сравнению с более широко используемыми моделями.

Случаи использования

PP-YOLOE+ особенно хорошо подходит для сценариев, где высокая точность является основным требованием.

  • Контроль качества в промышленности: Его точность очень полезна для обнаружения дефектов в производстве.
  • Умная розничная торговля: Может эффективно использоваться для управления запасами и аналитики клиентов.
  • Edge Computing: Эффективная архитектура модели позволяет развертывать ее на мобильных и встроенных устройствах, особенно при ускорении с помощью таких инструментов, как TensorRT.

YOLOX: Высокопроизводительная альтернатива без привязки к якорям

YOLOX был представлен в июле 2021 года исследователями из Megvii. Это еще одна высокопроизводительная модель обнаружения объектов без привязки к anchor, которая направлена на упрощение серии YOLO при достижении самых современных результатов, эффективно устраняя разрыв между исследовательскими и промышленными потребностями.

Архитектура и ключевые особенности

YOLOX выделяется тем, что сочетает в себе anchor-free дизайн с несколькими передовыми методами для повышения производительности.

  • Разделенная Head: Как и PP-YOLOE+, она использует разделенную head для классификации и локализации, что, как было показано, улучшает сходимость и точность.
  • Продвинутые стратегии обучения: YOLOX включает SimOTA, передовую стратегию назначения меток, для динамического назначения положительных примеров во время обучения. Он также использует мощные методы аугментации данных, такие как MixUp, для улучшения обобщения модели.

Узнайте больше о YOLOX

Сильные и слабые стороны

Преимущества:

  • Высокая точность: Достигает конкурентоспособной точности, используя свою разделенную структуру head и передовые методы назначения меток.
  • Простота Anchor-Free (Anchor-Free Simplicity): Дизайн без привязки к якорям упрощает конвейер обнаружения и может улучшить обобщение за счет устранения зависимостей от предопределенных конфигураций якорных прямоугольников.
  • Устоявшаяся модель: Будучи доступной с 2021 года, YOLOX имеет прочную базу ресурсов сообщества и примеров развертывания.

Слабые стороны:

  • Сложность реализации: Хотя аспект anchor-free проще, введение продвинутых стратегий, таких как SimOTA, может добавить сложности в процесс реализации и обучения.
  • Внешняя экосистема: YOLOX не является частью унифицированной экосистемы, такой как Ultralytics, что может означать более сложную кривую обучения и менее простую интеграцию с комплексными инструментами, такими как Ultralytics HUB.
  • Скорость инференса на CPU: Скорость инференса на CPU может отставать от высокооптимизированных моделей, особенно для более крупных вариантов YOLOX.

Случаи использования

YOLOX — это отличный выбор для приложений, требующих высокой точности и надежной архитектуры без привязки к anchor box.

  • Автономное вождение: Хорошо подходит для задач восприятия в автономных транспортных средствах, где высокая точность имеет решающее значение.
  • Продвинутая робототехника: Идеально подходит для сложных сред, где для навигации и взаимодействия необходимо точное обнаружение объектов, что является ключевой областью в робототехнике.
  • Исследования и разработки: Служит прочной основой для изучения методологий без привязки к якорям и передовых методов обучения в области обнаружения объектов.

Анализ и сравнение производительности

PP-YOLOE+ и YOLOX предлагают широкий выбор размеров моделей, что позволяет разработчикам сбалансировать точность и скорость. Основываясь на эталонных показателях набора данных COCO, модели PP-YOLOE+, особенно более крупные варианты (l, x), как правило, достигают более высоких показателей mAP, чем их аналоги YOLOX. Например, PP-YOLOE+x достигает 54,7% mAP, превосходя YOLOX-x. С точки зрения скорости вывода на GPU T4, модели обладают высокой конкурентоспособностью: YOLOX-s немного превосходит PP-YOLOE+s, а PP-YOLOE+m немного быстрее, чем YOLOX-m.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Заключение: какая модель подходит именно вам?

PP-YOLOE+ и YOLOX — это мощные детекторы объектов без привязки к якорям, но они отвечают несколько разным приоритетам. PP-YOLOE+ — отличный выбор для пользователей в экосистеме PaddlePaddle, которым необходимо максимально повысить точность для требовательных промышленных приложений. YOLOX — это универсальная и высокопроизводительная модель, которая служит надежной отправной точкой для широкого спектра приложений, особенно в исследованиях и областях с высокими ставками, таких как автономные системы.

Для разработчиков и исследователей, ищущих модель, которая сочетает в себе современную производительность с исключительной простотой использования и универсальностью, модели Ultralytics YOLO, такие как YOLOv8 и новейшая YOLO11, представляют собой убедительную альтернативу. Модели Ultralytics предлагают превосходный опыт благодаря:

  • Простота использования: Оптимизированный Python API, подробная документация и удобный интерфейс командной строки делают начало работы быстрым и простым.
  • Развитая экосистема: Воспользуйтесь преимуществами активной разработки, сильной поддержки сообщества через GitHub и Discord, частых обновлений и интеграции с Ultralytics HUB для комплексного управления жизненным циклом модели.
  • Баланс производительности: Модели Ultralytics разработаны для обеспечения оптимального компромисса между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев развертывания.
  • Универсальность: В отличие от моделей, ориентированных исключительно на обнаружение, модели Ultralytics YOLO поддерживают несколько задач «из коробки», включая сегментацию экземпляров, оценку позы и классификацию.
  • Эффективность обучения: Благодаря готовым предварительно обученным весам и эффективным процессам обучения моделям Ultralytics часто требуется меньше времени и вычислительных ресурсов для достижения превосходных результатов.

Для более детального сравнения вам также может быть интересно изучить, как эти модели соотносятся с другими архитектурами, например, в наших анализах YOLOv8 vs. YOLOX и YOLO11 vs. PP-YOLOE+.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии