Перейти к содержанию

YOLOX в сравнении с PP-YOLOE+: техническое сравнение

Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое балансирует точность, скорость и вычислительные затраты. На этой странице представлено подробное техническое сравнение между YOLOX и PP-YOLOE+, двумя влиятельными моделями без привязки к якорям, которые внесли значительный вклад в область компьютерного зрения. Мы углубимся в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам сделать осознанный выбор для ваших проектов.

YOLOX: высокопроизводительное обнаружение без привязки к якорям

YOLOX, представленный компанией Megvii в 2021 году, представляет собой высокопроизводительную модель обнаружения объектов без anchor, которая была направлена на упрощение дизайна серии YOLO при достижении самых современных результатов. Он был разработан для устранения разрыва между академическими исследованиями и промышленными приложениями, предлагая оптимизированную, но мощную архитектуру.

Технические детали:

Архитектура и ключевые особенности

YOLOX представил несколько ключевых инноваций в семейство YOLO, отойдя от традиционных методов, основанных на anchor.

  • Дизайн без привязки к якорям (Anchor-Free Design): Отказываясь от предопределенных ограничивающих рамок (anchor boxes), YOLOX упрощает конвейер обнаружения, уменьшает количество настраиваемых гиперпараметров и может улучшить обобщение для объектов разных размеров и соотношений сторон.
  • Decoupled Head (Разделенная голова): В отличие от более ранних моделей YOLO, которые использовали связанную голову, YOLOX использует отдельные головы для задач классификации и локализации. Такое разделение может привести к более быстрой сходимости и повышению точности.
  • Продвинутые стратегии обучения: YOLOX включает в себя передовые методы, такие как SimOTA (Simplified Optimal Transport Assignment) для динамического назначения меток во время обучения. Он также использует мощные методы аугментации данных, такие как MixUp, для повышения устойчивости модели.

Сильные и слабые стороны

Преимущества:

  • Высокая точность: YOLOX достигает высоких показателей mAP, особенно в своих более крупных вариантах, таких как YOLOX-x, что делает ее конкурентоспособным выбором для задач, критичных к точности.
  • Простота Anchor-Free (Anchor-Free Simplicity): Подход без привязки к якорям снижает сложность, связанную с конфигурацией и настройкой якорных прямоугольников.
  • Устоявшаяся модель: Будучи моделью, доступной с 2021 года, она имеет достаточное количество ресурсов сообщества и примеров развертывания.

Слабые стороны:

  • Скорость инференса: Несмотря на эффективность, его скорость инференса может быть превзойдена более новыми, высокооптимизированными моделями, особенно в небольших вариантах моделей.
  • Внешняя экосистема: YOLOX изначально не интегрирована в экосистему Ultralytics, что может потребовать дополнительных усилий для развертывания и интеграции с такими инструментами, как Ultralytics HUB.
  • Универсальность задач: Он в основном ориентирован на обнаружение объектов и не имеет встроенной поддержки для других задач компьютерного зрения, таких как сегментация экземпляров или оценка позы, которые есть в более новых, универсальных фреймворках.

Случаи использования

YOLOX хорошо подходит для различных приложений, включая:

  • Общее обнаружение объектов: Идеально подходит для сценариев, требующих надежного баланса между точностью и скоростью, например, в системах безопасности.
  • Базовая модель для исследований: Служит отличной отправной точкой для исследователей, изучающих методы обнаружения без привязки к anchor boxes и передовые методы обучения.
  • Промышленные приложения: Может быть развернута для таких задач, как контроль качества, где высокая точность обнаружения имеет решающее значение.

Узнайте больше о YOLOX

PP-YOLOE+: Anchor-Free Превосходство от Baidu

PP-YOLOE+, улучшенная версия PP-YOLOE, была разработана Baidu и выпущена в апреле 2022 года как часть их фреймворка PaddlePaddle. Это anchor-free одноэтапный детектор, разработанный для высокой точности и эффективности, с особым акцентом на промышленные применения.

Технические детали:

Архитектура и ключевые особенности

PP-YOLOE+ основывается на парадигме без anchor boxes с несколькими примечательными функциями, разработанными для расширения границ производительности.

  • Дизайн без привязки к якорям (Anchor-Free Design): Как и YOLOX, он избегает предопределенных ограничивающих рамок (anchor boxes), упрощая конвейер обнаружения. Вы можете узнать больше о детекторах без привязки к якорям (anchor-free detectors) в нашем глоссарии.
  • Эффективные компоненты: Архитектура использует ResNet backbone и Path Aggregation Network (PAN) neck для эффективного объединения многомасштабных признаков.
  • Обучение выравниванию задач (TAL): Ключевым нововведением является использование TAL, специализированной функции потерь, которая лучше выравнивает задачи классификации и локализации, что приводит к значительному повышению точности обнаружения.

Сильные и слабые стороны

Преимущества:

  • Исключительная точность: Модели PP-YOLOE+, особенно более крупные варианты, обеспечивают современную точность на стандартных бенчмарках, таких как COCO.
  • Высокая эффективность: Модели разработаны для обеспечения эффективности, достигая отличного баланса между точностью, количеством параметров и FLOPs.
  • Экосистема PaddlePaddle: Он хорошо интегрирован и оптимизирован во фреймворке глубокого обучения PaddlePaddle.

Слабые стороны:

  • Зависимость от фреймворка: Основная оптимизация для фреймворка PaddlePaddle может быть барьером для разработчиков, работающих с другими экосистемами, такими как PyTorch.
  • Охват сообщества: Несмотря на поддержку Baidu, поддержка сообщества и доступность ресурсов могут быть менее обширными по сравнению с более широко используемыми моделями.

Случаи использования

PP-YOLOE+ — отличный выбор для требовательных приложений, таких как:

  • Проверка качества в промышленности: Высокая точность очень полезна для обнаружения дефектов на производственных линиях.
  • Умная розничная торговля: Полезно для высокоточных задач, таких как управление запасами и аналитика клиентов.
  • Edge Computing: Эффективная архитектура уменьшенных вариантов позволяет развертывать их на мобильных и встроенных устройствах.

Узнайте больше о PP-YOLOE+

Прямое сравнение: YOLOX против PP-YOLOE+

YOLOX и PP-YOLOE+ — мощные детекторы без привязки к якорям, но они демонстрируют ключевые различия в производительности и эффективности. В таблице ниже представлено подробное сравнение на основе набора данных COCO.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

На основании данных можно сделать несколько выводов:

  • Точность (mAP): PP-YOLOE+ стабильно превосходит YOLOX по всем сопоставимым размерам моделей. Самая большая модель, PP-YOLOE+x, достигает замечательного 54,7% mAP, что значительно выше, чем 51,1% у YOLOX-x.
  • Эффективность (параметры и FLOPs): Модели PP-YOLOE+ обычно более эффективны. Например, PP-YOLOE+l достигает более высокого mAP, чем YOLOX-x, при этом используя почти вдвое меньше параметров и FLOPs, демонстрируя превосходную архитектурную конструкцию.
  • Скорость инференса: Модели обладают высокой конкурентоспособностью с точки зрения скорости. В то время как небольшие модели YOLOX демонстрируют небольшое преимущество, более крупные модели PP-YOLOE+ работают быстрее, что указывает на лучшую масштабируемость для высокопроизводительных развертываний.

Заключение: какую модель вам следует выбрать?

YOLOX и PP-YOLOE+ — сильные конкуренты в области обнаружения объектов. YOLOX — хорошо зарекомендовавшая себя и надежная модель, что делает ее отличной отправной точкой для многих проектов. Однако для приложений, требующих высочайшей точности и эффективности, PP-YOLOE+ демонстрирует явное преимущество, при условии, что вам удобно работать в экосистеме PaddlePaddle.

Для разработчиков и исследователей, ищущих более целостное и удобное решение, мы рекомендуем изучить модели Ultralytics YOLO. Такие модели, как YOLOv8 и новейшая YOLO11, предлагают убедительное сочетание производительности, универсальности и простоты использования.

Вот почему модели Ultralytics выделяются:

  • Простота использования: Оптимизированный Python API, подробная документация и большое количество учебных пособий делают начало работы быстрым и легким.
  • Развитая экосистема: Воспользуйтесь преимуществами активной разработки, сильной поддержки сообщества на GitHub и интегрированных инструментов, таких как Ultralytics HUB для комплексного управления проектами.
  • Баланс производительности: Модели Ultralytics разработаны для обеспечения превосходного компромисса между скоростью и точностью, что делает их подходящими как для развертываний на периферийных устройствах в реальном времени, так и для высокоточных облачных решений.
  • Универсальность: В отличие от моделей, ориентированных исключительно на обнаружение, модели Ultralytics YOLO поддерживают несколько задач «из коробки», включая сегментацию экземпляров, оценку позы и классификацию.
  • Эффективность обучения: Благодаря эффективным процессам обучения, более низким требованиям к памяти и готовым предварительно обученным весам вы можете разрабатывать пользовательские модели быстрее.

Чтобы увидеть, как модели Ultralytics соотносятся с другими, вам могут оказаться полезными другие наши страницы сравнения, такие как YOLO11 vs. YOLOX или PP-YOLOE+ vs. YOLOv10.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии