PP-YOLOE+ против YOLOX: техническое сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов — это критически важный шаг в любом проекте компьютерного зрения, требующий тщательного баланса точности, скорости и сложности развертывания. На этой странице представлено подробное техническое сравнение между PP-YOLOE+ и YOLOX, двумя известными детекторами без привязки к якорям. Мы проанализируем их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящий вариант для ваших нужд.
PP-YOLOE+: Высокая точность из экосистемы PaddlePaddle
PP-YOLOE+, улучшенная версия PP-YOLOE, была разработана Baidu в рамках их фреймворка PaddlePaddle. Представленный в апреле 2022 года, это одноэтапный детектор без anchor boxes, разработанный для высокой точности и эффективности, с сильным акцентом на промышленные приложения.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Документация: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Архитектура и ключевые особенности
PP-YOLOE+ основывается на парадигме без anchor boxes, которая упрощает конвейер обнаружения, устраняя необходимость в предопределенных anchor boxes. Это уменьшает количество гиперпараметров и сложность модели.
- Эффективные компоненты: Архитектура использует ResNet backbone, Path Aggregation Network (PAN) neck для эффективного объединения признаков и decoupled head, который разделяет задачи классификации и локализации.
- Обучение выравниванию задач (TAL): Ключевым нововведением является использование TAL, специализированной функции потерь, предназначенной для лучшего выравнивания задач классификации и локализации. Это выравнивание имеет решающее значение для повышения точности обнаружения, особенно для плотно упакованных или перекрывающихся объектов.
Сильные и слабые стороны
Преимущества:
- Высокая точность: Более крупные варианты, такие как PP-YOLOE+x, достигают очень высоких показателей mAP на датасете COCO.
- Anchor-Free Design: Упрощает архитектуру модели и уменьшает необходимость в сложной настройке гиперпараметров, связанных с anchor boxes.
- Интеграция PaddlePaddle: Тесно интегрирован в экосистему PaddlePaddle, что делает его естественным выбором для разработчиков, уже использующих этот фреймворк.
Слабые стороны:
- Зависимость от экосистемы: Ее основная оптимизация для фреймворка PaddlePaddle может быть ограничением для пользователей, которые не являются частью этой экосистемы, что потенциально увеличивает усилия по интеграции.
- Сообщество и ресурсы: Несмотря на хорошую документацию в своей экосистеме, он может иметь менее обширную поддержку сообщества и сторонние ресурсы по сравнению с более широко используемыми моделями.
Случаи использования
PP-YOLOE+ особенно хорошо подходит для сценариев, где высокая точность является основным требованием.
- Контроль качества в промышленности: Его точность очень полезна для обнаружения дефектов в производстве.
- Умная розничная торговля: Может эффективно использоваться для управления запасами и аналитики клиентов.
- Edge Computing: Эффективная архитектура модели позволяет развертывать ее на мобильных и встроенных устройствах, особенно при ускорении с помощью таких инструментов, как TensorRT.
YOLOX: Высокопроизводительная альтернатива без привязки к якорям
YOLOX был представлен в июле 2021 года исследователями из Megvii. Это еще одна высокопроизводительная модель обнаружения объектов без привязки к anchor, которая направлена на упрощение серии YOLO при достижении самых современных результатов, эффективно устраняя разрыв между исследовательскими и промышленными потребностями.
- Авторы: Чжэн Ге, Сунтао Лю, Фэн Ван, Цзэмин Ли и Цзянь Сунь
- Организация: Megvii
- Дата: 18.07.2021
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Документация: https://yolox.readthedocs.io/en/latest/
Архитектура и ключевые особенности
YOLOX выделяется тем, что сочетает в себе anchor-free дизайн с несколькими передовыми методами для повышения производительности.
- Разделенная Head: Как и PP-YOLOE+, она использует разделенную head для классификации и локализации, что, как было показано, улучшает сходимость и точность.
- Продвинутые стратегии обучения: YOLOX включает SimOTA, передовую стратегию назначения меток, для динамического назначения положительных примеров во время обучения. Он также использует мощные методы аугментации данных, такие как MixUp, для улучшения обобщения модели.
Сильные и слабые стороны
Преимущества:
- Высокая точность: Достигает конкурентоспособной точности, используя свою разделенную структуру head и передовые методы назначения меток.
- Простота Anchor-Free (Anchor-Free Simplicity): Дизайн без привязки к якорям упрощает конвейер обнаружения и может улучшить обобщение за счет устранения зависимостей от предопределенных конфигураций якорных прямоугольников.
- Устоявшаяся модель: Будучи доступной с 2021 года, YOLOX имеет прочную базу ресурсов сообщества и примеров развертывания.
Слабые стороны:
- Сложность реализации: Хотя аспект anchor-free проще, введение продвинутых стратегий, таких как SimOTA, может добавить сложности в процесс реализации и обучения.
- Внешняя экосистема: YOLOX не является частью унифицированной экосистемы, такой как Ultralytics, что может означать более сложную кривую обучения и менее простую интеграцию с комплексными инструментами, такими как Ultralytics HUB.
- Скорость инференса на CPU: Скорость инференса на CPU может отставать от высокооптимизированных моделей, особенно для более крупных вариантов YOLOX.
Случаи использования
YOLOX — это отличный выбор для приложений, требующих высокой точности и надежной архитектуры без привязки к anchor box.
- Автономное вождение: Хорошо подходит для задач восприятия в автономных транспортных средствах, где высокая точность имеет решающее значение.
- Продвинутая робототехника: Идеально подходит для сложных сред, где для навигации и взаимодействия необходимо точное обнаружение объектов, что является ключевой областью в робототехнике.
- Исследования и разработки: Служит прочной основой для изучения методологий без привязки к якорям и передовых методов обучения в области обнаружения объектов.
Анализ и сравнение производительности
PP-YOLOE+ и YOLOX предлагают широкий выбор размеров моделей, что позволяет разработчикам сбалансировать точность и скорость. Основываясь на эталонных показателях набора данных COCO, модели PP-YOLOE+, особенно более крупные варианты (l, x), как правило, достигают более высоких показателей mAP, чем их аналоги YOLOX. Например, PP-YOLOE+x достигает 54,7% mAP, превосходя YOLOX-x. С точки зрения скорости вывода на GPU T4, модели обладают высокой конкурентоспособностью: YOLOX-s немного превосходит PP-YOLOE+s, а PP-YOLOE+m немного быстрее, чем YOLOX-m.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Заключение: какая модель подходит именно вам?
PP-YOLOE+ и YOLOX — это мощные детекторы объектов без привязки к якорям, но они отвечают несколько разным приоритетам. PP-YOLOE+ — отличный выбор для пользователей в экосистеме PaddlePaddle, которым необходимо максимально повысить точность для требовательных промышленных приложений. YOLOX — это универсальная и высокопроизводительная модель, которая служит надежной отправной точкой для широкого спектра приложений, особенно в исследованиях и областях с высокими ставками, таких как автономные системы.
Для разработчиков и исследователей, ищущих модель, которая сочетает в себе современную производительность с исключительной простотой использования и универсальностью, модели Ultralytics YOLO, такие как YOLOv8 и новейшая YOLO11, представляют собой убедительную альтернативу. Модели Ultralytics предлагают превосходный опыт благодаря:
- Простота использования: Оптимизированный Python API, подробная документация и удобный интерфейс командной строки делают начало работы быстрым и простым.
- Развитая экосистема: Воспользуйтесь преимуществами активной разработки, сильной поддержки сообщества через GitHub и Discord, частых обновлений и интеграции с Ultralytics HUB для комплексного управления жизненным циклом модели.
- Баланс производительности: Модели Ultralytics разработаны для обеспечения оптимального компромисса между скоростью и точностью, что делает их подходящими для широкого спектра реальных сценариев развертывания.
- Универсальность: В отличие от моделей, ориентированных исключительно на обнаружение, модели Ultralytics YOLO поддерживают несколько задач «из коробки», включая сегментацию экземпляров, оценку позы и классификацию.
- Эффективность обучения: Благодаря готовым предварительно обученным весам и эффективным процессам обучения моделям Ultralytics часто требуется меньше времени и вычислительных ресурсов для достижения превосходных результатов.
Для более детального сравнения вам также может быть интересно изучить, как эти модели соотносятся с другими архитектурами, например, в наших анализах YOLOv8 vs. YOLOX и YOLO11 vs. PP-YOLOE+.