Сравнение моделей: YOLOv8 против YOLOX для обнаружения объектов
Выбор правильной модели обнаружения объектов имеет решающее значение для различных приложений компьютерного зрения. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и YOLOX, двух популярных и эффективных моделей для обнаружения объектов. Мы рассмотрим их архитектурные нюансы, эталоны производительности и пригодность для различных сценариев использования, чтобы помочь вам принять обоснованное решение.
Ultralytics YOLOv8: эффективность и универсальность
Ultralytics YOLOv8 Это самая современная модель серии YOLO , известная своей скоростью и точностью в обнаружении объектов и других задачах зрения. Разработана Гленом Джошером, Аюшем Чаурасией и Цзином Цю в компании Ultralytics и выпущенная 2023-01-10, YOLOv8 создана на основе предыдущих версий YOLO с архитектурными улучшениями, направленными на эффективность и простоту использования. Он разработан как универсальный, хорошо справляющийся с задачами обнаружения объектов, сегментации, оценки позы и классификации.
Архитектура и ключевые особенности:
В YOLOv8 используется безъякорный подход, что упрощает архитектуру и улучшает обобщение. Ключевые особенности включают:
- Оптимизированный костяк: Эффективное извлечение признаков.
- Безъякорная детекторная головка: повышает скорость и простоту.
- Композитная функция потерь: Оптимизирована для точности и надежного обучения.
Сильные стороны:
- Отличные характеристики: YOLOv8 обеспечивает оптимальный баланс скорости и точности, что делает его пригодным для широкого круга приложений. Показатели производительности приведены в сравнительной таблице ниже.
- Удобство использования: Ultralytics делает акцент на простоте использования благодаря понятной документации и удобному пакетуPython .
- Многозадачная универсальность: Поддерживает обнаружение объектов, сегментацию объектов, оценку позы и классификацию изображений.
- Интеграция с экосистемой: Бесшовная интеграция с Ultralytics HUB для управления и развертывания моделей, оптимизирующая рабочие процессы MLOps.
Слабые стороны:
- Несмотря на высокую эффективность, для крайне ограниченных в ресурсах устройств можно использовать более компактные модели, такие как YOLOX-Nano.
Идеальные варианты использования:
Универсальность YOLOv8 делает его идеальным для приложений, требующих баланса высокой точности и производительности в реальном времени, таких как:
- Обнаружение объектов в реальном времени: Такие области применения, как системы охранной сигнализации, робототехника и автономные транспортные средства.
- Универсальные решения в области искусственного интеллекта: В таких отраслях, как сельское хозяйство, производство и здравоохранение.
- Быстрое прототипирование и развертывание: Благодаря простоте использования и обширному инструментарию, включая Ultralytics HUB.
YOLOX: высокая производительность и простота
YOLOX, представленный Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun из Megvii 2021-07-18, является еще одной безъякорной моделью YOLO , которая стремится к высокой производительности при упрощенном дизайне. YOLOX фокусируется на обнаружении объектов и призван преодолеть разрыв между исследованиями и промышленными приложениями.
Архитектура и ключевые особенности:
YOLOX также использует безъякорный подход, что упрощает процесс обучения и вывода. Ключевые архитектурные компоненты включают:
- Decoupled Head: разделение задач классификации и локализации для повышения производительности.
- Назначение меток SimOTA: Усовершенствованная стратегия присвоения меток для оптимизации обучения.
- Сильное расширение данных: Для повышения надежности используются такие техники, как MixUp и Mosaic.
Сильные стороны:
- Высокая точность: YOLOX достигает конкурентоспособной точности, часто превосходящей другие модели YOLO , особенно в моделях меньшего размера. Подробные показатели приведены в сравнительной таблице.
- Эффективный вывод: Обеспечивает высокую скорость вычислений, подходящую для приложений реального времени.
- Гибкие магистрали: Поддерживает различные магистрали, включая Darknet53 и легкие варианты, такие как Nano, позволяя настраивать их в зависимости от ограничений на ресурсы.
- Открытый исходный код: Полностью открытый исходный код Megvii, поощряющий вклад сообщества и использование.
Слабые стороны:
- Сообщество и экосистема: Несмотря на открытый исходный код, он может не иметь такого уровня интеграции экосистемы и инструментария, как Ultralytics YOLOv8, например, бесшовной интеграции с такими платформами, как Ultralytics HUB.
Идеальные варианты использования:
YOLOX хорошо подходит для приложений, требующих высокой точности и эффективности выводов, таких как:
- Высокопроизводительное обнаружение объектов: Сценарии, требующие высочайшей точности в задачах обнаружения объектов.
- Развертывание на границе: Более компактные варианты, такие как YOLOX-Nano и YOLOX-Tiny, отлично подходят для развертывания на пограничных устройствах с ограниченными вычислительными ресурсами.
- Исследования и разработки: Благодаря четкой и модульной конструкции, это хороший выбор для исследований и дальнейших разработок в области обнаружения объектов.
Сравнение производительности
Ниже представлено сравнение моделей YOLOv8 и YOLOX по показателям производительности на наборе данных COCO.
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Заключение
И YOLOv8 , и YOLOX - отличные варианты для обнаружения объектов, каждый из которых имеет свои сильные стороны. YOLOv8 отличается универсальностью, простотой использования и развитой экосистемой, что делает его отличной универсальной моделью для различных задач технического зрения и сценариев развертывания. YOLOX превосходит по точности и эффективности, особенно в сценариях, требующих высокой производительности и адаптации к ограничениям ресурсов.
Для пользователей, заинтересованных в изучении других моделей, Ultralytics также предлагает ряд передовых моделей, включая YOLOv5, YOLOv7, YOLOv9, YOLOv10 и новейшую модель YOLO11 каждая из которых предназначена для конкретных нужд и применений.