Перейти к содержанию

YOLOv5 vs YOLOX: Техническое сравнение

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает точность, скорость и сложность развертывания. На этой странице представлено подробное техническое сравнение двух влиятельных моделей в семействе YOLO: Ultralytics YOLOv5 и YOLOX. Хотя обе модели обеспечивают производительность в реальном времени, они построены на принципиально разных принципах проектирования. YOLOv5 — это высокооптимизированная модель на основе якорей, известная своей исключительной простотой использования и эффективностью, тогда как YOLOX представляет подход без якорей, чтобы расширить границы точности. Мы углубимся в их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам определить, какая модель лучше всего подходит для нужд вашего проекта.

Ultralytics YOLOv5: Устоявшийся отраслевой стандарт

Технические детали:

Архитектура и ключевые особенности

Ultralytics YOLOv5 стал отраслевым эталоном благодаря замечательному сочетанию скорости, точности и удобства использования. Построенный полностью на PyTorch, YOLOv5 имеет надежную архитектуру с бэкбоном CSPDarknet53, neck PANet для агрегации признаков и эффективный anchor-based detection head. Одной из его ключевых сильных сторон является масштабируемость, предлагающая ряд моделей от маленькой и быстрой YOLOv5n до большой и точной YOLOv5x. Эта гибкость позволяет разработчикам выбрать идеальную модель для своих конкретных вычислительных требований и требований к производительности.

Сильные стороны

  • Исключительная скорость и эффективность: YOLOv5 высоко оптимизирована для быстрого вывода, что делает ее лучшим выбором для систем реального времени на различном оборудовании, от CPU до GPU и периферийных устройств.
  • Простота использования: YOLOv5, известный своим оптимизированным пользовательским интерфейсом, предлагает простой Python API и CLI, дополненные обширной документацией и многочисленными учебными пособиями.
  • Хорошо поддерживаемая экосистема: Как модель Ultralytics, YOLOv5 выигрывает от зрелой и активной экосистемы. Это включает в себя непрерывную разработку, большое и поддерживающее сообщество, частые обновления и бесшовную интеграцию с такими инструментами, как Ultralytics HUB для обучения и развертывания без кода.
  • Эффективность обучения: Модель предлагает эффективный процесс обучения с легкодоступными предварительно обученными весами на наборах данных, таких как COCO, значительно сокращая время обучения и вычислительные затраты.
  • Универсальность: YOLOv5 не ограничивается только обнаружением объектов; он также поддерживает сегментацию экземпляров и классификацию изображений, что делает его универсальным инструментом для различных задач компьютерного зрения.
  • Меньшее использование памяти: По сравнению с более сложными архитектурами, YOLOv5 обычно требует меньше памяти для обучения и инференса, что делает его более доступным для пользователей с ограниченными аппаратными ресурсами.

Слабые стороны

  • Детектирование на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать тщательной настройки для достижения оптимальной производительности на наборах данных с объектами необычной формы или масштаба, по сравнению с детекторами без anchor.
  • Компромисс в точности: Предлагая отличный баланс, небольшие модели YOLOv5 приоритезируют скорость, что может привести к незначительному снижению точности по сравнению с новыми, более сложными архитектурами, такими как YOLOX или YOLOv9.

Случаи использования

YOLOv5 превосходен в приложениях, где скорость и эффективность имеют решающее значение:

Узнайте больше о YOLOv5

YOLOX: Anchor-Free и высокопроизводительная альтернатива

Технические детали:

Архитектура и ключевые особенности

YOLOX, представленный в 2021 году исследователями из Megvii, представляет собой anchor-free подход к обнаружению объектов. Этот выбор дизайна направлен на упрощение конвейера обнаружения и улучшение обобщения за счет устранения необходимости в предопределенных anchor boxes. Ключевые архитектурные инновации включают в себя отделенную голову, которая разделяет задачи классификации и локализации на разные ветви, и использование продвинутых стратегий обучения, таких как SimOTA — метод динамического назначения меток, который помогает модели лучше изучать представления.

Сильные стороны

  • Обнаружение без привязки к якорям (Anchor-Free Detection): Упрощает конвейер обнаружения, устраняя сложность и предварительные допущения, связанные с ограничивающими рамками (anchor boxes), что потенциально приводит к лучшей производительности на объектах с различными соотношениями сторон.
  • Высокая точность: Достигает конкурентоспособной точности, особенно со своими более крупными моделями. Разделенная структура head и передовая стратегия назначения меток SimOTA являются ключевыми факторами, обеспечивающими высокие показатели mAP.

Слабые стороны

  • Сложность: Хотя конструкция без anchor упрощает один аспект, внедрение разделенных заголовков и продвинутых стратегий, таких как SimOTA, может увеличить сложность реализации и сделать процесс обучения менее интуитивным.
  • Внешняя экосистема: YOLOX не является частью пакета Ultralytics, что означает отсутствие простой интеграции с мощными инструментами, такими как Ultralytics HUB. Это может привести к более сложной кривой обучения и большему количеству ручных усилий для обучения, развертывания и MLOps.
  • Скорость CPU: Скорость инференса на CPU может отставать от высокооптимизированных моделей, таких как YOLOv5, особенно для более крупных вариантов YOLOX, что делает его менее идеальным для определенных приложений реального времени, связанных с CPU.

Случаи использования

YOLOX хорошо подходит для приложений, где максимальная точность является главным приоритетом:

  • Автономное вождение: Подходит для задач восприятия в автономных транспортных средствах, где высокая точность имеет решающее значение для безопасности.
  • Продвинутая робототехника: Идеально подходит для сложных сред, где роботам требуется точное обнаружение объектов для навигации и взаимодействия.
  • Исследования: Служит надежной отправной точкой для изучения методологий без привязки к anchor boxes и передовых методов обучения в исследованиях по обнаружению объектов.

Узнайте больше о YOLOX

Сравнение производительности и скорости

При сравнении YOLOv5 и YOLOX становятся очевидными компромиссы между скоростью, точностью и размером модели. YOLOv5 разработан для исключительной эффективности, обеспечивая очень высокую скорость инференса, особенно на CPU и при экспорте в оптимизированные форматы, такие как TensorRT. Это делает его отличным выбором для приложений, требующих производительности в реальном времени на широком спектре оборудования. YOLOX, с другой стороны, стремится к более высокой точности, при этом его самая большая модель, YOLOX-x, достигает немного более высокого mAP, чем YOLOv5x. Однако этот прирост точности часто достигается за счет увеличения вычислительных затрат и более медленного времени инференса.

В таблице ниже представлено количественное сравнение различных размеров моделей для YOLOv5 и YOLOX, протестированных на наборе данных COCO val2017.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Заключение и рекомендации

И YOLOv5, и YOLOX — это мощные модели обнаружения объектов, но они отвечают разным приоритетам.

Ultralytics YOLOv5 остается превосходным выбором для подавляющего большинства реальных приложений. Ее ключевыми преимуществами являются непревзойденная простота использования, исключительная скорость логического вывода и надежная, хорошо поддерживаемая экосистема. Для разработчиков и команд, стремящихся быстро и эффективно перейти от концепции к производству, оптимизированный рабочий процесс YOLOv5, обширная документация и интеграция с такими инструментами, как Ultralytics HUB, неоценимы. Она обеспечивает отличный баланс скорости и точности, что делает ее идеальной для развертывания на всем, от высокопроизводительных облачных серверов до периферийных устройств с ограниченными ресурсами.

YOLOX — это сильная академическая и исследовательская модель, демонстрирующая потенциал архитектур без привязки к anchor. Это подходящий выбор для проектов, где достижение абсолютно наивысшего mAP является основной целью, и команда разработчиков готова справиться с возросшей сложностью и отсутствием интегрированной экосистемы.

Для большинства разработчиков, исследователей и предприятий мы рекомендуем начать с модели Ultralytics. Преимущества унифицированной, активно развивающейся платформы, которая поддерживает несколько задач (обнаружение, сегментация, поза и т. д.) и предлагает четкий путь обновления до более новых моделей, таких как YOLOv8 и YOLO11, обеспечивают значительное долгосрочное преимущество. Экосистема Ultralytics разработана для ускорения разработки и обеспечения поддержки и инструментов, необходимых для достижения успеха.

Сравнения с другими моделями

Если вам интересно сравнить эти модели с другими моделями семейства YOLO и не только, ознакомьтесь со следующими страницами:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии