Перейти к содержанию

YOLOX против YOLOv5: соединение исследований без анкоров и промышленного обнаружения объектов

Развитие технологии обнаружения объектов в реальном времени было обусловлено двумя различными философиями: академическим стремлением к архитектурной чистоте и промышленным спросом на практическое применение. YOLOX и YOLOv5 представляют собой слияние этих двух направлений. YOLOX представил высокопроизводительный детектор без анкеров, который упростил базовую геометрию обнаружения, а YOLOv5 глобальный стандарт удобства использования, надежности и простоты внедрения в производственные среды.

В этом подробном сравнении рассматривается, как эти две влиятельные модели соотносятся с точки зрения архитектурных решений, скорости вывода и применимости в реальных условиях, что поможет вам решить, какая из них лучше всего подходит для ваших задач в области компьютерного зрения.

Основные технические характеристики

В следующей таблице представлены показатели производительности обеих моделей. В то время как YOLOX демонстрирует высокие теоретические результаты, YOLOv5 обеспечивает более сбалансированный профиль для практического внедрения, особенно с учетом зрелости его экспортной экосистемы.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX: инноватор без якоря

YOLOX, выпущенный Megvii в 2021 году, ознаменовал значительный сдвиг в YOLO , отказавшись от анкерных коробок — основного элемента предыдущих версий, таких как YOLOv2 и YOLOv3. Благодаря использованию механизма без анкеров YOLOX упростил процесс обучения и устранил необходимость в ручной настройке гиперпараметров анкеров, которая часто требовала специальных знаний в конкретной области.

Архитектурные особенности

  • Механизм без анкеров: вместо прогнозирования смещений из заранее определенных рамок, YOLOX напрямую прогнозирует координаты ограничивающей рамки. Такой подход снижает сложность архитектуры головки и улучшает обобщение для объектов различной формы.
  • Разделенная головка: задачи классификации и локализации разделены на разные ветви сети. Такое разделение устраняет конфликт между достоверностью классификации и точностью локализации, что приводит к более быстрой конвергенции во время обучения.
  • Назначение меток SimOTA: YOLOX представил SimOTA, передовую стратегию назначения меток, которая рассматривает процедуру назначения как задачу оптимального транспорта. Это динамическое назначение позволяет модели обучаться на более эффективных положительных образцах во время обучения.
  • Мозаичное и MixUp : В значительной степени вдохновленный Ultralytics YOLOv4 и Ultralytics , YOLOX использует мощные стратегии увеличения данных для повышения надежности без увеличения затрат на вывод.

Контекст исследования

YOLOX послужил важным мостом между академическими исследованиями и промышленным применением, доказав, что детекторы без якорей могут сравниться по производительности с оптимизированными системами на основе якорей, такими как YOLOv5.

YOLOX Детали:

Узнайте больше о YOLOX

YOLOv5: Промышленный стандарт

YOLOv5, разработанная Ultralytics, является, пожалуй, самой широко используемой моделью обнаружения объектов в мире. В ней приоритетными являются удобство использования, стабильность и простота работы. В то время как YOLOX сосредоточилась на архитектурных нововведениях, YOLOv5 инженерному совершенству, создав модель, которую легко обучать, развертывать и масштабировать в тысячах реальных сценариев использования.

Почему разработчики выбирают YOLOv5

  • Непревзойденная простота использования: Ultralytics устраняет сложности, связанные с обучением моделей глубокого обучения. Пользователь может перейти от набора данных к обученной модели всего за несколько строк Python , что значительно снижает барьер для внедрения ИИ.
  • Комплексная экосистема: в отличие от исследовательских репозиториев, которые часто заброшены после публикации, YOLOv5 обширной экосистемой. Она включает в себя бесшовную интеграцию с инструментами MLOps, такими как Weights & Biases, Cometи ClearML, обеспечивая профессиональный рабочий процесс разработки.
  • Эффективное управление памятью: YOLOv5 с учетом эффективности. Обычно он требует меньше GPU во время обучения по сравнению со многими конкурентами, что позволяет пользователям обучать эффективные модели на потребительском оборудовании или даже бесплатных облачных ресурсах, таких как Google .
  • Универсальность, выходящая за рамки обнаружения: хотя YOLOX в первую очередь является платформой для обнаружения, YOLOv5 поддерживает сегментацию экземпляров и классификацию изображений, что делает его многофункциональным инструментом для различных проектных задач.

YOLOv5 :

Узнайте больше о YOLOv5

Анализ производительности и развертывания

При выборе модели для производства сырой mAP редко mAP единственным фактором. Ограничения по развертыванию, совместимость оборудования и обслуживание имеют не менее важное значение.

Скорость и эффективность вывода

YOLOv5 для сценариев развертывания. Его архитектура в значительной степени оптимизирована для экспорта в такие форматы, как ONNX, TensorRT, CoreMLи TFLite. Как видно из сравнительной таблицы, YOLOv5n (Nano) достигает значительно более высокой скорости вывода (1,12 мс на T4 TensorRT) по сравнению с аналогичными облегченными моделями, что делает его идеальным решением для периферийных устройств, где важна каждая миллисекунда.

YOLOX, несмотря на свою высокую производительность, иногда может сталкиваться с проблемами совместимости экспорта из-за своих специфических архитектурных компонентов (таких как развязанная головка), которые могут потребовать более тщательной настройки для оптимизации под определенные механизмы вывода.

Опыт обучения

Эффективность обучения является отличительной чертой Ultralytics . Механизм автоматической привязки YOLOv5 автоматически пересчитывает привязки, чтобы они наилучшим образом соответствовали вашему набору данных, обеспечивая преимущества индивидуальных привязок без ручного вмешательства. Кроме того, наличие высококачественных предварительно обученных весов ускоряет перенос обучения, позволяя моделям достигать высокой точности с меньшими наборами данных.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5su.pt")  # YOLOv5s with newer head

# Train on custom data in one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Оптимизированный рабочий процесс

Вышеприведенный фрагмент кода демонстрирует унифицированный Ultralytics . Этот же простой интерфейс работает для YOLOv5, YOLOv8 и передовой YOLO26, позволяя мгновенно переключаться между моделями без перезаписи кода.

Рекомендации по вариантам использования

Идеально подходит для YOLOX

  • Академические исследования: благодаря простой реализации без анкоров, эта технология является отличной базой для исследователей, изучающих стратегии присвоения меток или архитектуру детектирующих головок.
  • Конкретные сценарии с высокой точностью: для задач, где максимальное значение mAP единственным приоритетом, а задержка вывода менее критична, более крупные варианты YOLOX (такие как YOLOX-x) обеспечивают конкурентоспособную точность.

Идеально подходит для YOLOv5

  • Коммерческое внедрение: Надежные каналы экспорта и стабильность делают YOLOv5 для компаний, внедряющих тысячи устройств, от Raspberry Pi до облачных серверов.
  • Edge AI: Легкие варианты (Nano/Small) отличаются исключительной скоростью и идеально подходят для анализа видео в реальном времени на мобильных телефонах или дронах.
  • Быстрое прототипирование: благодаря подходу «от нуля до героя» разработчики могут проверять свои идеи за считанные часы, а не дни.

Будущее: Ultralytics YOLO26

Хотя YOLOv5 YOLOX по-прежнему остаются мощными инструментами, в этой области произошли значительные изменения. Для разработчиков, стремящихся к абсолютной максимальной производительности, Ultralytics представляет собой новое поколение искусственного интеллекта в области машинного зрения.

YOLO26 сочетает в себе лучшее из обоих миров:

  • Полностью NMS: как и большинство передовых исследовательских моделей, YOLO26 изначально является полностью сквозной, что исключает необходимость в NMS . Это обеспечивает более быстрое и детерминированное выведение, упрощая процессы развертывания.
  • Оптимизатор MuSGD: Вдохновленный инновациями в области обучения LLM, YOLO26 использует оптимизатор MuSGD для обеспечения большей стабильности и скорости сходимости.
  • Оптимизация для периферийных устройств: специально разработана для периферийных вычислений, обеспечивая до 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает ее превосходным выбором для мобильных приложений и приложений IoT.
  • Универсальность: поддерживает все задачи — обнаружение, сегментацию, классификацию, определение позы и OBB — в рамках единой унифицированной структуры.

Узнайте больше о YOLO26

Заключение

Выбор между YOLOX и YOLOv5 зависит от ваших целей. Если вы являетесь исследователем, желающим поэкспериментировать с архитектурами без анкоров, YOLOX является отличным кандидатом. Однако для подавляющего большинства разработчиков и предприятий, ориентированных на создание надежных приложений, работающих в режиме реального времени, YOLOv5— и его преемник YOLO26— предлагают превосходный баланс скорости, точности и простоты использования. Ultralytics гарантирует, что ваши проекты будут поддерживаться активным обслуживанием, обширной документацией и активным сообществом.

Для дальнейшего изучения вам также может быть интересно сравнить YOLOv8 YOLOv5 или узнать о возможностях YOLOv10 в режиме реального времени.


Комментарии