Перейти к содержанию

YOLO против YOLOX: подробное техническое сравнение

Модели обнаружения объектов необходимы для различных приложений компьютерного зрения, и выбор правильной модели зависит от конкретных потребностей проекта. На этой странице представлено техническое сравнение YOLO и YOLOX, двух современных моделей обнаружения объектов, с анализом их архитектуры, производительности и областей применения.

DAMO-YOLO

YOLO - это быстрая и точная модель обнаружения объектов, разработанная компанией Alibaba Group. В ней реализовано несколько новых технологий, включая магистрали NAS и эффективный RepGFPN, направленных на достижение высокой производительности в задачах обнаружения объектов.

Архитектура и ключевые особенности

Архитектура YOLO включает в себя несколько инновационных компонентов:

  • Магистраль NAS: Используется основа нейронной архитектуры поиска (NAS) для оптимизации извлечения признаков.
  • RepGFPN: Использует эффективную репараметризованную градиентную сеть пирамид признаков (GFPN) для улучшения слияния признаков.
  • ZeroHead: Для снижения вычислительных нагрузок используется облегченная головка обнаружения ZeroHead.
  • AlignedOTA: использует выровненное оптимальное назначение транспорта (OTA) для улучшения назначения меток во время обучения.

Показатели производительности

YOLO демонстрирует сильный баланс между скоростью и точностью, предлагая различные размеры моделей для удовлетворения различных вычислительных потребностей.

  • mAP: Достижение конкурентоспособной средней точности (mAP) на таких наборах данных, как COCO.
  • Скорость вывода: Разработан для быстрого вывода, что делает его подходящим для приложений реального времени.
  • Размер модели: Доступны разные размеры (маленький, маленький, средний, большой) с разным количеством параметров и FLOP-ов.

Сильные и слабые стороны

Сильные стороны:

  • Высокая точность: Получает отличные показатели mAP, что свидетельствует о высокой точности обнаружения.
  • Эффективная архитектура: Инновационные компоненты, такие как RepGFPN и ZeroHead, способствуют повышению эффективности.
  • Возможность работы в режиме реального времени: Разработана для обеспечения высокой скорости вычислений, подходящей для систем реального времени.

Слабые стороны:

  • Сложность: Расширенные архитектурные компоненты могут создавать сложности при настройке и внедрении.
  • Ограниченное сообщество: По сравнению с более устоявшимися моделями, сообщество и ресурсы могут быть меньше.

Примеры использования

YOLO хорошо подходит для приложений, требующих высокой точности и работы в режиме реального времени, таких как:

  • Передовая робототехника: Обеспечение точного обнаружения объектов для решения сложных робототехнических задач.
  • Наблюдение с высоким разрешением: Обработка видеопотоков высокой четкости для детального распознавания объектов.
  • Промышленный контроль качества: Обнаружение мелкозернистых дефектов в производственных процессах.

Узнайте больше о YOLO

YOLOX

YOLOX, разработанный компанией Megvii, представляет собой безъякорную версию YOLO, отличающуюся простотой и высокой производительностью. Благодаря своей эффективной конструкции она призвана преодолеть разрыв между научными исследованиями и промышленными приложениями.

Архитектура и ключевые особенности

YOLOX выделяется своим безъякорным подходом и обтекаемой архитектурой:

  • Обнаружение без якорей: Упрощает конвейер обнаружения, устраняя необходимость в якорных ящиках, снижая сложность и уменьшая настройку гиперпараметров.
  • Decoupled Head: разделяет головки классификации и регрессии для повышения производительности и эффективности обучения.
  • Назначение меток SimOTA: Использует стратегию назначения меток SimOTA (Simplified Optimal Transport Assignment) для более эффективного обучения.
  • Сильные дополнения: Использует передовые методы дополнения данных для повышения надежности и обобщения модели.

Показатели производительности

YOLOX предлагает оптимальный баланс между точностью и скоростью, при этом доступны модели различных размеров.

  • mAP: Достижение конкурентоспособных результатов mAP на эталонных наборах данных, таких как COCO, часто превосходящих предыдущие версии YOLO .
  • Скорость вывода: Обеспечивает высокую скорость вычислений, подходящую для развертывания в режиме реального времени.
  • Размер модели: Предлагает различные размеры моделей (Nano, Tiny, s, m, l, x), чтобы учесть различные ограничения по ресурсам.

Сильные и слабые стороны

Сильные стороны:

  • Простота: Безъякорная конструкция упрощает модель и снижает необходимость в сложной настройке.
  • Высокая производительность: Достигает превосходной точности и скорости, часто превосходя модели YOLO , основанные на якоре.
  • Простота внедрения: Хорошо документирована и относительно проста в реализации и развертывании.

Слабые стороны:

  • Вычислительные затраты: Большие модели YOLOX могут требовать больших вычислительных затрат и ресурсов.
  • Оптимизация под конкретное оборудование: Может потребоваться оптимизация для развертывания на очень ограниченных по ресурсам пограничных устройствах по сравнению с очень легкими моделями.

Примеры использования

YOLOX универсален и подходит для широкого спектра задач по обнаружению объектов, включая:

  • Видеонаблюдение в реальном времени: Эффективная обработка видеоданных для обеспечения безопасности и мониторинга.
  • Автономное вождение: Обеспечение надежного и быстрого обнаружения объектов для автономных транспортных средств.
  • Развертывание на границе: Развертывание небольших моделей YOLOX на пограничных устройствах для приложений с ограниченными ресурсами.

Узнайте больше о YOLOX

Сравнительная таблица моделей

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

YOLO и YOLOX - это мощные модели обнаружения объектов. YOLO делает акцент на точности и эффективности благодаря архитектурным инновациям, а YOLOX - на простоте и высокой производительности благодаря безъякорной конструкции. Выбор между ними зависит от конкретных требований приложения, учитывая такие факторы, как точность, скорость и условия развертывания.

Пользователи, заинтересованные в других высокопроизводительных моделях обнаружения объектов, также могут рассмотреть Ultralytics YOLOv8, YOLOv10, и YOLO11. Для сравнения с этими и другими моделями обратитесь к документуUltralytics Model Comparison Docs.

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии