Перейти к содержанию

Техническое сравнение: YOLOX против YOLOv6-3.0 для обнаружения объектов

Выбор правильной модели обнаружения объектов имеет решающее значение для проектов по компьютерному зрению. На этой странице представлено техническое сравнение двух популярных и эффективных моделей: YOLOX и YOLOv6-3.0. Мы рассмотрим их архитектурные различия, эталоны производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение.

Прежде чем перейти к конкретным деталям, давайте представим обзор характеристик обеих моделей в сравнении с другими:

YOLOX: Превосходство без якоря

YOLOX, представленный компанией Megvii(Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun - 2021-07-18), выделяется своей безъякорной конструкцией, упрощающей сложности, связанные с традиционными моделями YOLO . Она призвана преодолеть разрыв между научными исследованиями и промышленными приложениями благодаря эффективным и точным возможностям обнаружения объектов.

Архитектура и ключевые особенности

YOLOX использует оптимизированный подход, исключая якорные блоки, что упрощает процесс обучения и уменьшает количество гиперпараметров. Ключевые архитектурные инновации включают:

  • Безъякорное обнаружение: Устраняет необходимость в предопределенных якорях, снижая сложность конструкции и улучшая обобщенность, что позволяет адаптироваться к различным размерам объектов и соотношению сторон.
  • Decoupled Head: разделяет задачи классификации и локализации на отдельные ветви, что приводит к улучшению производительности, особенно в плане точности.
  • Назначение меток SimOTA: Использует усовершенствованную стратегию присвоения меток SimOTA, которая динамически назначает цели на основе прогнозируемых результатов, повышая эффективность и точность обучения.
  • Обучение со смешанной точностью: Использует смешанную точность для ускорения обучения и вывода, оптимизируя эффективность вычислений.

Показатели производительности

Модели YOLOX достигают наивысшей точности среди детекторов объектов в реальном времени, сохраняя при этом конкурентоспособную скорость вывода. Подробные показатели приведены в сравнительной таблице ниже.

Примеры использования

  • Приложения, требующие высокой точности: Идеально подходит для сценариев, где точность имеет первостепенное значение, таких как анализ медицинских изображений или спутниковых снимков, где пропуск критических объектов может привести к серьезным последствиям.
  • Исследования и разработки: Благодаря своей понятной и упрощенной структуре YOLOX хорошо подходит для исследовательских целей и дальнейшего развития методологии обнаружения объектов.
  • Универсальные задачи обнаружения объектов: Применяется в широком спектре задач по обнаружению объектов, от академических исследований до промышленного внедрения, благодаря надежной конструкции и высокой точности.

Сильные и слабые стороны

Сильные стороны:

  • Высокая точность: Достигает превосходных показателей mAP, что делает его подходящим для приложений, требующих точного обнаружения объектов.
  • Безъякорная конструкция: Упрощает архитектуру, уменьшает гиперпараметры и облегчает реализацию.
  • Универсальность: Возможность адаптации к широкому спектру задач по обнаружению объектов.

Слабые стороны:

  • Скорость вывода: Может быть немного медленнее, чем высокооптимизированные модели, такие как YOLOv6-3.0, особенно на устройствах с граничными устройствами.
  • Размер модели: Некоторые крупные варианты могут иметь значительные размеры моделей, что может быть проблемой для развертывания в условиях ограниченных ресурсов.

Узнайте больше о YOLOX

YOLOv6-3.0: Оптимизировано для скорости и эффективности

YOLOv6-3.0, разработанный компанией Meituan(Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, и Xiangxiang Chu - 2023-01-13), предназначен для высокоскоростных выводов и эффективности, особенно для промышленных приложений и пограничного развертывания. Версия 3.0 представляет собой значительное обновление, направленное на повышение скорости и точности.

Архитектура и ключевые особенности

В YOLOv6-3.0 приоритет отдается скорости вывода за счет архитектурных оптимизаций без существенного снижения точности. Ключевые особенности включают:

  • Эффективная основа репараметризации: Использует репараметризованную основу для ускорения вычислений путем объединения слоев свертки и пакетной нормализации.
  • Гибридный блок: Используется гибридная конструкция сетевого блока, которая обеспечивает баланс между точностью и эффективностью, оптимизируя производительность на различных аппаратных платформах.
  • Нейронная сеть с аппаратным обеспечением: Разработан с учетом аппаратной эффективности, что делает его особенно подходящим для развертывания на устройствах с ограниченными ресурсами, таких как Raspberry Pi и NVIDIA Jetson.
  • Оптимизированная стратегия обучения: Включает в себя усовершенствованные методы обучения для улучшения сходимости и общей производительности.

Показатели производительности

YOLOv6-3.0 превосходит всех по скорости вывода, достигая потрясающих FPS (кадров в секунду) при сохранении конкурентоспособных показателей mAP. Подробные показатели производительности приведены в таблице ниже.

Примеры использования

  • Обнаружение объектов в реальном времени: Идеально подходит для приложений, где важна низкая задержка и быстрая обработка данных, таких как системы охранной сигнализации, интеллектуальная розничная торговля и автономные транспортные средства.
  • Развертывание на пограничных устройствах: Оптимизирован для развертывания на пограничных устройствах с ограниченными вычислительными ресурсами благодаря эффективной конструкции и меньшим размерам модели.
  • Промышленные приложения: Предназначен для практических, реальных промышленных приложений, требующих быстрого и эффективного обнаружения объектов в производстве, видеонаблюдении и автоматизации.

Сильные и слабые стороны

Сильные стороны:

  • Высокая скорость вывода: отличается высокой скоростью, что делает его идеальным для задач обнаружения объектов в реальном времени.
  • Эффективный дизайн: Меньшие размеры моделей и оптимизированная архитектура идеально подходят для устройств с ограниченными ресурсами.
  • Промышленная направленность: Специально разработан для практического применения в отраслях, где требуется быстрое и эффективное обнаружение объектов.

Слабые стороны:

  • Компромисс с точностью: Может демонстрировать несколько меньшую точность по сравнению с моделями типа YOLOX, особенно на сложных наборах данных, где точность приоритетнее скорости.
  • Гибкость: Возможно, менее приспособлен для решения узкоспециализированных исследовательских задач по сравнению с более гибкими архитектурами, предназначенными для более широких исследовательских приложений.

Узнайте больше о YOLOv6-3.0

Сравнительная таблица моделей

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Заключение

И YOLOX, и YOLOv6-3.0 - мощные одноступенчатые детекторы объектов, каждый из которых отвечает своим приоритетам. YOLOX отличается точностью и простотой архитектуры, что делает его отличным выбором для исследований и приложений, требующих высокой точности. YOLOv6-3.0 ставит во главу угла скорость и эффективность, что делает его исключительно подходящим для промышленных приложений реального времени и пограничных развертываний.

Для пользователей, ищущих другие варианты, Ultralytics предлагает ряд передовых моделей. Рассмотрите возможность изучения Ultralytics YOLOv8 для обеспечения баланса производительности и гибкости, YOLOv10 как новейшую разработку в области обнаружения в реальном времени или даже YOLO11 с самыми современными функциями. Альтернативный вариант для приложений, работающих в режиме реального времени, RT-DETR представляет собой привлекательную архитектуру для изучения.

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии