Техническое сравнение: YOLOX против YOLOv6-3.0 для обнаружения объектов
Выбор правильной модели обнаружения объектов имеет решающее значение для проектов по компьютерному зрению. На этой странице представлено техническое сравнение двух популярных и эффективных моделей: YOLOX и YOLOv6-3.0. Мы рассмотрим их архитектурные различия, эталоны производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение.
Прежде чем перейти к конкретным деталям, давайте представим обзор характеристик обеих моделей в сравнении с другими:
YOLOX: Превосходство без якоря
YOLOX, представленный компанией Megvii(Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun - 2021-07-18), выделяется своей безъякорной конструкцией, упрощающей сложности, связанные с традиционными моделями YOLO . Она призвана преодолеть разрыв между научными исследованиями и промышленными приложениями благодаря эффективным и точным возможностям обнаружения объектов.
Архитектура и ключевые особенности
YOLOX использует оптимизированный подход, исключая якорные блоки, что упрощает процесс обучения и уменьшает количество гиперпараметров. Ключевые архитектурные инновации включают:
- Безъякорное обнаружение: Устраняет необходимость в предопределенных якорях, снижая сложность конструкции и улучшая обобщенность, что позволяет адаптироваться к различным размерам объектов и соотношению сторон.
- Decoupled Head: разделяет задачи классификации и локализации на отдельные ветви, что приводит к улучшению производительности, особенно в плане точности.
- Назначение меток SimOTA: Использует усовершенствованную стратегию присвоения меток SimOTA, которая динамически назначает цели на основе прогнозируемых результатов, повышая эффективность и точность обучения.
- Обучение со смешанной точностью: Использует смешанную точность для ускорения обучения и вывода, оптимизируя эффективность вычислений.
Показатели производительности
Модели YOLOX достигают наивысшей точности среди детекторов объектов в реальном времени, сохраняя при этом конкурентоспособную скорость вывода. Подробные показатели приведены в сравнительной таблице ниже.
Примеры использования
- Приложения, требующие высокой точности: Идеально подходит для сценариев, где точность имеет первостепенное значение, таких как анализ медицинских изображений или спутниковых снимков, где пропуск критических объектов может привести к серьезным последствиям.
- Исследования и разработки: Благодаря своей понятной и упрощенной структуре YOLOX хорошо подходит для исследовательских целей и дальнейшего развития методологии обнаружения объектов.
- Универсальные задачи обнаружения объектов: Применяется в широком спектре задач по обнаружению объектов, от академических исследований до промышленного внедрения, благодаря надежной конструкции и высокой точности.
Сильные и слабые стороны
Сильные стороны:
- Высокая точность: Достигает превосходных показателей mAP, что делает его подходящим для приложений, требующих точного обнаружения объектов.
- Безъякорная конструкция: Упрощает архитектуру, уменьшает гиперпараметры и облегчает реализацию.
- Универсальность: Возможность адаптации к широкому спектру задач по обнаружению объектов.
Слабые стороны:
- Скорость вывода: Может быть немного медленнее, чем высокооптимизированные модели, такие как YOLOv6-3.0, особенно на устройствах с граничными устройствами.
- Размер модели: Некоторые крупные варианты могут иметь значительные размеры моделей, что может быть проблемой для развертывания в условиях ограниченных ресурсов.
YOLOv6-3.0: Оптимизировано для скорости и эффективности
YOLOv6-3.0, разработанный компанией Meituan(Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, и Xiangxiang Chu - 2023-01-13), предназначен для высокоскоростных выводов и эффективности, особенно для промышленных приложений и пограничного развертывания. Версия 3.0 представляет собой значительное обновление, направленное на повышение скорости и точности.
Архитектура и ключевые особенности
В YOLOv6-3.0 приоритет отдается скорости вывода за счет архитектурных оптимизаций без существенного снижения точности. Ключевые особенности включают:
- Эффективная основа репараметризации: Использует репараметризованную основу для ускорения вычислений путем объединения слоев свертки и пакетной нормализации.
- Гибридный блок: Используется гибридная конструкция сетевого блока, которая обеспечивает баланс между точностью и эффективностью, оптимизируя производительность на различных аппаратных платформах.
- Нейронная сеть с аппаратным обеспечением: Разработан с учетом аппаратной эффективности, что делает его особенно подходящим для развертывания на устройствах с ограниченными ресурсами, таких как Raspberry Pi и NVIDIA Jetson.
- Оптимизированная стратегия обучения: Включает в себя усовершенствованные методы обучения для улучшения сходимости и общей производительности.
Показатели производительности
YOLOv6-3.0 превосходит всех по скорости вывода, достигая потрясающих FPS (кадров в секунду) при сохранении конкурентоспособных показателей mAP. Подробные показатели производительности приведены в таблице ниже.
Примеры использования
- Обнаружение объектов в реальном времени: Идеально подходит для приложений, где важна низкая задержка и быстрая обработка данных, таких как системы охранной сигнализации, интеллектуальная розничная торговля и автономные транспортные средства.
- Развертывание на пограничных устройствах: Оптимизирован для развертывания на пограничных устройствах с ограниченными вычислительными ресурсами благодаря эффективной конструкции и меньшим размерам модели.
- Промышленные приложения: Предназначен для практических, реальных промышленных приложений, требующих быстрого и эффективного обнаружения объектов в производстве, видеонаблюдении и автоматизации.
Сильные и слабые стороны
Сильные стороны:
- Высокая скорость вывода: отличается высокой скоростью, что делает его идеальным для задач обнаружения объектов в реальном времени.
- Эффективный дизайн: Меньшие размеры моделей и оптимизированная архитектура идеально подходят для устройств с ограниченными ресурсами.
- Промышленная направленность: Специально разработан для практического применения в отраслях, где требуется быстрое и эффективное обнаружение объектов.
Слабые стороны:
- Компромисс с точностью: Может демонстрировать несколько меньшую точность по сравнению с моделями типа YOLOX, особенно на сложных наборах данных, где точность приоритетнее скорости.
- Гибкость: Возможно, менее приспособлен для решения узкоспециализированных исследовательских задач по сравнению с более гибкими архитектурами, предназначенными для более широких исследовательских приложений.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Заключение
И YOLOX, и YOLOv6-3.0 - мощные одноступенчатые детекторы объектов, каждый из которых отвечает своим приоритетам. YOLOX отличается точностью и простотой архитектуры, что делает его отличным выбором для исследований и приложений, требующих высокой точности. YOLOv6-3.0 ставит во главу угла скорость и эффективность, что делает его исключительно подходящим для промышленных приложений реального времени и пограничных развертываний.
Для пользователей, ищущих другие варианты, Ultralytics предлагает ряд передовых моделей. Рассмотрите возможность изучения Ultralytics YOLOv8 для обеспечения баланса производительности и гибкости, YOLOv10 как новейшую разработку в области обнаружения в реальном времени или даже YOLO11 с самыми современными функциями. Альтернативный вариант для приложений, работающих в режиме реального времени, RT-DETR представляет собой привлекательную архитектуру для изучения.