Перейти к содержимому

Meituan YOLOv6

Обзор

Meituan YOLOv6 - это передовой детектор объектов, который предлагает замечательный баланс между скоростью и точностью, что делает его популярным выбором для приложений реального времени. В этой модели реализовано несколько заметных улучшений в архитектуре и схеме обучения, включая внедрение модуля двунаправленной конкатенации (BiC), стратегию обучения с помощью якорей (AAT), а также улучшенную конструкцию позвоночника и шеи, обеспечивающую высочайшую точность на наборе данных COCO.

Meituan YOLOv6 Пример модели изображения Обзор YOLOv6. Схема архитектуры модели, показывающая переработанные компоненты сети и стратегии обучения, которые привели к значительному улучшению производительности. (a) Шея YOLOv6 (показаны N и S). Заметь, что для M/L, RepBlocks заменен на CSPStackRep. (b) Структура модуля BiC. (c) Блок SimCSPSPPF. (источник).

Основные характеристики

  • Модуль двунаправленной конкатенации (BiC): В YOLOv6 появился модуль BiC в горловине детектора, улучшающий сигналы локализации и обеспечивающий прирост производительности при незначительном снижении скорости.
  • Стратегия обучения с помощью якорей (AAT): Эта модель предлагает AAT, чтобы воспользоваться преимуществами парадигм с якорями и без якорей без ущерба для эффективности выводов.
  • Улучшенная конструкция позвоночника и шеи: Углубив YOLOv6, чтобы включить еще одну стадию в позвоночнике и шее, эта модель достигла передовой производительности на наборе данных COCO при высоком разрешении входных данных.
  • Стратегия самодистилляции: Для повышения производительности небольших моделей в YOLOv6 реализована новая стратегия самодистилляции, которая усиливает вспомогательную ветвь регрессии во время обучения и удаляет ее при выводе, чтобы избежать заметного снижения скорости.

Показатели производительности

YOLOv6 предоставляет различные предварительно обученные модели с разными масштабами:

  • YOLOv6-N: 37,5% AP на COCO val2017 при 1187 FPS с графическим процессором NVIDIA Tesla T4.
  • YOLOv6-S: 45,0% AP при 484 FPS.
  • YOLOv6-M: 50,0% AP при 226 FPS.
  • YOLOv6-L: 52,8% AP при 116 FPS.
  • YOLOv6-L6: современная точность в режиме реального времени.

YOLOv6 также предоставляет квантованные модели для различных точностей и модели, оптимизированные для мобильных платформ.

Примеры использования

В этом примере приведены простые примеры обучения и вывода YOLOv6. Полную документацию по этим и другим режимам можно найти на страницах Predict, Train, Val и Export docs.

Пример

PyTorch предварительно обученный *.pt модели, а также конфигурации *.yaml файлы могут быть переданы в YOLO() класс, чтобы создать экземпляр модели в python:

from ultralytics import YOLO

# Build a YOLOv6n model from scratch
model = YOLO('yolov6n.yaml')

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data='coco8.yaml', epochs=100, imgsz=640)

# Run inference with the YOLOv6n model on the 'bus.jpg' image
results = model('path/to/bus.jpg')

CLI Для непосредственного запуска моделей доступны команды:

# Build a YOLOv6n model from scratch and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolov6n.yaml data=coco8.yaml epochs=100 imgsz=640

# Build a YOLOv6n model from scratch and run inference on the 'bus.jpg' image
yolo predict model=yolov6n.yaml source=path/to/bus.jpg

Поддерживаемые задачи и режимы

Серия YOLOv6 предлагает ряд моделей, каждая из которых оптимизирована для высокопроизводительного обнаружения объектов. Эти модели отвечают различным вычислительным потребностям и требованиям к точности, что делает их универсальными для широкого спектра приложений.

Тип модели Предварительно обученные веса Поддерживаемые задачи Заключение Валидация Тренировка Экспорт
YOLOv6-N yolov6-n.pt Обнаружение объектов
YOLOv6-S yolov6-s.pt Обнаружение объектов
YOLOv6-M yolov6-m.pt Обнаружение объектов
YOLOv6-L yolov6-l.pt Обнаружение объектов
YOLOv6-L6 yolov6-l6.pt Обнаружение объектов

В этой таблице представлен подробный обзор вариантов моделей YOLOv6, выделены их возможности в задачах обнаружения объектов и совместимость с различными рабочими режимами, такими как Inference, Validation, Training и Export. Такая всесторонняя поддержка гарантирует, что пользователи смогут полностью использовать возможности моделей YOLOv6 в широком спектре сценариев обнаружения объектов.

Цитаты и благодарности

Мы хотели бы поблагодарить авторов за их значительный вклад в область обнаружения объектов в реальном времени:

@misc{li2023yolov6,
      title={YOLOv6 v3.0: A Full-Scale Reloading},
      author={Chuyi Li and Lulu Li and Yifei Geng and Hongliang Jiang and Meng Cheng and Bo Zhang and Zaidan Ke and Xiaoming Xu and Xiangxiang Chu},
      year={2023},
      eprint={2301.05586},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Оригинальную статью YOLOv6 можно найти на arXiv. Авторы сделали свою работу общедоступной, а кодовую базу можно найти на GitHub. Мы ценим их усилия, направленные на развитие области и обеспечение доступности их работы для широкой общественности.



Создано 2023-11-12, Обновлено 2024-01-07
Авторы: glenn-jocher (5)

Комментарии