Перейти к содержанию

Сравнение моделей: YOLOv5 и YOLOv6-3.0 для обнаружения объектов

Выбор оптимальной модели обнаружения объектов имеет решающее значение для успешных приложений компьютерного зрения. Ultralytics YOLOv5 и Meituan YOLOv6-3.0 — популярные варианты, известные своей эффективностью и точностью. На этой странице представлено техническое сравнение, которое поможет вам решить, какая модель лучше всего подходит для нужд вашего проекта. Мы углубимся в их архитектурные нюансы, эталонные показатели производительности, подходы к обучению и подходящие приложения, выделяя сильные стороны экосистемы Ultralytics.

Ultralytics YOLOv5: Устоявшийся отраслевой стандарт

Авторы: Glenn Jocher
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 это одноэтапная модель обнаружения объектов, известная своей скоростью, простотой использования и адаптивностью. Разработанная компанией Ultralytics, она представляет собой значительный шаг в обеспечении доступности высокопроизводительного обнаружения объектов. Построенная полностью на PyTorchYOLOv5 имеет основу CSPDarknet53 и горлышко PANet для эффективного извлечения и объединения признаков. Его архитектура является модульной, что позволяет легко масштабировать его на модели различных размеров (n, s, m, l, x) для удовлетворения различных требований к производительности.

Сильные стороны YOLOv5

  • Скорость и эффективность: YOLOv5 превосходна по скорости инференса, что делает ее идеальной для приложений реального времени и развертывания на периферийных устройствах с ограниченными ресурсами. Как видно из таблицы производительности, модель YOLOv5n предлагает самое быстрое время инференса на CPU и GPU среди небольших моделей.
  • Простота использования: Известная своей простотой, YOLOv5 предлагает оптимизированный пользовательский интерфейс с простым API, обширной документацией и многочисленными учебными пособиями.
  • Хорошо поддерживаемая экосистема: Преимущества интегрированной экосистемы Ultralytics, включая активную разработку, сильную поддержку сообщества через Discord, частые обновления и бесшовную интеграцию с Ultralytics HUB для MLOps.
  • Универсальность: Поддерживает несколько задач, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений, предоставляя более комплексное решение, чем модели, ориентированные на одну задачу.
  • Эффективность обучения: Предлагает эффективные процессы обучения, легкодоступные предварительно обученные веса и более низкие требования к памяти по сравнению со многими другими архитектурами, особенно моделями на основе трансформеров.

Слабые стороны YOLOv5

  • Точность: Несмотря на высокую точность и эффективность, новые модели, такие как YOLOv6-3.0 или Ultralytics YOLOv8, могут предлагать несколько более высокий mAP в определенных бенчмарках, особенно более крупные варианты моделей.
  • Обнаружение на основе Anchor: Использует anchor boxes, что может потребовать настройки для оптимальной производительности на различных наборах данных по сравнению с современными детекторами без anchor.

Узнайте больше о YOLOv5

Meituan YOLOv6-3.0: Промышленный претендент

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, разработанный Meituan, представляет собой фреймворк для обнаружения объектов, разработанный в первую очередь для промышленных приложений. Выпущенный в начале 2023 года, он был направлен на обеспечение баланса между скоростью и точностью, подходящего для реальных сценариев развертывания. YOLOv6 представил архитектурные модификации, такие как эффективный backbone и neck. Версия 3.0 дополнительно усовершенствовала эти элементы и включила такие методы, как самодистилляция во время обучения, для повышения производительности. Он также предлагает специальные модели, оптимизированные для мобильного развертывания (YOLOv6Lite).

Преимущества YOLOv6-3.0

  • Хороший компромисс между скоростью и точностью: Предлагает конкурентную производительность, особенно для задач промышленного обнаружения объектов, где целью является максимизация mAP на GPU.
  • Поддержка квантования: Предоставляет инструменты и учебные пособия по квантованию моделей, что полезно для развертывания на оборудовании с ограниченными ресурсами.
  • Мобильная оптимизация: Включает варианты YOLOv6Lite, специально разработанные для мобильного вывода или вывода на базе CPU.

Слабые стороны YOLOv6-3.0

  • Ограниченная универсальность задач: В основном ориентирован на обнаружение объектов, не хватает встроенной поддержки сегментации, классификации или оценки позы, которые есть в моделях Ultralytics, таких как YOLOv5 и YOLOv8.
  • Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, экосистема не так всеобъемлюща и активно поддерживается, как платформа Ultralytics, что потенциально может привести к замедлению обновлений и уменьшению поддержки сообщества.
  • Более высокое использование ресурсов: Более крупные модели YOLOv6 могут иметь значительно больше параметров и FLOPs по сравнению с эквивалентами YOLOv5 для аналогичного mAP, что потенциально требует больше вычислительных ресурсов.

Узнайте больше о YOLOv6

Прямое сравнение производительности

В таблице ниже представлено прямое сравнение метрик производительности моделей YOLOv5 и YOLOv6-3.0 на наборе данных COCO. Ultralytics YOLOv5 демонстрирует превосходную скорость как на CPU, так и на GPU для небольших моделей, что делает его отличным выбором для периферийных приложений, работающих в реальном времени. В то время как более крупные модели YOLOv6-3.0 могут достигать более высокого пикового mAP, YOLOv5 обеспечивает более сбалансированную и эффективную производительность в целом, особенно с учетом меньшего количества параметров и FLOPs.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Методология обучения

Обе модели используют стандартные методы глубокого обучения для обучения на больших наборах данных, таких как COCO. Однако Ultralytics YOLOv5 значительно выигрывает от экосистемы Ultralytics, предлагая оптимизированные рабочие процессы обучения, обширные руководства, оптимизацию AutoAnchor и интеграцию с такими инструментами, как Weights & Biases и ClearML для отслеживания экспериментов. Этот интегрированный подход упрощает цикл разработки и ускоряет время развертывания. Обучение YOLOv6-3.0 выполняется в соответствии с процедурами, описанными в его официальном репозитории.

Идеальные варианты использования

  • Ultralytics YOLOv5: Настоятельно рекомендуется для приложений, требующих производительности в реальном времени и простоты развертывания, особенно на CPU или периферийных устройствах. Ее универсальность, обширная поддержка и эффективное использование ресурсов делают ее идеальной для быстрого прототипирования, мобильных приложений, видеонаблюдения (компьютерное зрение для предотвращения краж) и проектов, использующих преимущества зрелой, хорошо документированной экосистемы.
  • Meituan YOLOv6-3.0: Сильный конкурент, когда максимизация точности на GPU является основной целью, но при этом требуется быстрая инференция. Подходит для промышленных приложений, где небольшие улучшения mAP по сравнению с YOLOv5 оправдывают потенциально возросшую сложность или меньшую поддержку экосистемы.

Заключение

Ultralytics YOLOv5 остается отличным выбором, особенно ценится за исключительную скорость, простоту использования и надежную экосистему. Он обеспечивает отличный баланс производительности и эффективности, подкрепленный обширной документацией и поддержкой сообщества, что делает его очень доступным для разработчиков и исследователей.

YOLOv6-3.0 предлагает конкурентоспособную производительность, особенно с точки зрения пикового mAP для более крупных моделей на GPU. Это служит жизнеспособной альтернативой для пользователей, которые приоритезируют максимально возможную точность в рамках YOLO для специализированных промышленных задач.

Для тех, кто ищет новейшие достижения, рассмотрите возможность изучения новых моделей Ultralytics, таких как YOLOv8, YOLOv9, YOLOv10 и YOLO11, которые предлагают дальнейшие улучшения в производительности, универсальности и эффективности. Специализированные модели, такие как RT-DETR, также предоставляют уникальные преимущества для конкретных случаев использования.

Ознакомьтесь с полным спектром опций в документации по моделям Ultralytics.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии