Перейти к содержанию

YOLOv8 vs YOLOv6-3.0: техническое сравнение

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое влияет на производительность, эффективность и масштабируемость любого проекта компьютерного зрения. На этой странице представлено подробное техническое сравнение двух мощных моделей: Ultralytics YOLOv8 и YOLOv6-3.0. Мы рассмотрим их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам определить, какая модель лучше всего соответствует вашим потребностям.

Ultralytics YOLOv8

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 — это современная модель от Ultralytics, основанная на успехе предыдущих версий YOLO. Являясь флагманской моделью, YOLOv8 разработана для обеспечения превосходной производительности, универсальности и эффективности. Она поддерживает широкий спектр задач визуального ИИ, включая обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и отслеживание, что делает ее комплексным решением для разработчиков.

Архитектура и ключевые особенности

YOLOv8 представляет несколько ключевых архитектурных улучшений по сравнению со своими предшественниками. В ней используется детектор без anchor boxes с decoupled head, который разделяет задачи классификации и обнаружения для повышения точности. Сеть backbone была улучшена с помощью модуля C2f, который заменяет модуль C3, используемый в более ранних версиях, обеспечивая более эффективное извлечение признаков. Эти конструктивные решения приводят к созданию модели, которая не только очень точна, но и вычислительно эффективна, что делает ее подходящей для широкого спектра аппаратных платформ.

Сильные стороны

  • Превосходный баланс производительности: YOLOv8 предлагает исключительный компромисс между скоростью и точностью, часто достигая более высоких показателей mAP с меньшим количеством параметров и более низкой вычислительной стоимостью по сравнению с такими конкурентами, как YOLOv6-3.0.
  • Беспрецедентная универсальность: Это многозадачная модель, способная выполнять обнаружение, сегментацию, классификацию, оценку позы и отслеживание в рамках единого унифицированного фреймворка. Это устраняет необходимость использования нескольких моделей для разных задач.
  • Простота использования: YOLOv8 создана для удобства использования и отличается простым Python API и CLI, обширной документацией и надежным набором интеграций.
  • Хорошо поддерживаемая экосистема: Как модель Ultralytics, YOLOv8 выигрывает от активной разработки, частых обновлений и сильной поддержки сообщества через GitHub и Discord. Он легко интегрируется с Ultralytics HUB для обучения и развертывания без кода.
  • Эффективность обучения: Модель предлагает эффективные процессы обучения с легкодоступными предварительно обученными весами, часто требуя меньше памяти, чем другие архитектуры.

Слабые стороны

  • Обнаружение мелких объектов: Как и большинство одноэтапных детекторов, YOLOv8 может столкнуться с проблемами при работе с очень мелкими или плотно упакованными объектами по сравнению со специализированными двухэтапными детекторами, хотя в большинстве сценариев он по-прежнему показывает хорошие результаты.

Идеальные варианты использования

Сочетание точности, скорости и многозадачности YOLOv8 делает ее идеальной для широкого спектра применений:

Узнайте больше о YOLOv8

YOLOv6-3.0

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0 — это фреймворк обнаружения объектов, разработанный компанией Meituan с особым акцентом на эффективность для промышленных приложений. Он представил несколько архитектурных инноваций, направленных на создание быстрого и точного детектора, подходящего для реального развертывания.

Архитектура и ключевые особенности

YOLOv6-3.0 имеет аппаратный дизайн нейронной сети, включающий репараметризуемый backbone (Rep-Block), который можно преобразовать в более эффективную структуру для инференса. Он также использует стратегию самодистилляции во время обучения для повышения производительности без увеличения стоимости инференса. Фреймворк разработан для обнаружения объектов и предлагает специальные модели, такие как YOLOv6Lite, оптимизированные для мобильного инференса и инференса на базе CPU.

Сильные стороны

  • Высокая скорость инференса: Модель высоко оптимизирована для скорости, особенно на GPU, что делает ее сильным кандидатом для приложений со строгими требованиями к задержке.
  • Поддержка квантования: YOLOv6 предоставляет специализированные инструменты и учебные пособия для квантования моделей, что полезно для развертывания на оборудовании с ограниченными ресурсами.
  • Мобильная оптимизация: Включение вариантов YOLOv6Lite делает его пригодным для развертывания на мобильных устройствах.

Слабые стороны

  • Ограниченная универсальность задач: YOLOv6 в основном является детектором объектов. Ему не хватает встроенной поддержки сегментации, классификации и оценки позы, которая является стандартной в Ultralytics YOLOv8, что требует от пользователей поиска и интеграции отдельных моделей для этих задач.
  • Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, экосистема YOLOv6 не так всеобъемлюща и активно поддерживается, как платформа Ultralytics. Это может привести к замедлению обновлений, меньшему количеству интеграций и уменьшению поддержки сообщества.
  • Более низкая эффективность: Как видно из таблицы производительности, более крупные модели YOLOv6 часто имеют значительно больше параметров и операций с плавающей запятой (FLOPs), чем модели YOLOv8 при сопоставимой точности, что приводит к более высоким вычислительным требованиям.

Идеальные варианты использования

YOLOv6-3.0 хорошо подходит для:

  • Промышленные приложения, где скорость обнаружения объектов является первостепенной задачей.
  • Сценарии развертывания, которые активно используют квантование или требуют мобильно-оптимизированных моделей.
  • Проекты, которые сосредоточены исключительно на обнаружении объектов.

Узнайте больше о YOLOv6

Сравнение производительности: YOLOv8 против YOLOv6-3.0

В следующей таблице сравнивается производительность моделей YOLOv8 и YOLOv6-3.0 на наборе данных COCO val2017. Анализ ясно показывает преимущества Ultralytics YOLOv8 с точки зрения эффективности и сбалансированной производительности.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Из данных вытекает несколько ключевых выводов:

  • Эффективность: Ultralytics YOLOv8 стабильно обеспечивает сопоставимую или лучшую точность со значительно меньшим количеством параметров и FLOPs. Например, YOLOv8s достигает 44.9 mAP всего с 11.2M параметрами, в то время как YOLOv6-3.0s требует 18.5M параметров для достижения аналогичного 45.0 mAP. Эта превосходная эффективность делает YOLOv8 более легким и экономически выгодным выбором.
  • Точность: Несмотря на то, что обе модели конкурентоспособны, YOLOv8x достигает самого высокого mAP в 53,9, что делает ее самой точной моделью в этом сравнении.
  • Производительность CPU: YOLOv8 предоставляет четкие бенчмарки для инференса на CPU, что является критическим фактором для многих реальных приложений, где GPU недоступны. Отсутствие официальных бенчмарков CPU для YOLOv6-3.0 затрудняет оценку для таких сценариев.

Заключение и рекомендации

Несмотря на то, что YOLOv8 и YOLOv6-3.0 являются способными моделями обнаружения объектов, Ultralytics YOLOv8 выделяется как превосходный выбор для большинства пользователей и приложений.

Ключевые преимущества YOLOv8 заключаются в исключительном балансе точности и эффективности, непревзойденной универсальности в различных задачах компьютерного зрения и удобной, хорошо поддерживаемой экосистеме. Для разработчиков и исследователей, которым нужна единая, надежная и высокопроизводительная платформа, способная справиться со всем, от обнаружения до оценки позы, YOLOv8 — очевидный выбор. Меньшие вычислительные затраты для заданного уровня точности приводят к снижению затрат на развертывание и более широкой совместимости с оборудованием.

Для тех, кто ищет самые последние технологии обнаружения объектов, мы также рекомендуем изучить новейшую Ultralytics YOLO11, которая, опираясь на прочный фундамент YOLOv8, обеспечивает еще большую производительность и возможности.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии