YOLOv8 vs YOLOv6-3.0: техническое сравнение
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое влияет на производительность, эффективность и масштабируемость любого проекта компьютерного зрения. На этой странице представлено подробное техническое сравнение двух мощных моделей: Ultralytics YOLOv8 и YOLOv6-3.0. Мы рассмотрим их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам определить, какая модель лучше всего соответствует вашим потребностям.
Ultralytics YOLOv8
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 — это современная модель от Ultralytics, основанная на успехе предыдущих версий YOLO. Являясь флагманской моделью, YOLOv8 разработана для обеспечения превосходной производительности, универсальности и эффективности. Она поддерживает широкий спектр задач визуального ИИ, включая обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и отслеживание, что делает ее комплексным решением для разработчиков.
Архитектура и ключевые особенности
YOLOv8 представляет несколько ключевых архитектурных улучшений по сравнению со своими предшественниками. В ней используется детектор без anchor boxes с decoupled head, который разделяет задачи классификации и обнаружения для повышения точности. Сеть backbone была улучшена с помощью модуля C2f, который заменяет модуль C3, используемый в более ранних версиях, обеспечивая более эффективное извлечение признаков. Эти конструктивные решения приводят к созданию модели, которая не только очень точна, но и вычислительно эффективна, что делает ее подходящей для широкого спектра аппаратных платформ.
Сильные стороны
- Превосходный баланс производительности: YOLOv8 предлагает исключительный компромисс между скоростью и точностью, часто достигая более высоких показателей mAP с меньшим количеством параметров и более низкой вычислительной стоимостью по сравнению с такими конкурентами, как YOLOv6-3.0.
- Беспрецедентная универсальность: Это многозадачная модель, способная выполнять обнаружение, сегментацию, классификацию, оценку позы и отслеживание в рамках единого унифицированного фреймворка. Это устраняет необходимость использования нескольких моделей для разных задач.
- Простота использования: YOLOv8 создана для удобства использования и отличается простым Python API и CLI, обширной документацией и надежным набором интеграций.
- Хорошо поддерживаемая экосистема: Как модель Ultralytics, YOLOv8 выигрывает от активной разработки, частых обновлений и сильной поддержки сообщества через GitHub и Discord. Он легко интегрируется с Ultralytics HUB для обучения и развертывания без кода.
- Эффективность обучения: Модель предлагает эффективные процессы обучения с легкодоступными предварительно обученными весами, часто требуя меньше памяти, чем другие архитектуры.
Слабые стороны
- Обнаружение мелких объектов: Как и большинство одноэтапных детекторов, YOLOv8 может столкнуться с проблемами при работе с очень мелкими или плотно упакованными объектами по сравнению со специализированными двухэтапными детекторами, хотя в большинстве сценариев он по-прежнему показывает хорошие результаты.
Идеальные варианты использования
Сочетание точности, скорости и многозадачности YOLOv8 делает ее идеальной для широкого спектра применений:
- Промышленная автоматизация: Для контроля качества, обнаружения дефектов и мониторинга процессов в производстве.
- Безопасность и видеонаблюдение: Поддержка передовых систем безопасности для мониторинга и обнаружения угроз в реальном времени.
- Аналитика розничной торговли: Улучшение управления запасами и анализ поведения клиентов.
- Автономные системы: Обеспечение восприятия в робототехнике и автомобилях с автоматическим управлением.
- Здравоохранение: Помощь в анализе медицинских изображений для таких задач, как обнаружение опухолей.
YOLOv6-3.0
Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/
YOLOv6-3.0 — это фреймворк обнаружения объектов, разработанный компанией Meituan с особым акцентом на эффективность для промышленных приложений. Он представил несколько архитектурных инноваций, направленных на создание быстрого и точного детектора, подходящего для реального развертывания.
Архитектура и ключевые особенности
YOLOv6-3.0 имеет аппаратный дизайн нейронной сети, включающий репараметризуемый backbone (Rep-Block), который можно преобразовать в более эффективную структуру для инференса. Он также использует стратегию самодистилляции во время обучения для повышения производительности без увеличения стоимости инференса. Фреймворк разработан для обнаружения объектов и предлагает специальные модели, такие как YOLOv6Lite, оптимизированные для мобильного инференса и инференса на базе CPU.
Сильные стороны
- Высокая скорость инференса: Модель высоко оптимизирована для скорости, особенно на GPU, что делает ее сильным кандидатом для приложений со строгими требованиями к задержке.
- Поддержка квантования: YOLOv6 предоставляет специализированные инструменты и учебные пособия для квантования моделей, что полезно для развертывания на оборудовании с ограниченными ресурсами.
- Мобильная оптимизация: Включение вариантов YOLOv6Lite делает его пригодным для развертывания на мобильных устройствах.
Слабые стороны
- Ограниченная универсальность задач: YOLOv6 в основном является детектором объектов. Ему не хватает встроенной поддержки сегментации, классификации и оценки позы, которая является стандартной в Ultralytics YOLOv8, что требует от пользователей поиска и интеграции отдельных моделей для этих задач.
- Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, экосистема YOLOv6 не так всеобъемлюща и активно поддерживается, как платформа Ultralytics. Это может привести к замедлению обновлений, меньшему количеству интеграций и уменьшению поддержки сообщества.
- Более низкая эффективность: Как видно из таблицы производительности, более крупные модели YOLOv6 часто имеют значительно больше параметров и операций с плавающей запятой (FLOPs), чем модели YOLOv8 при сопоставимой точности, что приводит к более высоким вычислительным требованиям.
Идеальные варианты использования
YOLOv6-3.0 хорошо подходит для:
- Промышленные приложения, где скорость обнаружения объектов является первостепенной задачей.
- Сценарии развертывания, которые активно используют квантование или требуют мобильно-оптимизированных моделей.
- Проекты, которые сосредоточены исключительно на обнаружении объектов.
Сравнение производительности: YOLOv8 против YOLOv6-3.0
В следующей таблице сравнивается производительность моделей YOLOv8 и YOLOv6-3.0 на наборе данных COCO val2017. Анализ ясно показывает преимущества Ultralytics YOLOv8 с точки зрения эффективности и сбалансированной производительности.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Из данных вытекает несколько ключевых выводов:
- Эффективность: Ultralytics YOLOv8 стабильно обеспечивает сопоставимую или лучшую точность со значительно меньшим количеством параметров и FLOPs. Например, YOLOv8s достигает 44.9 mAP всего с 11.2M параметрами, в то время как YOLOv6-3.0s требует 18.5M параметров для достижения аналогичного 45.0 mAP. Эта превосходная эффективность делает YOLOv8 более легким и экономически выгодным выбором.
- Точность: Несмотря на то, что обе модели конкурентоспособны, YOLOv8x достигает самого высокого mAP в 53,9, что делает ее самой точной моделью в этом сравнении.
- Производительность CPU: YOLOv8 предоставляет четкие бенчмарки для инференса на CPU, что является критическим фактором для многих реальных приложений, где GPU недоступны. Отсутствие официальных бенчмарков CPU для YOLOv6-3.0 затрудняет оценку для таких сценариев.
Заключение и рекомендации
Несмотря на то, что YOLOv8 и YOLOv6-3.0 являются способными моделями обнаружения объектов, Ultralytics YOLOv8 выделяется как превосходный выбор для большинства пользователей и приложений.
Ключевые преимущества YOLOv8 заключаются в исключительном балансе точности и эффективности, непревзойденной универсальности в различных задачах компьютерного зрения и удобной, хорошо поддерживаемой экосистеме. Для разработчиков и исследователей, которым нужна единая, надежная и высокопроизводительная платформа, способная справиться со всем, от обнаружения до оценки позы, YOLOv8 — очевидный выбор. Меньшие вычислительные затраты для заданного уровня точности приводят к снижению затрат на развертывание и более широкой совместимости с оборудованием.
Для тех, кто ищет самые последние технологии обнаружения объектов, мы также рекомендуем изучить новейшую Ultralytics YOLO11, которая, опираясь на прочный фундамент YOLOv8, обеспечивает еще большую производительность и возможности.