Перейти к содержанию

YOLO11 против YOLOv6.0: Сравнение современного уровня обнаружения объектов

Выбор оптимальной модели компьютерного зрения - важнейшее решение, влияющее на эффективность, точность и масштабируемость приложений искусственного интеллекта. В данном руководстве представлен всесторонний технический анализ, в котором сравниваются Ultralytics YOLO11 и YOLOv6.0. Мы рассмотрим их архитектурные инновации, эталоны производительности, методики обучения и пригодность для различных сценариев развертывания в реальном мире. Хотя оба фреймворка внесли значительный вклад в развитие этой области, YOLO11 представляет собой последнюю эволюцию в эффективности, универсальности и удобстве использования.

Ultralytics YOLO11

Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: ultralytics
Docs: https:yolo11

YOLO11 - это современное развитие серии YOLO (You Only Look Once), запущенной Ultralytics в конце 2024 года. Опираясь на успех предшественников, таких как YOLOv8в ней представлена усовершенствованная архитектура, призванная обеспечить максимальную производительность при минимальных вычислительных затратах. YOLO11 предназначен для решения широкого спектра задач компьютерного зрения, что делает его универсальным решением для различных отраслей промышленности - от автомобильной до здравоохранения.

Архитектура и ключевые особенности

Архитектура YOLO11 направлена на повышение эффективности извлечения и обработки признаков. Она включает в себя улучшенную конструкцию позвоночника и шеи, которая уменьшает количество избыточных вычислений, обеспечивая более высокую скорость вычислений как на пограничных устройствах, так и на облачных серверах. Будучи безъякорным детектором, YOLO11 исключает необходимость ручной настройки якорных блоков, упрощая конвейер обучения и улучшая адаптацию к объектам различной формы.

Сильные стороны

  • Непревзойденный баланс производительности: YOLO11 обеспечивает более высокую среднюю точность (mAP) при значительно меньшем количестве параметров и операций FLOP, чем аналогичные модели. Такая эффективность снижает требования к хранению данных и ускоряет время обработки.
  • Всеобъемлющая универсальность: В отличие от многих детекторов, ограничивающихся ограничивающими рамками, YOLO11 поддерживает обнаружение объектов, сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках одного фреймворка.
  • Оптимизированная экосистема: Пользователи получают преимущества от надежной экосистемыUltralytics , которая включает в себя удобный APIPython , простую интеграцию с Ultralytics HUB для обучения без кода и широкую поддержку сообщества.
  • Эффективность обучения: Модель оптимизирована для более быстрой сходимости и меньшего использования памяти при обучении. Это явное преимущество по сравнению с архитектурами на основе трансформаторов, которые часто требуют значительных затрат GPU памяти.

Слабые стороны

  • Кривая освоения: Поскольку модель выпущена недавно, объем сторонних руководств и внешних ресурсов быстро растет, но в настоящее время может быть меньше, чем у более старых, устаревших версий, таких как YOLOv5.
  • Проблемы малых объектов: Несмотря на значительное улучшение, обнаружение очень маленьких объектов остается сложной задачей для одноэтапных детекторов объектов по сравнению со специализированными, хотя и более медленными подходами.

Идеальные варианты использования

YOLO11 отлично подходит для сценариев, требующих высокой пропускной способности и точности:

  • Автономные системы: Отслеживание объектов в реальном времени для самоуправляемых автомобилей и беспилотников.
  • Умное производство: Задачи обеспечения качества, требующие одновременного обнаружения дефектов и сегментации.
  • Здравоохранение: Анализ медицинских изображений, где часто требуется развертывание в условиях ограниченных ресурсов.
  • Аналитика розничной торговли: Анализ поведения покупателей и управление запасами с помощью оценки и отслеживания поз.

Узнайте больше о YOLO11

YOLOv6.0

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics

YOLOv6.0 - это фреймворк для обнаружения объектов, разработанный компанией Meituan и ориентированный на промышленные приложения. Выпущенный в начале 2023 года, он был разработан, чтобы предложить конкурентоспособный компромисс между скоростью и точностью вывода, удовлетворяя потребности систем реального времени в логистике и автоматизации.

Архитектура и ключевые особенности

Архитектура YOLOv6.0 представляет собой "полномасштабную перезагрузку" сети. В ней используется эффективная перепараметризуемая магистраль (EfficientRep) и развязывающая головная структура. Среди ключевых нововведений - использование методов саморасщепления в процессе обучения для повышения точности без увеличения затрат на вывод, а также специальные оптимизации для TensorRT развертывание.

Сильные стороны

  • Промышленная направленность: Архитектура модели адаптирована для промышленного оборудования, в частности, оптимизирована задержка на графических процессорах NVIDIA .
  • Готовность к квантованию: YOLOv6 обеспечивает специальную поддержку квантования модели, что облегчает развертывание на оборудовании с ограниченной точностью вычислений.
  • Мобильные варианты: Фреймворк включает в себя версии YOLOv6, оптимизированные для мобильных архитектур CPUS и DSP.

Слабые стороны

  • Интенсивность использования ресурсов: Как видно из данных по производительности, YOLOv6.0 часто требует значительно больше параметров и FLOP для достижения точности, сравнимой с более новыми моделями, такими как YOLO11.
  • Ограниченный круг задач: Основное внимание уделяется обнаружению объектов. В нем отсутствует встроенная многозадачная поддержка (сегментация, позирование, классификация, OBB), которая есть в едином фреймворке Ultralytics .
  • Фрагментация экосистемы: Несмотря на открытый исходный код, экосистема менее интегрирована, чем у Ultralytics, что потенциально требует больше ручных усилий для решения таких задач, как управление наборами данных, отслеживание и обучение в облаке.

Идеальные варианты использования

YOLOv6.0 подходит для:

  • Устаревшие промышленные системы: Среды, специально настроенные для архитектуры YOLOv6 .
  • Специализированные задачи обнаружения: Приложения, в которых требуется только обнаружение ограничительных рамок, а многозадачные возможности не нужны.
  • Конкретные аппаратные развертывания: Сценарии, использующие специфические конвейеры квантования, поддерживаемые фреймворком Meituan.

Узнайте больше о YOLOv6

Метрики производительности: Скорость, точность и эффективность

В следующей таблице представлено подробное сравнение YOLO11 и YOLOv6.0 на наборе данныхCOCO . Показатели подчеркивают рост эффективности, достигнутый архитектурой YOLO11 .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

Анализ данных

Сравнение выявило четкую тенденцию: YOLO11 последовательно достигает более высокой точности (mAP) при значительно меньших вычислительных затратах.

  • Эффективность использования параметров: Модель YOLO11m достигает превосходного показателя 51,5 mAP по сравнению с 50,0 mAP модели YOLOv6.0m, но при этом использует всего 20,1 М параметров против 34,9 М. Это представляет собой сокращение размера модели почти на 42 % при более высокой производительности.
  • Вычислительные затраты: Аналогично, YOLO11l требует 86,9B FLOPs для достижения 53,4 mAP, в то время как YOLOv6.0l требует 150,7B FLOPs для более низкой 52,8 mAP. Меньшее количество FLOP напрямую связано с меньшим энергопотреблением и меньшим тепловыделением - критически важными факторами для встраиваемых систем.
  • Скорость вывода: Хотя YOLOv6.0n демонстрирует несколько более высокую скорость работы TensorRT , значительный разрыв в точности (2,0 mAP) и больший размер модели делают YOLO11n более сбалансированным выбором для современных приложений, где точность имеет первостепенное значение.

Преимущество развертывания

Уменьшенное количество параметров в YOLO11 не только ускоряет вывод, но и снижает требования к пропускной способности памяти. Это делает YOLO11 особенно эффективным на периферийных устройствах, таких как Raspberry Pi или NVIDIA Jetson, где ресурсы памяти часто являются узким местом.

Обучение и удобство использования

Простота использования и экосистема

Одним из наиболее значимых отличий является экосистема, окружающая модели. Ultralytics YOLO11 интегрирована в комплексную платформу, которая упрощает весь жизненный цикл операций машинного обучения (MLOps).

  • Простой API: Разработчики могут загружать, обучать и предсказывать с помощью YOLO11 всего несколько строк кода на Python .
  • Документация: Обширная и активно поддерживаемая документация гарантирует, что пользователи смогут легко найти руководства по всем вопросам - от аннотации данных до экспорта моделей.
  • Сообщество: Активное сообщество на GitHub и Discord обеспечивает быструю поддержку и постоянные улучшения.

В отличие от этого, хотя YOLOv6 и обладает солидной кодовой базой, ему не хватает такого же уровня интегрированного инструментария и доступности ресурсов, определяемых сообществом, что может увеличить время развертывания новых проектов.

Эффективность обучения

YOLO11 разработан с учетом высокой эффективности обучения. Его архитектура обеспечивает более быструю сходимость, что означает, что пользователи часто могут достичь целевой точности за меньшее количество эпох по сравнению со старыми архитектурами. Кроме того, оптимизированы требования к памяти во время обучения, что позволяет использовать большие объемы партий на графических процессорах потребительского класса.

Вот пример того, как просто начать обучение модели YOLO11 :

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Заключение

Несмотря на то, что YOLOv6.0 по-прежнему остается способной моделью для специфических промышленных задач обнаружения, Ultralytics YOLO11 является лучшим выбором для подавляющего большинства новых проектов в области компьютерного зрения.

YOLO11 предлагает привлекательное сочетание высокой точности, низкого потребления ресурсов и непревзойденной универсальности. Его способность обрабатывать обнаружение, сегментацию, оценку позы и классификацию в рамках единой, простой в использовании структуры упрощает рабочие процессы разработки. Опираясь на активно поддерживаемую экосистему Ultralytics и такие инструменты, как Ultralytics HUB, YOLO11 обеспечивает надежную основу для создания масштабируемых высокопроизводительных ИИ-решений.

Разработчикам, стремящимся найти оптимальный баланс между производительностью, эффективностью и простотой использования, рекомендуется использовать YOLO11 .

Изучите другие модели

Если вас интересуют дальнейшие сравнения, изучите эти связанные страницы в документации:


Комментарии