Перейти к содержанию

YOLOv6-3.0 vs YOLO11: подробное сравнение моделей

Выбор правильной модели компьютерного зрения имеет решающее значение для достижения оптимальной производительности в задачах обнаружения объектов. На этой странице представлено техническое сравнение YOLOv6-3.0 и Ultralytics YOLO11 с упором на их архитектуры, показатели производительности, методологии обучения и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящий вариант для вашего проекта. Хотя обе являются мощными моделями, YOLO11 представляет собой новейшую современную эффективность и универсальность.

YOLOv6-3.0

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, разработанный Meituan, представляет собой фреймворк для обнаружения объектов, разработанный в первую очередь для промышленных приложений. Выпущенный в начале 2023 года, он был направлен на обеспечение баланса между скоростью и точностью, подходящего для реальных сценариев развертывания, где инференс в реальном времени является приоритетом.

Архитектура и ключевые особенности

YOLOv6 представила архитектурные модификации, такие как аппаратный эффективный бэкбон и дизайн neck. Версия 3.0 дополнительно усовершенствовала эти элементы и включила такие методы, как самодистилляция во время обучения, для повышения производительности. Она также предлагает специальные модели, оптимизированные для мобильного развертывания (YOLOv6Lite), демонстрируя свою ориентацию на периферийные вычисления.

Сильные стороны

  • Хороший компромисс между скоростью и точностью: Предлагает конкурентную производительность, особенно для задач промышленного обнаружения объектов.
  • Поддержка квантования: Предоставляет инструменты и учебные пособия по квантованию моделей, что полезно для развертывания на оборудовании с ограниченными ресурсами.
  • Мобильная оптимизация: Включает варианты YOLOv6Lite, специально разработанные для мобильного вывода или вывода на базе CPU.

Слабые стороны

  • Ограниченная универсальность задач: В основном ориентирован на обнаружение объектов, не хватает встроенной поддержки сегментации экземпляров, классификации изображений или оценки позы, которые есть в Ultralytics YOLO11.
  • Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, экосистема не так всеобъемлюща и активно поддерживается, как платформа Ultralytics, что потенциально может привести к замедлению обновлений и уменьшению поддержки сообщества.
  • Более высокое использование ресурсов: Более крупные модели YOLOv6 могут иметь значительно больше параметров и FLOPs по сравнению с эквивалентами YOLO11 для аналогичного mAP, что потенциально требует больше вычислительных ресурсов, как показано в таблице ниже.

Идеальные варианты использования

YOLOv6-3.0 хорошо подходит для:

  • Промышленные приложения, где скорость обнаружения объектов имеет решающее значение, например, в производстве для контроля качества.
  • Сценарии развертывания, использующие квантование или требующие модели, оптимизированные для мобильных устройств.
  • Проекты, ориентированные исключительно на обнаружение объектов, без необходимости многозадачности.

Узнайте больше о YOLOv6

Ultralytics YOLO11

Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 – это новейшая современная модель от Ultralytics, представляющая собой последнюю эволюцию в серии YOLO. Выпущенная в сентябре 2024 года, она основана на предыдущих версиях, таких как YOLOv8, с архитектурными усовершенствованиями, направленными на повышение скорости и точности. YOLO11 разработана для обеспечения превосходной производительности и эффективности в широком спектре задач компьютерного зрения.

Архитектура и ключевые особенности

YOLO11 имеет оптимизированную архитектуру, которая обеспечивает точный баланс между размером модели, скоростью инференса и точностью. Ключевые улучшения включают улучшенные слои извлечения признаков и оптимизированную структуру сети, минимизирующую вычислительные издержки. Эта конструкция обеспечивает эффективную работу на различном оборудовании, от периферийных устройств, таких как NVIDIA Jetson, до мощных облачных серверов. Как детектор без привязки к anchor-ам, YOLO11 упрощает процесс обнаружения и часто улучшает обобщение.

Сильные стороны

  • Превосходный баланс производительности: Достигает более высоких показателей mAP с меньшим количеством параметров и FLOPs по сравнению с конкурентами, предлагая отличный компромисс между скоростью и точностью.
  • Универсальность: Поддерживает несколько задач компьютерного зрения в рамках единой структуры, включая обнаружение, сегментацию экземпляров, классификацию, оценку позы и ориентированные ограничивающие рамки (OBB), предоставляя комплексное решение.
  • Простота использования: Преимущества оптимизированной экосистемы Ultralytics, включающей простой Python API, обширную документацию и легкодоступные предварительно обученные веса.
  • Развитая экосистема: Активная разработка и поддержка Ultralytics, с частыми обновлениями, мощной поддержкой сообщества через GitHub и Discord, а также интеграция с Ultralytics HUB для бесшовного обучения и развертывания.
  • Эффективность обучения: Предлагает эффективные процессы обучения, часто требующие меньше памяти по сравнению с другими типами моделей, такими как трансформеры.

Слабые стороны

  • Новая модель: Поскольку это последний релиз, объем учебных пособий от сообщества и сторонних инструментов все еще растет по сравнению с более устоявшимися моделями, такими как YOLOv5.
  • Обнаружение мелких объектов: Как и большинство одноэтапных детекторов, может сталкиваться с проблемами при обнаружении очень мелких объектов по сравнению со специализированными двухэтапными детекторами.

Идеальные варианты использования

Сочетание точности, скорости и универсальности YOLO11 делает ее идеальной для:

  • Приложения реального времени, требующие высокой точности, такие как автономные системы и робототехника.
  • Многозадачные сценарии, требующие одновременного обнаружения, сегментации и оценки позы.
  • Развертывание на различных платформах, от устройств с ограниченными ресурсами, таких как Raspberry Pi, до мощной облачной инфраструктуры.
  • Приложения в сферах безопасности, розничной торговли, здравоохранения и логистики.

Узнайте больше о YOLO11

Сравнение производительности

Приведенные ниже эталонные тесты производительности, оцененные на наборе данных COCO, наглядно демонстрируют преимущества YOLO11. Для сопоставимого уровня точности модели YOLO11 значительно эффективнее. Например, YOLO11l достигает более высокого mAPval 53,4 всего с 25,3 млн параметров и 86,9 млрд FLOPs, в то время как YOLOv6-3.0l достигает только 52,8 mAPval, требуя при этом более чем в два раза больше параметров (59,6 млн) и FLOPs (150,7 млрд). Эта превосходная эффективность делает YOLO11 более масштабируемым и экономически выгодным выбором для развертывания.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Методологии обучения

Обе модели используют стандартные методы обучения глубокому обучению. YOLOv6-3.0 использует такие методы, как самодистилляция, для повышения производительности. Однако Ultralytics YOLO11 выигрывает от своей глубокой интеграции в комплексную экосистему Ultralytics, которая предлагает значительно более оптимизированный и удобный для пользователя опыт.

Обучение с YOLO11 упрощено благодаря пакету python и Ultralytics HUB, который предоставляет инструменты для легкой настройки гиперпараметров, эффективной загрузки данных и автоматического ведения журналов с помощью таких платформ, как TensorBoard и Weights & Biases. Кроме того, архитектура YOLO11 оптимизирована для эффективности обучения, часто требуя меньше памяти и времени. Обе модели предоставляют предварительно обученные веса на наборе данных COCO для облегчения переноса обучения.

Заключение

Несмотря на то, что YOLOv6-3.0 демонстрирует стабильную производительность для конкретных промышленных случаев использования, Ultralytics YOLO11 становится лучшим выбором для большинства разработчиков и исследователей. YOLO11 обеспечивает современную точность, замечательную эффективность (меньше параметров и FLOPs для более высокого mAP) и исключительную универсальность для различных задач компьютерного зрения. Ее самое большое преимущество заключается в беспрецедентной простоте использования, подкрепленной надежной, хорошо документированной и активно поддерживаемой экосистемой Ultralytics. Этот сильный баланс производительности делает ее подходящей для более широкого спектра приложений и сред развертывания, от периферии до облака.

Для пользователей, изучающих альтернативы, Ultralytics также предлагает другие высокопроизводительные модели, такие как YOLOv10, YOLOv9 и YOLOv8. Вы можете найти дальнейшие сравнения с такими моделями, как RT-DETR, YOLOX и YOLOv7, в документации Ultralytics.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии