Перейти к содержанию

YOLOv8 против YOLOv5: подробное сравнение

Сравнение Ultralytics YOLOv8 и Ultralytics YOLOv5 для обнаружения объектов показывает как последовательную эволюцию архитектуры YOLO, так и различные сильные стороны каждой модели. Обе модели, разработанные Ultralytics, известны своим исключительным балансом скорости и точности. Однако они отвечают различным приоритетам в области компьютерного зрения. Эта страница содержит подробное техническое сравнение, чтобы помочь разработчикам и исследователям принять обоснованное решение, основываясь на требованиях своего проекта, и подчеркивает преимущества экосистемы Ultralytics.

YOLOv8: Передовое решение

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 — это последний крупный релиз в серии YOLO, разработанный как унифицированный фреймворк для поддержки полного спектра задач AI в области компьютерного зрения. К ним относятся обнаружение объектов, сегментация экземпляров, классификация изображений, оценка позы и ориентированные ограничивающие рамки (OBB). YOLOv8 представляет значительные архитектурные инновации, такие как детектор без привязки к якорям (anchor-free detector) и усовершенствованную шейку C2f, которые повышают ее производительность и гибкость.

Сильные стороны

  • Превосходная точность и производительность: YOLOv8 стабильно обеспечивает более высокую точность (mAP), чем YOLOv5, для всех размеров моделей, сохраняя при этом конкурентоспособную скорость инференса. Это обеспечивает отличный баланс производительности для требовательных приложений.
  • Расширенная универсальность: YOLOv8, разработанная как комплексная платформа, изначально поддерживает несколько задач компьютерного зрения. Такая универсальность позволяет разработчикам использовать единую, согласованную архитектуру модели для сложных, многогранных проектов, оптимизируя разработку и развертывание.
  • Современная архитектура: Дизайн YOLOv8 без anchor снижает сложность процесса обучения и количество настраиваемых гиперпараметров, что часто приводит к лучшей генерализации на различных наборах данных. Обновленный модуль C2f обеспечивает более эффективное слияние признаков по сравнению с модулем C3 YOLOv5.
  • Оптимизированный пользовательский интерфейс: Как и все модели Ultralytics, YOLOv8 выигрывает от простого Python API и CLI, обширной документации и хорошо поддерживаемой экосистемы. Это включает интеграцию с Ultralytics HUB для обучения без кода и управления MLOps.
  • Эффективность использования памяти: Модели Ultralytics YOLO оптимизированы для низкого потребления памяти во время обучения и инференса, что делает их более доступными, чем многие ресурсоемкие архитектуры, такие как Transformers.

Слабые стороны

  • Вычислительные требования: Несмотря на эффективность, более крупные модели YOLOv8 (L/X) требуют значительной вычислительной мощности, что может быть ограничением для развертывания на устройствах edge с сильно ограниченными ресурсами.

Идеальные варианты использования

YOLOv8 - рекомендуемый выбор для новых проектов, требующих современной производительности и гибкости.

  • Продвинутая робототехника: Для сложного понимания сцены и взаимодействия с объектами, где критически важна высокая точность.
  • Анализ изображений высокого разрешения: Отлично подходит для таких приложений, как анализ медицинских изображений, где обнаружение мельчайших деталей имеет решающее значение.
  • Многозадачные системы машинного зрения: Идеально подходят для систем, которым необходимо одновременно выполнять обнаружение объектов, сегментацию и оценку позы, например, в интеллектуальной розничной аналитике.

Узнайте больше о YOLOv8

YOLOv5: Устоявшийся и универсальный стандарт

Автор: Гленн Джокер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 вскоре после выпуска стал отраслевым стандартом, получив признание за исключительный баланс скорости, точности и простоту использования. Построенный на базе PyTorch, он имеет бэкбон CSPDarknet53 и neck PANet. Его anchor-based detection head очень эффективен, а модель масштабируется в различных размерах (n, s, m, l, x) для соответствия различным вычислительным возможностям.

Сильные стороны

  • Исключительная скорость инференса: YOLOv5 высоко оптимизирована для быстрого инференса, что делает ее отличным выбором для систем реального времени, особенно на CPU и периферийных устройствах.
  • Развитая и стабильная экосистема: Находясь в этой области в течение нескольких лет, YOLOv5 имеет обширную базу пользователей, широкую поддержку сообщества и множество учебных пособий и сторонних интеграций. Ее стабильность делает ее надежным выбором для производственных сред.
  • Простота использования: YOLOv5 славится своим простым API и понятным конвейером обучения, что сделало ее невероятно популярной как среди новичков, так и среди экспертов. Экосистема Ultralytics обеспечивает удобство работы пользователя от обучения до развертывания.
  • Эффективность обучения: Модель предлагает эффективный процесс обучения с легкодоступными предварительно обученными весами, что позволяет быстро создавать прототипы и разрабатывать.

Слабые стороны

  • Более низкая точность: По сравнению с YOLOv8, модели YOLOv5 обычно имеют более низкие показатели mAP для заданного размера. Разрыв в производительности становится более заметным с моделями большего размера.
  • Детектирование на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать ручной настройки для достижения оптимальной производительности на наборах данных с объектами необычной формы или масштаба.

Идеальные варианты использования

YOLOv5 остается мощной и актуальной моделью, особенно для приложений, где скорость и стабильность имеют первостепенное значение.

  • Edge Computing: Его уменьшенные варианты (n/s) идеально подходят для развертывания на устройствах с ограниченными ресурсами, таких как Raspberry Pi и NVIDIA Jetson.
  • Наблюдение в реальном времени: Идеально подходит для систем безопасности и мониторинга видео в реальном времени, где важна низкая задержка.
  • Мобильные приложения: Подходит для задач обнаружения объектов на устройстве, где вычислительные ресурсы ограничены.

Узнайте больше о YOLOv5

Противостояние производительности: YOLOv8 против YOLOv5

Эталонные тесты производительности на наборе данных COCO наглядно демонстрируют улучшения, достигнутые в YOLOv8. В целом, модели YOLOv8 обеспечивают превосходную точность с сопоставимыми или улучшенными характеристиками производительности.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Из таблицы видно, что модели YOLOv8 предлагают значительное повышение mAP. Например, YOLOv8s достигает 44,9 mAP, что намного превосходит 37,4 mAP у YOLOv5s лишь с незначительным увеличением параметров и задержки. Аналогично, YOLOv8x достигает 53,9 mAP, превосходя 50,7 mAP у YOLOv5x, будучи при этом более вычислительно эффективным.

Заключение: какую модель вам следует выбрать?

И YOLOv5, и YOLOv8 — отличные модели, но они служат разным потребностям.

  • YOLOv5 — это отличный выбор для приложений, где максимальная скорость инференса и зрелая, стабильная платформа являются наивысшими приоритетами. Она остается сильным претендентом для развертывания на устройствах с ограниченными ресурсами и для проектов, которые выигрывают от ее обширной экосистемы.

  • YOLOv8 представляет собой следующее поколение технологии YOLO. Это рекомендуемый выбор для новых проектов, стремящихся к максимальной точности и универсальности для решения различных задач компьютерного зрения. Ее современная безанкерная архитектура и унифицированная структура делают ее более мощным и гибким решением для широкого спектра приложений, от исследований до производства.

Для большинства случаев использования превосходная производительность и гибкость YOLOv8 делают его предпочтительным вариантом.

Изучите другие модели

Ultralytics продолжает внедрять инновации в области компьютерного зрения. Для пользователей, изучающих другие современные варианты, мы также предлагаем такие модели, как YOLOv9, YOLOv10 и последняя YOLO11, каждая из которых предоставляет уникальные преимущества. Вы можете найти более подробный анализ на нашей странице сравнения моделей.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии