YOLOv8 против YOLOv5: подробное сравнение
Сравнение Ultralytics YOLOv8 и Ultralytics YOLOv5 для обнаружения объектов показывает как последовательную эволюцию архитектуры YOLO, так и различные сильные стороны каждой модели. Обе модели, разработанные Ultralytics, известны своим исключительным балансом скорости и точности. Однако они отвечают различным приоритетам в области компьютерного зрения. Эта страница содержит подробное техническое сравнение, чтобы помочь разработчикам и исследователям принять обоснованное решение, основываясь на требованиях своего проекта, и подчеркивает преимущества экосистемы Ultralytics.
YOLOv8: Передовое решение
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 — это последний крупный релиз в серии YOLO, разработанный как унифицированный фреймворк для поддержки полного спектра задач AI в области компьютерного зрения. К ним относятся обнаружение объектов, сегментация экземпляров, классификация изображений, оценка позы и ориентированные ограничивающие рамки (OBB). YOLOv8 представляет значительные архитектурные инновации, такие как детектор без привязки к якорям (anchor-free detector) и усовершенствованную шейку C2f, которые повышают ее производительность и гибкость.
Сильные стороны
- Превосходная точность и производительность: YOLOv8 стабильно обеспечивает более высокую точность (mAP), чем YOLOv5, для всех размеров моделей, сохраняя при этом конкурентоспособную скорость инференса. Это обеспечивает отличный баланс производительности для требовательных приложений.
- Расширенная универсальность: YOLOv8, разработанная как комплексная платформа, изначально поддерживает несколько задач компьютерного зрения. Такая универсальность позволяет разработчикам использовать единую, согласованную архитектуру модели для сложных, многогранных проектов, оптимизируя разработку и развертывание.
- Современная архитектура: Дизайн YOLOv8 без anchor снижает сложность процесса обучения и количество настраиваемых гиперпараметров, что часто приводит к лучшей генерализации на различных наборах данных. Обновленный модуль C2f обеспечивает более эффективное слияние признаков по сравнению с модулем C3 YOLOv5.
- Оптимизированный пользовательский интерфейс: Как и все модели Ultralytics, YOLOv8 выигрывает от простого Python API и CLI, обширной документации и хорошо поддерживаемой экосистемы. Это включает интеграцию с Ultralytics HUB для обучения без кода и управления MLOps.
- Эффективность использования памяти: Модели Ultralytics YOLO оптимизированы для низкого потребления памяти во время обучения и инференса, что делает их более доступными, чем многие ресурсоемкие архитектуры, такие как Transformers.
Слабые стороны
- Вычислительные требования: Несмотря на эффективность, более крупные модели YOLOv8 (L/X) требуют значительной вычислительной мощности, что может быть ограничением для развертывания на устройствах edge с сильно ограниченными ресурсами.
Идеальные варианты использования
YOLOv8 - рекомендуемый выбор для новых проектов, требующих современной производительности и гибкости.
- Продвинутая робототехника: Для сложного понимания сцены и взаимодействия с объектами, где критически важна высокая точность.
- Анализ изображений высокого разрешения: Отлично подходит для таких приложений, как анализ медицинских изображений, где обнаружение мельчайших деталей имеет решающее значение.
- Многозадачные системы машинного зрения: Идеально подходят для систем, которым необходимо одновременно выполнять обнаружение объектов, сегментацию и оценку позы, например, в интеллектуальной розничной аналитике.
YOLOv5: Устоявшийся и универсальный стандарт
Автор: Гленн Джокер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5 вскоре после выпуска стал отраслевым стандартом, получив признание за исключительный баланс скорости, точности и простоту использования. Построенный на базе PyTorch, он имеет бэкбон CSPDarknet53 и neck PANet. Его anchor-based detection head очень эффективен, а модель масштабируется в различных размерах (n, s, m, l, x) для соответствия различным вычислительным возможностям.
Сильные стороны
- Исключительная скорость инференса: YOLOv5 высоко оптимизирована для быстрого инференса, что делает ее отличным выбором для систем реального времени, особенно на CPU и периферийных устройствах.
- Развитая и стабильная экосистема: Находясь в этой области в течение нескольких лет, YOLOv5 имеет обширную базу пользователей, широкую поддержку сообщества и множество учебных пособий и сторонних интеграций. Ее стабильность делает ее надежным выбором для производственных сред.
- Простота использования: YOLOv5 славится своим простым API и понятным конвейером обучения, что сделало ее невероятно популярной как среди новичков, так и среди экспертов. Экосистема Ultralytics обеспечивает удобство работы пользователя от обучения до развертывания.
- Эффективность обучения: Модель предлагает эффективный процесс обучения с легкодоступными предварительно обученными весами, что позволяет быстро создавать прототипы и разрабатывать.
Слабые стороны
- Более низкая точность: По сравнению с YOLOv8, модели YOLOv5 обычно имеют более низкие показатели mAP для заданного размера. Разрыв в производительности становится более заметным с моделями большего размера.
- Детектирование на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать ручной настройки для достижения оптимальной производительности на наборах данных с объектами необычной формы или масштаба.
Идеальные варианты использования
YOLOv5 остается мощной и актуальной моделью, особенно для приложений, где скорость и стабильность имеют первостепенное значение.
- Edge Computing: Его уменьшенные варианты (n/s) идеально подходят для развертывания на устройствах с ограниченными ресурсами, таких как Raspberry Pi и NVIDIA Jetson.
- Наблюдение в реальном времени: Идеально подходит для систем безопасности и мониторинга видео в реальном времени, где важна низкая задержка.
- Мобильные приложения: Подходит для задач обнаружения объектов на устройстве, где вычислительные ресурсы ограничены.
Противостояние производительности: YOLOv8 против YOLOv5
Эталонные тесты производительности на наборе данных COCO наглядно демонстрируют улучшения, достигнутые в YOLOv8. В целом, модели YOLOv8 обеспечивают превосходную точность с сопоставимыми или улучшенными характеристиками производительности.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Из таблицы видно, что модели YOLOv8 предлагают значительное повышение mAP. Например, YOLOv8s достигает 44,9 mAP, что намного превосходит 37,4 mAP у YOLOv5s лишь с незначительным увеличением параметров и задержки. Аналогично, YOLOv8x достигает 53,9 mAP, превосходя 50,7 mAP у YOLOv5x, будучи при этом более вычислительно эффективным.
Заключение: какую модель вам следует выбрать?
И YOLOv5, и YOLOv8 — отличные модели, но они служат разным потребностям.
-
YOLOv5 — это отличный выбор для приложений, где максимальная скорость инференса и зрелая, стабильная платформа являются наивысшими приоритетами. Она остается сильным претендентом для развертывания на устройствах с ограниченными ресурсами и для проектов, которые выигрывают от ее обширной экосистемы.
-
YOLOv8 представляет собой следующее поколение технологии YOLO. Это рекомендуемый выбор для новых проектов, стремящихся к максимальной точности и универсальности для решения различных задач компьютерного зрения. Ее современная безанкерная архитектура и унифицированная структура делают ее более мощным и гибким решением для широкого спектра приложений, от исследований до производства.
Для большинства случаев использования превосходная производительность и гибкость YOLOv8 делают его предпочтительным вариантом.
Изучите другие модели
Ultralytics продолжает внедрять инновации в области компьютерного зрения. Для пользователей, изучающих другие современные варианты, мы также предлагаем такие модели, как YOLOv9, YOLOv10 и последняя YOLO11, каждая из которых предоставляет уникальные преимущества. Вы можете найти более подробный анализ на нашей странице сравнения моделей.