Сравнение моделей: YOLOv8 и YOLOv7 для обнаружения объектов
Выбор подходящей модели обнаружения объектов имеет решающее значение для достижения оптимальной производительности в задачах компьютерного зрения. На этой странице представлено техническое сравнение Ultralytics YOLOv8 и YOLOv7 — двух значимых моделей в этой области. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и идеальные области применения, чтобы помочь вам в процессе выбора модели, выделив преимущества, предлагаемые экосистемой Ultralytics. Хотя обе модели продвинули современный уровень техники, YOLOv8 становится превосходным выбором для современных приложений благодаря своей повышенной производительности, универсальности и исключительной простоте использования.
YOLOv8: Передовая эффективность и адаптивность
Ultralytics YOLOv8, выпущенная в 2023 году, является последней флагманской моделью от Ultralytics. Она опирается на успехи своих предшественников, представляя новый уровень производительности, гибкости и эффективности. Как современная модель, YOLOv8 разработана для достижения превосходных результатов в широком спектре задач компьютерного зрения.
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Архитектура и Дизайн
YOLOv8 отличается усовершенствованной архитектурой, которая является одновременно мощной и удобной в использовании. Ключевые архитектурные улучшения включают новую detection head без anchor boxes и более эффективный backbone. Отказ от anchor boxes уменьшает количество предсказаний bounding boxes, что упрощает этапы постобработки, такие как Non-Maximum Suppression (NMS), и ускоряет скорость inference. Это делает YOLOv8 более адаптируемой к различным формам и размерам объектов без ручной настройки anchor boxes.
Сильные стороны
- Современная производительность: YOLOv8 обеспечивает исключительный баланс между точностью и скоростью, превосходя предыдущие модели во всех масштабах. Его небольшие модели быстрее и точнее, чем сопоставимые варианты YOLOv7, а его более крупные модели устанавливают новые стандарты точности.
- Беспрецедентная универсальность: В отличие от YOLOv7, который является прежде всего детектором объектов, YOLOv8 — это унифицированный фреймворк, поддерживающий несколько задач из коробки: обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и обнаружение ориентированных объектов (OBB).
- Простота использования: Ultralytics уделяет первостепенное внимание оптимизации работы разработчиков. YOLOv8 поставляется с простым Python API и CLI, исчерпывающей документацией и бесшовной интеграцией с такими инструментами, как Ultralytics HUB, для обучения и развертывания без кода.
- Хорошо поддерживаемая экосистема: Будучи официальной моделью Ultralytics, YOLOv8 выигрывает от активной разработки, частых обновлений и сильного сообщества с открытым исходным кодом. Это обеспечивает надежность, доступ к новейшим функциям и широкую поддержку.
- Эффективность обучения и памяти: Модели YOLOv8 разработаны для эффективного обучения, часто требуя меньше памяти CUDA, чем другие архитектуры, такие как трансформеры. Легкодоступные предварительно обученные веса на наборах данных, таких как COCO, обеспечивают более быструю сходимость на пользовательских данных.
Слабые стороны
- Будучи высокотехнологичной моделью, самые крупные варианты YOLOv8 требуют значительных вычислительных ресурсов для обучения, хотя они остаются весьма эффективными для своего уровня производительности.
Идеальные варианты использования
Превосходная производительность и универсальность YOLOv8 делают ее идеальным выбором для широкого спектра приложений, от периферийных устройств до облачных серверов.
- Промышленная автоматизация в реальном времени: Обеспечение контроля качества и мониторинга процессов в производстве с помощью высокоскоростной и точной детекции.
- Передовые решения в области ИИ: Обеспечение сложных приложений в сельском хозяйстве для мониторинга урожая и в здравоохранении для анализа медицинских изображений.
- Автономные системы: Обеспечение надежного восприятия для автономных транспортных средств и робототехники.
YOLOv7: Эталон в обнаружении в реальном времени
YOLOv7 был представлен в 2022 году как значительный шаг вперед в области обнаружения объектов в реальном времени, установив новый стандарт на момент выпуска. Основное внимание уделялось оптимизации процессов обучения для повышения точности без увеличения затрат на вывод.
Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/
Архитектура и Дизайн
YOLOv7 представил несколько архитектурных инноваций, в том числе Extended Efficient Layer Aggregation Network (E-ELAN) в своей основе, чтобы повысить эффективность обучения. Его наиболее заметным вкладом была концепция "trainable bag-of-freebies", которая представляет собой стратегии обучения, повышающие точность модели, не увеличивая при этом накладные расходы на вывод. К ним относятся такие методы, как вспомогательные заголовки и назначение меток от грубого к точному.
Сильные стороны
- Высокая производительность на момент выпуска: YOLOv7 предлагал отличное сочетание скорости и точности, превосходя другие детекторы, доступные на тот момент.
- Эффективное обучение: Концепция "bag-of-freebies" позволила достичь высокой точности с помощью оптимизированных процедур обучения.
- Признанный эталон: Это хорошо зарекомендовавшая себя модель, которая была тщательно протестирована на стандартных наборах данных, таких как MS COCO.
Слабые стороны
- Ограниченная универсальность: YOLOv7 - это в первую очередь детектор объектов. Его расширение для других задач, таких как сегментация или оценка позы, требует отдельных, часто разрабатываемых сообществом реализаций, в отличие от интегрированного подхода YOLOv8.
- Архитектурная сложность (Architectural Complexity): Методы обучения и архитектурные компоненты могут быть более сложными для понимания и изменения по сравнению с упрощенной конструкцией YOLOv8.
- Превосходство новых моделей: Несмотря на свою мощность, YOLOv7 был превзойден по скорости и точности моделью YOLOv8. Экосистема Ultralytics также предоставляет более удобный и всесторонний опыт.
Идеальные варианты использования
YOLOv7 остается подходящей моделью для приложений, в которых она была интегрирована до выпуска новых альтернатив.
- Системы безопасности в реальном времени: Подходит для таких приложений, как предотвращение краж, где быстрая и точная детекция имеет ключевое значение.
- Устаревшие проекты: Подходящий вариант для поддержания или расширения существующих систем, построенных на архитектуре YOLOv7.
Производительность и тесты: YOLOv8 против YOLOv7
Сравнение производительности наглядно демонстрирует улучшения, достигнутые в YOLOv8. В целом, модели YOLOv8 предлагают лучший компромисс между точностью и скоростью.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Из данных вытекает несколько ключевых выводов:
- Превосходная точность: Самая большая модель, YOLOv8x, достигает 53,9 mAP, превосходя 53,1 mAP модели YOLOv7x.
- Беспрецедентная скорость: Модели YOLOv8 значительно быстрее, особенно на CPU. Модель YOLOv8n может похвастаться временем инференса всего 80,4 мс на CPU с ONNX, что недоступно для YOLOv7, но на практике значительно быстрее. На GPU, YOLOv8n достигает невероятных 1,47 мс с TensorRT, что намного превосходит эффективность YOLOv7.
- Бо́льшая эффективность: Модели YOLOv8 имеют меньше параметров и FLOPs при сопоставимой или лучшей производительности. Например, YOLOv8l достигает почти той же mAP, что и YOLOv7x (52,9 против 53,1), но со значительно меньшим количеством параметров (43,7M против 71,3M) и FLOPs (165,2B против 189,9B).
Заключение: почему Ultralytics YOLOv8 является предпочтительным выбором
Несмотря на то, что YOLOv7 была грозной моделью, YOLOv8 является явным победителем для новых проектов и разработок. Ее превосходная архитектура, современная производительность и невероятная универсальность делают ее самым мощным и удобным инструментом для обнаружения объектов и других задач компьютерного зрения.
Интегрированная экосистема Ultralytics предоставляет значительное преимущество, предлагая беспроблемный опыт от обучения до развертывания. Для разработчиков и исследователей, ищущих надежную, хорошо поддерживаемую и высокопроизводительную модель, YOLOv8 является оптимальным выбором.
Изучите другие модели
Для тех, кто заинтересован в дальнейшем изучении, Ultralytics предоставляет ряд моделей и сравнений. Рекомендуем ознакомиться со следующими материалами:
- YOLOv8 vs. YOLOv5: Сравните YOLOv8 с другой широко используемой и эффективной моделью.
- YOLOv8 vs. RT-DETR: Посмотрите, как YOLOv8 сопоставляется с архитектурами на основе трансформеров.
- YOLO11 vs. YOLOv8: Изучите усовершенствования в последней модели Ultralytics, YOLO11.