Перейти к содержанию

Сравнение моделей: YOLOv8 и YOLOv7 для обнаружения объектов

Выбор подходящей модели обнаружения объектов имеет решающее значение для достижения оптимальной производительности в задачах компьютерного зрения. На этой странице представлено техническое сравнение Ultralytics YOLOv8 и YOLOv7 — двух значимых моделей в этой области. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и идеальные области применения, чтобы помочь вам в процессе выбора модели, выделив преимущества, предлагаемые экосистемой Ultralytics. Хотя обе модели продвинули современный уровень техники, YOLOv8 становится превосходным выбором для современных приложений благодаря своей повышенной производительности, универсальности и исключительной простоте использования.

YOLOv8: Передовая эффективность и адаптивность

Ultralytics YOLOv8, выпущенная в 2023 году, является последней флагманской моделью от Ultralytics. Она опирается на успехи своих предшественников, представляя новый уровень производительности, гибкости и эффективности. Как современная модель, YOLOv8 разработана для достижения превосходных результатов в широком спектре задач компьютерного зрения.

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Архитектура и Дизайн

YOLOv8 отличается усовершенствованной архитектурой, которая является одновременно мощной и удобной в использовании. Ключевые архитектурные улучшения включают новую detection head без anchor boxes и более эффективный backbone. Отказ от anchor boxes уменьшает количество предсказаний bounding boxes, что упрощает этапы постобработки, такие как Non-Maximum Suppression (NMS), и ускоряет скорость inference. Это делает YOLOv8 более адаптируемой к различным формам и размерам объектов без ручной настройки anchor boxes.

Сильные стороны

  • Современная производительность: YOLOv8 обеспечивает исключительный баланс между точностью и скоростью, превосходя предыдущие модели во всех масштабах. Его небольшие модели быстрее и точнее, чем сопоставимые варианты YOLOv7, а его более крупные модели устанавливают новые стандарты точности.
  • Беспрецедентная универсальность: В отличие от YOLOv7, который является прежде всего детектором объектов, YOLOv8 — это унифицированный фреймворк, поддерживающий несколько задач из коробки: обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и обнаружение ориентированных объектов (OBB).
  • Простота использования: Ultralytics уделяет первостепенное внимание оптимизации работы разработчиков. YOLOv8 поставляется с простым Python API и CLI, исчерпывающей документацией и бесшовной интеграцией с такими инструментами, как Ultralytics HUB, для обучения и развертывания без кода.
  • Хорошо поддерживаемая экосистема: Будучи официальной моделью Ultralytics, YOLOv8 выигрывает от активной разработки, частых обновлений и сильного сообщества с открытым исходным кодом. Это обеспечивает надежность, доступ к новейшим функциям и широкую поддержку.
  • Эффективность обучения и памяти: Модели YOLOv8 разработаны для эффективного обучения, часто требуя меньше памяти CUDA, чем другие архитектуры, такие как трансформеры. Легкодоступные предварительно обученные веса на наборах данных, таких как COCO, обеспечивают более быструю сходимость на пользовательских данных.

Слабые стороны

  • Будучи высокотехнологичной моделью, самые крупные варианты YOLOv8 требуют значительных вычислительных ресурсов для обучения, хотя они остаются весьма эффективными для своего уровня производительности.

Идеальные варианты использования

Превосходная производительность и универсальность YOLOv8 делают ее идеальным выбором для широкого спектра приложений, от периферийных устройств до облачных серверов.

Узнайте больше о YOLOv8

YOLOv7: Эталон в обнаружении в реальном времени

YOLOv7 был представлен в 2022 году как значительный шаг вперед в области обнаружения объектов в реальном времени, установив новый стандарт на момент выпуска. Основное внимание уделялось оптимизации процессов обучения для повышения точности без увеличения затрат на вывод.

Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/

Архитектура и Дизайн

YOLOv7 представил несколько архитектурных инноваций, в том числе Extended Efficient Layer Aggregation Network (E-ELAN) в своей основе, чтобы повысить эффективность обучения. Его наиболее заметным вкладом была концепция "trainable bag-of-freebies", которая представляет собой стратегии обучения, повышающие точность модели, не увеличивая при этом накладные расходы на вывод. К ним относятся такие методы, как вспомогательные заголовки и назначение меток от грубого к точному.

Сильные стороны

  • Высокая производительность на момент выпуска: YOLOv7 предлагал отличное сочетание скорости и точности, превосходя другие детекторы, доступные на тот момент.
  • Эффективное обучение: Концепция "bag-of-freebies" позволила достичь высокой точности с помощью оптимизированных процедур обучения.
  • Признанный эталон: Это хорошо зарекомендовавшая себя модель, которая была тщательно протестирована на стандартных наборах данных, таких как MS COCO.

Слабые стороны

  • Ограниченная универсальность: YOLOv7 - это в первую очередь детектор объектов. Его расширение для других задач, таких как сегментация или оценка позы, требует отдельных, часто разрабатываемых сообществом реализаций, в отличие от интегрированного подхода YOLOv8.
  • Архитектурная сложность (Architectural Complexity): Методы обучения и архитектурные компоненты могут быть более сложными для понимания и изменения по сравнению с упрощенной конструкцией YOLOv8.
  • Превосходство новых моделей: Несмотря на свою мощность, YOLOv7 был превзойден по скорости и точности моделью YOLOv8. Экосистема Ultralytics также предоставляет более удобный и всесторонний опыт.

Идеальные варианты использования

YOLOv7 остается подходящей моделью для приложений, в которых она была интегрирована до выпуска новых альтернатив.

  • Системы безопасности в реальном времени: Подходит для таких приложений, как предотвращение краж, где быстрая и точная детекция имеет ключевое значение.
  • Устаревшие проекты: Подходящий вариант для поддержания или расширения существующих систем, построенных на архитектуре YOLOv7.

Узнайте больше о YOLOv7

Производительность и тесты: YOLOv8 против YOLOv7

Сравнение производительности наглядно демонстрирует улучшения, достигнутые в YOLOv8. В целом, модели YOLOv8 предлагают лучший компромисс между точностью и скоростью.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Из данных вытекает несколько ключевых выводов:

  • Превосходная точность: Самая большая модель, YOLOv8x, достигает 53,9 mAP, превосходя 53,1 mAP модели YOLOv7x.
  • Беспрецедентная скорость: Модели YOLOv8 значительно быстрее, особенно на CPU. Модель YOLOv8n может похвастаться временем инференса всего 80,4 мс на CPU с ONNX, что недоступно для YOLOv7, но на практике значительно быстрее. На GPU, YOLOv8n достигает невероятных 1,47 мс с TensorRT, что намного превосходит эффективность YOLOv7.
  • Бо́льшая эффективность: Модели YOLOv8 имеют меньше параметров и FLOPs при сопоставимой или лучшей производительности. Например, YOLOv8l достигает почти той же mAP, что и YOLOv7x (52,9 против 53,1), но со значительно меньшим количеством параметров (43,7M против 71,3M) и FLOPs (165,2B против 189,9B).

Заключение: почему Ultralytics YOLOv8 является предпочтительным выбором

Несмотря на то, что YOLOv7 была грозной моделью, YOLOv8 является явным победителем для новых проектов и разработок. Ее превосходная архитектура, современная производительность и невероятная универсальность делают ее самым мощным и удобным инструментом для обнаружения объектов и других задач компьютерного зрения.

Интегрированная экосистема Ultralytics предоставляет значительное преимущество, предлагая беспроблемный опыт от обучения до развертывания. Для разработчиков и исследователей, ищущих надежную, хорошо поддерживаемую и высокопроизводительную модель, YOLOv8 является оптимальным выбором.

Изучите другие модели

Для тех, кто заинтересован в дальнейшем изучении, Ultralytics предоставляет ряд моделей и сравнений. Рекомендуем ознакомиться со следующими материалами:

  • YOLOv8 vs. YOLOv5: Сравните YOLOv8 с другой широко используемой и эффективной моделью.
  • YOLOv8 vs. RT-DETR: Посмотрите, как YOLOv8 сопоставляется с архитектурами на основе трансформеров.
  • YOLO11 vs. YOLOv8: Изучите усовершенствования в последней модели Ultralytics, YOLO11.


📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии