Перейти к содержанию

Сравнение моделей: YOLOv7 и YOLOv8 для обнаружения объектов

Выбор подходящей модели обнаружения объектов имеет решающее значение для достижения оптимальной производительности в задачах компьютерного зрения. На этой странице представлено техническое сравнение YOLOv7 и Ultralytics YOLOv8 — двух значимых моделей в этой области. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и идеальные области применения, чтобы помочь вам в процессе выбора модели, выделив преимущества, предлагаемые экосистемой Ultralytics.

YOLOv7: Эталон в обнаружении в реальном времени

YOLOv7 был представлен как значительный шаг вперед в обнаружении объектов в реальном времени, с акцентом на оптимизацию эффективности и точности обучения без увеличения затрат на вывод. Он установил новый современный уровень для детекторов в реальном времени после выпуска.

Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/

Архитектура и ключевые особенности

YOLOv7 развивает предыдущие архитектуры YOLO, внедряя несколько ключевых инноваций. В своей основе он использует такие методы, как Extended Efficient Layer Aggregation Networks (E-ELAN), для повышения эффективности извлечения признаков. Важным вкладом является концепция "trainable bag-of-freebies", которая включает в себя стратегии оптимизации, применяемые во время обучения, такие как вспомогательные заголовки и руководство от грубого к точному, для повышения точности конечной модели без добавления вычислительных затрат во время вывода. YOLOv7 — это в первую очередь детектор на основе якорей, ориентированный на задачу обнаружения объектов, хотя расширения сообщества адаптировали его для других задач, таких как оценка позы.

Сильные стороны

  • Баланс высокой точности и скорости: Предлагает сильное сочетание mAP и скорости инференса, что делает его очень эффективным для задач инференса в реальном времени.
  • Эффективное обучение: Использует передовые методы обучения ("bag-of-freebies") для повышения точности без увеличения конечной стоимости инференса.
  • Подтвержденная производительность: Имеет проверенные результаты на стандартных бенчмарках, таких как набор данных MS COCO.

Слабые стороны

  • Архитектурная сложность (Architectural Complexity): Архитектуру и новые методы обучения может быть сложно полностью понять и оптимизировать для пользовательских случаев использования.
  • Требовательность к ресурсам: Более крупные модели YOLOv7 требуют значительных GPU-ресурсов для обучения.
  • Ограниченная универсальность задач: В основном ориентирован на обнаружение объектов. Реализация других задач, таких как сегментация экземпляров или классификация изображений, требует отдельных, неинтегрированных реализаций, в отличие от унифицированного подхода YOLOv8.

Узнайте больше о YOLOv7

Ultralytics YOLOv8: Современная эффективность и адаптируемость

Ultralytics YOLOv8 — это последующий крупный релиз от Ultralytics, основанный на успехах предыдущих версий YOLO. Это современная модель, разработанная для превосходной производительности, гибкости и эффективности. YOLOv8 представляет дизайн без привязки к якорям (anchor-free) и более оптимизированную архитектуру, улучшая как производительность, так и простоту использования.

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Сильные стороны

  • Современная производительность: YOLOv8 достигает исключительного баланса между точностью и скоростью, что делает его подходящим для широкого спектра приложений, от периферийного AI до облачных сервисов.
  • Удобный дизайн: Ultralytics уделяет первостепенное внимание простоте, предлагая исчерпывающую документацию, понятные рабочие процессы и простые интерфейсы Python и CLI для обучения и развертывания.
  • Беспрецедентная универсальность: Нативно поддерживает несколько задач компьютерного зрения, включая обнаружение, сегментацию, классификацию, оценку позы и обнаружение ориентированных объектов (OBB), предоставляя унифицированное решение для различных потребностей в области компьютерного зрения.
  • Хорошо поддерживаемая экосистема: Легко интегрируется с Ultralytics HUB для обучения и развертывания без кода. Преимущества активной разработки, частых обновлений, сильной поддержки сообщества и обширных ресурсов.
  • Эффективность обучения и памяти: Предлагает эффективные процессы обучения с легкодоступными предварительно обученными весами. Его архитектура часто требует меньшего использования памяти во время обучения по сравнению с другими сложными архитектурами, такими как трансформеры, которые могут обучаться медленнее и требовать больше памяти CUDA.

Слабые стороны

  • Более крупные модели требуют значительных вычислительных ресурсов, хотя для сред с ограниченными ресурсами доступны небольшие, высокоэффективные варианты, такие как YOLOv8n.

Идеальные варианты использования

Универсальность YOLOv8 делает его идеальным для приложений, требующих производительности в реальном времени и высокой точности, таких как:

Узнайте больше о YOLOv8

Производительность и тесты: YOLOv7 против YOLOv8

При сравнении производительности YOLOv8 демонстрирует явные преимущества как в точности, так и в эффективности во всем диапазоне своих моделей. Например, модель YOLOv8x достигает более высокого mAP, чем YOLOv7x, при этом являясь более эффективной. Меньшие модели YOLOv8 также обеспечивают отличный компромисс для развертывания на периферийных устройствах.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Заключение: какую модель вам следует выбрать?

Несмотря на то, что YOLOv7 является грозным детектором объектов, который раздвинул границы производительности в реальном времени, Ultralytics YOLOv8 представляет собой более убедительный выбор для подавляющего большинства современных приложений.

Ключевые преимущества YOLOv8 заключаются в:

  • Превосходная универсальность: Встроенная поддержка более широкого спектра задач делает его универсальным решением для сложных проектов компьютерного зрения.
  • Простота использования: Оптимизированный API, обширная документация и интеграция с экосистемой Ultralytics значительно снижают порог вхождения как для начинающих, так и для экспертов.
  • Better Performance-Efficiency Trade-off: Модели YOLOv8 обычно предлагают лучшую точность для заданного количества параметров и вычислительных затрат, что делает их более адаптируемыми к различным аппаратным ограничениям.
  • Активная разработка и поддержка: Как флагманская модель от Ultralytics, YOLOv8 получает выгоду от непрерывных обновлений, активного сообщества и профессиональной поддержки, что обеспечивает долгосрочную жизнеспособность проектов.

Для разработчиков и исследователей, ищущих мощный, гибкий и простой в использовании фреймворк, Ultralytics YOLOv8 является рекомендуемым выбором для создания передовых AI-решений.

Изучите другие модели

Для дальнейшего изучения рассмотрите эти сравнения с участием YOLOv7, YOLOv8 и других соответствующих моделей в документации Ultralytics:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии