Перейти к содержанию

YOLOv5 vs YOLOv7: Подробное сравнение

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает потребность в скорости, точности и простоте развертывания. На этой странице представлено техническое сравнение между Ultralytics YOLOv5 и YOLOv7, двумя влиятельными моделями в области компьютерного зрения. Хотя обе внесли значительный вклад, Ultralytics YOLOv5 выделяется своим исключительным балансом производительности, удобным дизайном и всесторонней, хорошо поддерживаемой экосистемой, что делает ее предпочтительным выбором для широкого спектра реальных приложений.

Ultralytics YOLOv5: Устоявшийся отраслевой стандарт

Ultralytics YOLOv5, выпущенный в 2020 году Гленном Джохером, быстро стал одной из самых популярных моделей обнаружения объектов благодаря замечательному сочетанию скорости, точности и простоты использования. Разработанный полностью на PyTorch, YOLOv5 хорошо оптимизирован, предлагая упрощенный опыт от обучения до развертывания.

Автор: Гленн Джокер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/

Архитектура и ключевые особенности YOLOv5

YOLOv5 имеет гибкую и эффективную архитектуру, построенную на бэкбоне CSPDarknet53 и neck PANet для эффективного агрегирования признаков. Он использует head обнаружения на основе anchor-ов, который был усовершенствован в течение многочисленных выпусков. Одной из его ключевых сильных сторон является разнообразие размеров моделей (n, s, m, l, x), что позволяет разработчикам выбирать оптимальный компромисс между производительностью и вычислительными ресурсами. Эта масштабируемость делает его подходящим для всего, от легких периферийных устройств до мощных облачных серверов.

Сильные стороны YOLOv5

  • Простота использования: YOLOv5 известна своими простыми интерфейсами Python и CLI, обширной документацией, а также простыми конвейерами обучения и логического вывода.
  • Хорошо поддерживаемая экосистема: Поддерживается надежной экосистемой Ultralytics, которая включает активную разработку, большое сообщество, частые обновления и мощные инструменты, такие как Ultralytics HUB, для обучения и развертывания без кода.
  • Баланс производительности: YOLOv5 обеспечивает отличный компромисс между скоростью вывода и точностью обнаружения, что делает его очень практичным для различных реальных сценариев.
  • Универсальность и эффективность обучения: Он поддерживает несколько задач компьютерного зрения, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Процесс обучения эффективен, с легкодоступными предварительно обученными весами и более низкими требованиями к памяти по сравнению с более сложными архитектурами.

Слабые стороны YOLOv5

  • Пределы точности: Несмотря на высокую точность, новые модели превзошли его показатели mAP в стандартных тестах, таких как COCO.
  • Дизайн на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать большей настройки для наборов данных с объектами необычной формы по сравнению с современными подходами без anchor.

Варианты использования YOLOv5

  • Приложения реального времени: Идеально подходят для приложений, требующих быстрого инференса, таких как робототехника, машинное зрение дронов в приложениях компьютерного зрения в операциях ИИ с дронами и анализ видео в реальном времени.
  • Развертывание на периферии (Edge Deployment): Хорошо подходит для развертывания на периферийных устройствах с ограниченными ресурсами благодаря своей эффективной конструкции и небольшим размерам моделей. Ознакомьтесь с руководствами по развертыванию NVIDIA Jetson.
  • Быстрое прототипирование: Отличный выбор для быстрого прототипирования и развертывания решений для обнаружения объектов благодаря простоте использования и широкой поддержке.

Узнайте больше о YOLOv5

YOLOv7: Высокая точность фокусировки

YOLOv7, созданный Чен-Яо Вангом, Алексеем Бочковским и Хонг-Юанем Марком Ляо, был выпущен 6 июля 2022 года. Он представил несколько архитектурных оптимизаций и стратегий обучения, известных как "trainable bag-of-freebies", направленных на расширение границ точности при сохранении скорости в реальном времени.

Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/

Архитектура и ключевые особенности YOLOv7

  • E-ELAN: Использует Extended Efficient Layer Aggregation Network (E-ELAN) в backbone для повышения способности к обучению.
  • Масштабирование модели: Реализует сложное масштабирование для глубины и ширины модели, чтобы оптимизировать ее для различных вычислительных ресурсов.
  • Обучение с использованием вспомогательной головы: Использует вспомогательные головы во время обучения (удаляются во время инференса) для улучшения изучения признаков.
  • Bag-of-Freebies: Использует передовые методы обучения для повышения точности без увеличения стоимости inference.

Сильные стороны YOLOv7

  • Высокая точность: Достигает высоких показателей mAP на таких бенчмарках, как COCO, особенно с более крупными вариантами моделей.
  • Эффективные методы обучения: Включает новые стратегии обучения для максимизации производительности.

Слабые стороны YOLOv7

  • Сложность: Архитектура и процесс обучения могут быть более сложными по сравнению с оптимизированным подходом Ultralytics YOLOv5.
  • Экосистема и поддержка: Отсутствует обширная документация, учебные пособия и интегрированная экосистема, предоставляемые Ultralytics для YOLOv5.
  • Требовательность к ресурсам: Более крупные модели требуют значительных вычислительных ресурсов, что может ограничить развертывание на устройствах с ограниченными ресурсами.

Варианты использования YOLOv7

  • Высокопроизводительное обнаружение: Подходит для приложений, где достижение абсолютно наивысшей точности имеет решающее значение и вычислительные ресурсы менее ограничены, например, в автономных транспортных средствах.
  • Исследования: Используется в академических исследованиях, изучающих современные методы обнаружения объектов.

Узнайте больше о YOLOv7

Производительность и техническое сравнение

Прямое сравнение YOLOv5 и YOLOv7 на наборе данных COCO выявляет ключевые различия в их профилях производительности. Модели YOLOv7 обычно достигают более высоких показателей mAP, но часто за счет повышенной сложности и требований к ресурсам. В отличие от этого, Ultralytics YOLOv5 предлагает более сбалансированный профиль, превосходно справляясь со скоростью инференса на CPU и поддерживая конкурентоспособную точность, что имеет решающее значение для многих реальных развертываний.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Заключение: какую модель вам следует выбрать?

Выбор между YOLOv5 и YOLOv7 во многом зависит от приоритетов проекта.

YOLOv7 — отличный выбор для исследователей и разработчиков, которым требуется максимально возможная точность на стандартных бенчмарках и которые имеют доступ к значительным вычислительным ресурсам. Ее инновационные методы обучения показывают, как расширить границы производительности.

Однако, для подавляющего большинства практических приложений Ultralytics YOLOv5 остается превосходным выбором. Его ключевые преимущества — простота использования, быстрое развертывание, отличный баланс скорости и точности и процветающая экосистема — делают его невероятно эффективным и надежным инструментом. Он позволяет разработчикам быстро создавать надежные решения компьютерного зрения, от первоначального прототипа до развертывания в производство.

Кроме того, экосистема Ultralytics продолжает развиваться. Новые модели, такие как YOLOv8 и YOLO11, построены на основе YOLOv5, предлагая еще лучшую производительность и большую универсальность в таких задачах, как сегментация, оценка позы и отслеживание. Для разработчиков, ищущих современную, перспективную и удобную платформу, семейство Ultralytics YOLO предоставляет наиболее убедительное и комплексное решение.

Изучите другие модели

Если вы изучаете модели обнаружения объектов, вам также могут быть интересны следующие сравнения:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии