YOLOv5 vs YOLOv7: Подробное сравнение
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает потребность в скорости, точности и простоте развертывания. На этой странице представлено техническое сравнение между Ultralytics YOLOv5 и YOLOv7, двумя влиятельными моделями в области компьютерного зрения. Хотя обе внесли значительный вклад, Ultralytics YOLOv5 выделяется своим исключительным балансом производительности, удобным дизайном и всесторонней, хорошо поддерживаемой экосистемой, что делает ее предпочтительным выбором для широкого спектра реальных приложений.
Ultralytics YOLOv5: Устоявшийся отраслевой стандарт
Ultralytics YOLOv5, выпущенный в 2020 году Гленном Джохером, быстро стал одной из самых популярных моделей обнаружения объектов благодаря замечательному сочетанию скорости, точности и простоты использования. Разработанный полностью на PyTorch, YOLOv5 хорошо оптимизирован, предлагая упрощенный опыт от обучения до развертывания.
Автор: Гленн Джокер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/
Архитектура и ключевые особенности YOLOv5
YOLOv5 имеет гибкую и эффективную архитектуру, построенную на бэкбоне CSPDarknet53 и neck PANet для эффективного агрегирования признаков. Он использует head обнаружения на основе anchor-ов, который был усовершенствован в течение многочисленных выпусков. Одной из его ключевых сильных сторон является разнообразие размеров моделей (n, s, m, l, x), что позволяет разработчикам выбирать оптимальный компромисс между производительностью и вычислительными ресурсами. Эта масштабируемость делает его подходящим для всего, от легких периферийных устройств до мощных облачных серверов.
Сильные стороны YOLOv5
- Простота использования: YOLOv5 известна своими простыми интерфейсами Python и CLI, обширной документацией, а также простыми конвейерами обучения и логического вывода.
- Хорошо поддерживаемая экосистема: Поддерживается надежной экосистемой Ultralytics, которая включает активную разработку, большое сообщество, частые обновления и мощные инструменты, такие как Ultralytics HUB, для обучения и развертывания без кода.
- Баланс производительности: YOLOv5 обеспечивает отличный компромисс между скоростью вывода и точностью обнаружения, что делает его очень практичным для различных реальных сценариев.
- Универсальность и эффективность обучения: Он поддерживает несколько задач компьютерного зрения, включая обнаружение объектов, сегментацию экземпляров и классификацию изображений. Процесс обучения эффективен, с легкодоступными предварительно обученными весами и более низкими требованиями к памяти по сравнению с более сложными архитектурами.
Слабые стороны YOLOv5
- Пределы точности: Несмотря на высокую точность, новые модели превзошли его показатели mAP в стандартных тестах, таких как COCO.
- Дизайн на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать большей настройки для наборов данных с объектами необычной формы по сравнению с современными подходами без anchor.
Варианты использования YOLOv5
- Приложения реального времени: Идеально подходят для приложений, требующих быстрого инференса, таких как робототехника, машинное зрение дронов в приложениях компьютерного зрения в операциях ИИ с дронами и анализ видео в реальном времени.
- Развертывание на периферии (Edge Deployment): Хорошо подходит для развертывания на периферийных устройствах с ограниченными ресурсами благодаря своей эффективной конструкции и небольшим размерам моделей. Ознакомьтесь с руководствами по развертыванию NVIDIA Jetson.
- Быстрое прототипирование: Отличный выбор для быстрого прототипирования и развертывания решений для обнаружения объектов благодаря простоте использования и широкой поддержке.
YOLOv7: Высокая точность фокусировки
YOLOv7, созданный Чен-Яо Вангом, Алексеем Бочковским и Хонг-Юанем Марком Ляо, был выпущен 6 июля 2022 года. Он представил несколько архитектурных оптимизаций и стратегий обучения, известных как "trainable bag-of-freebies", направленных на расширение границ точности при сохранении скорости в реальном времени.
Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/
Архитектура и ключевые особенности YOLOv7
- E-ELAN: Использует Extended Efficient Layer Aggregation Network (E-ELAN) в backbone для повышения способности к обучению.
- Масштабирование модели: Реализует сложное масштабирование для глубины и ширины модели, чтобы оптимизировать ее для различных вычислительных ресурсов.
- Обучение с использованием вспомогательной головы: Использует вспомогательные головы во время обучения (удаляются во время инференса) для улучшения изучения признаков.
- Bag-of-Freebies: Использует передовые методы обучения для повышения точности без увеличения стоимости inference.
Сильные стороны YOLOv7
- Высокая точность: Достигает высоких показателей mAP на таких бенчмарках, как COCO, особенно с более крупными вариантами моделей.
- Эффективные методы обучения: Включает новые стратегии обучения для максимизации производительности.
Слабые стороны YOLOv7
- Сложность: Архитектура и процесс обучения могут быть более сложными по сравнению с оптимизированным подходом Ultralytics YOLOv5.
- Экосистема и поддержка: Отсутствует обширная документация, учебные пособия и интегрированная экосистема, предоставляемые Ultralytics для YOLOv5.
- Требовательность к ресурсам: Более крупные модели требуют значительных вычислительных ресурсов, что может ограничить развертывание на устройствах с ограниченными ресурсами.
Варианты использования YOLOv7
- Высокопроизводительное обнаружение: Подходит для приложений, где достижение абсолютно наивысшей точности имеет решающее значение и вычислительные ресурсы менее ограничены, например, в автономных транспортных средствах.
- Исследования: Используется в академических исследованиях, изучающих современные методы обнаружения объектов.
Производительность и техническое сравнение
Прямое сравнение YOLOv5 и YOLOv7 на наборе данных COCO выявляет ключевые различия в их профилях производительности. Модели YOLOv7 обычно достигают более высоких показателей mAP, но часто за счет повышенной сложности и требований к ресурсам. В отличие от этого, Ultralytics YOLOv5 предлагает более сбалансированный профиль, превосходно справляясь со скоростью инференса на CPU и поддерживая конкурентоспособную точность, что имеет решающее значение для многих реальных развертываний.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Заключение: какую модель вам следует выбрать?
Выбор между YOLOv5 и YOLOv7 во многом зависит от приоритетов проекта.
YOLOv7 — отличный выбор для исследователей и разработчиков, которым требуется максимально возможная точность на стандартных бенчмарках и которые имеют доступ к значительным вычислительным ресурсам. Ее инновационные методы обучения показывают, как расширить границы производительности.
Однако, для подавляющего большинства практических приложений Ultralytics YOLOv5 остается превосходным выбором. Его ключевые преимущества — простота использования, быстрое развертывание, отличный баланс скорости и точности и процветающая экосистема — делают его невероятно эффективным и надежным инструментом. Он позволяет разработчикам быстро создавать надежные решения компьютерного зрения, от первоначального прототипа до развертывания в производство.
Кроме того, экосистема Ultralytics продолжает развиваться. Новые модели, такие как YOLOv8 и YOLO11, построены на основе YOLOv5, предлагая еще лучшую производительность и большую универсальность в таких задачах, как сегментация, оценка позы и отслеживание. Для разработчиков, ищущих современную, перспективную и удобную платформу, семейство Ultralytics YOLO предоставляет наиболее убедительное и комплексное решение.
Изучите другие модели
Если вы изучаете модели обнаружения объектов, вам также могут быть интересны следующие сравнения:
- YOLOv5 против YOLOv8
- YOLOv5 против YOLOv9
- YOLOv7 против YOLOv8
- YOLOv7 против YOLO11
- RT-DETR против YOLOv7
- Ознакомьтесь с последними моделями, такими как YOLOv10 и YOLO11.