YOLOv9 против YOLOv5: подробное сравнение
На этой странице представлено техническое сравнение YOLOv9 и YOLOv5, двух популярных моделей серии YOLO , с упором на их возможности обнаружения объектов. Мы подробно рассмотрим их архитектурные различия, показатели производительности, методики обучения и подходящие случаи использования, чтобы помочь вам выбрать подходящую модель для ваших задач компьютерного зрения.
YOLOv9: программируемая информация о градиенте
YOLOv9, представленная в феврале 2024 года Чиен-Яо Вангом и Хонг-Юаном Марком Ляо из Института информационных наук Академии Синика (Тайвань), представляет собой значительное достижение в области обнаружения объектов в реальном времени. Модель подробно описана в их статье"YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information", а код доступен на GitHub.
Архитектура и инновации: В YOLOv9 представлены две ключевые инновации: Программируемая градиентная информация (PGI) и обобщенная эффективная сеть агрегирования слоев (GELAN). PGI решает проблему потери информации в глубоких сетях, позволяя модели обучаться более эффективно, а GELAN оптимизирует архитектуру сети для улучшения использования параметров и вычислительной эффективности. Такое сочетание позволяет повысить точность без пропорционального увеличения вычислительных затрат.
Производительность: YOLOv9 достигает передовых результатов на наборе данных MS COCO, демонстрируя превосходную точность и эффективность по сравнению с предыдущими версиями YOLO и другими детекторами объектов в реальном времени. Например, YOLOv9c достигает 53,0 mAPval50-95 при 25,3M параметрах.
Примеры использования: YOLOv9 идеально подходит для приложений, требующих высокой точности и эффективности, таких как:
- Высокоточное обнаружение объектов: Сценарии, в которых точность имеет первостепенное значение, например, автономное вождение, передовое наблюдение и роботизированное зрение.
- Среды с ограниченными ресурсами: Хотя обучение требует больше ресурсов, чем YOLOv5, эффективная архитектура позволяет развертывать систему на пограничных устройствах с оптимизированной скоростью вывода.
Сильные стороны:
- Высокая точность: Обеспечивает превосходные показатели mAP, особенно в таких моделях, как YOLOv9e.
- Эффективный дизайн: GELAN и PGI способствуют улучшению параметров и вычислительной эффективности по сравнению с предыдущими моделями с аналогичной точностью.
Слабые стороны:
- Более высокая потребность в ресурсах для обучения: Обучение моделей YOLOv9 требует больше вычислительных ресурсов и времени по сравнению с YOLOv5.
- Относительно новая модель: Поскольку это более новая модель, сообщество и документация все еще развиваются по сравнению с более известной YOLOv5.
YOLOv5: универсальность и скорость
Ultralytics YOLOv5, автором которой является Гленн Джочер и которая была выпущена в июне 2020 года, славится своей скоростью, простотой использования и универсальностью. Несмотря на отсутствие конкретной статьи arXiv, подробная информация доступна в документацииUltralytics YOLOv5 и в репозитории GitHub.
Архитектура и особенности: YOLOv5 построен с упором на скорость и доступность, используя такие архитектуры, как CSP Bottleneck и PANet. Он предлагает ряд размеров моделей (YOLOv5n, s, m, l, x) для удовлетворения различных вычислительных бюджетов и потребностей в производительности. YOLOv5 реализован в PyTorch, что делает его удобным для пользователя и легко адаптируемым.
Производительность: YOLOv5 обеспечивает баланс между скоростью и точностью, что делает его пригодным для широкого спектра реальных приложений. YOLOv5s, небольшой вариант, достигает 37,4 mAPval50-95 при высокой скорости вычислений.
Примеры использования: YOLOv5 исключительно универсален и хорошо подходит для сценариев, в которых важны скорость и простота развертывания:
- Приложения реального времени: Идеально подходит для приложений, требующих быстрого вывода, таких как обработка видео в реальном времени, робототехника и видение беспилотников.
- Развертывание на границе: Меньшие модели (YOLOv5n, YOLOv5s) хорошо подходят для развертывания на пограничных устройствах и мобильных платформах благодаря более низким вычислительным требованиям.
- Быстрое создание прототипов и разработка: Простота использования и обширная документация делают YOLOv5 отличным решением для быстрых циклов разработки и образовательных целей.
Сильные стороны:
- Высокая скорость: Обеспечивает высокую скорость вычислений, особенно при использовании небольших вариантов моделей.
- Простота использования: Хорошо документирован, имеет большое и активное сообщество, что делает его простым в использовании и внедрении.
- Универсальность: Выпускается в нескольких размерах и подходит для решения различных задач, включая обнаружение, сегментацию и классификацию.
Слабые стороны:
- Более низкая точность по сравнению с YOLOv9: как правило, модели YOLOv5 не достигают такого же уровня точности, как новейшая модель YOLOv9, особенно в сложных сценариях.
- Архитектура менее инновационная, чем у YOLOv9: Несмотря на свою эффективность, архитектура не включает в себя инновации PGI и GELAN, присутствующие в YOLOv9.
Модель | размер(пиксели) | mAPval50-95 | СкоростьCPU ONNX(мс) | СкоростьT4ТензорRT10(мс) | params(M) | FLOPs(B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Заключение
Выбор между YOLOv9 и YOLOv5 зависит от приоритетов вашего проекта. Если точность имеет первостепенное значение и имеются ресурсы для обучения, YOLOv9 - лучший выбор. Для приложений, в которых приоритетом является скорость, простота использования и гибкость развертывания, особенно на пограничных устройствах, YOLOv5 остается отличным и широко распространенным вариантом.
Для пользователей, заинтересованных в изучении других моделей, Ultralytics также предлагает YOLOv8, YOLOv7, YOLOv6 и недавно выпущенную YOLO11, каждая из которых имеет свои сильные стороны и оптимизации. Изучите документацию по моделямUltralytics Models, чтобы ознакомиться с полным набором возможностей.