Перейти к содержанию

YOLOv9 в сравнении с YOLOv5: подробное сравнение

На этой странице представлено техническое сравнение двух значительных моделей обнаружения объектов: YOLOv9 и Ultralytics YOLOv5. Обе модели являются частью влиятельной серии YOLO (You Only Look Once), известной балансом скорости и точности при обнаружении объектов в реальном времени. В этом сравнении рассматриваются их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящую модель для ваших проектов в области компьютерного зрения.

YOLOv9: Повышение точности с помощью новой архитектуры

YOLOv9 был представлен в феврале 2024 года, внедрив значительные архитектурные инновации в передовые методы обнаружения объектов. Он направлен на решение проблемы потери информации в глубоких нейронных сетях, что является критической задачей для обучения высокоэффективных моделей.

Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Документация: https://docs.ultralytics.com/models/yolov9/

Архитектура и инновации

YOLOv9 представляет две новаторские концепции, подробно описанные в статье «YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information»:

  • Программируемая градиентная информация (PGI): Этот новый подход разработан для решения проблемы информационного узкого места, которая возникает, когда данные проходят через слои глубокой сети. PGI гарантирует, что полная входная информация доступна для расчета функции потерь, тем самым сохраняя важные данные для более точного обновления градиентов и более эффективного обучения модели.
  • Обобщенная эффективная сеть агрегации слоев (GELAN): YOLOv9 также включает GELAN, новую сетевую архитектуру, оптимизированную для превосходного использования параметров и вычислительной эффективности. Она основана на принципах CSPNet и ELAN для создания структуры, которая обеспечивает более высокую точность при меньшем количестве параметров и вычислительных затрат (FLOPs).

Сильные стороны

  • Повышенная точность: YOLOv9 устанавливает новый передовой результат на наборе данных COCO, превосходя многие предыдущие детекторы объектов в реальном времени по средней точности (mAP).
  • Повышенная эффективность: Комбинация PGI и GELAN приводит к созданию моделей, которые не только очень точны, но и вычислительно эффективны, что делает их мощными для задач, где производительность имеет решающее значение.
  • Сохранение информации: Непосредственно устраняя информационное узкое место, PGI позволяет обучать более глубокие и сложные сети без типичного ухудшения производительности, что приводит к созданию более надежных моделей.

Слабые стороны

  • Ресурсы для обучения: Как отмечено в документации YOLOv9, обучение моделей YOLOv9 может потребовать больше ресурсов и времени по сравнению с более устоявшимися моделями, такими как YOLOv5.
  • Более новая экосистема: Являясь более новой моделью от другой исследовательской группы, она имеет менее развитую экосистему, поддержку сообщества и интеграцию со сторонними разработчиками, чем хорошо зарекомендовавшая себя Ultralytics YOLOv5.
  • Универсальность задач: Оригинальный YOLOv9 в основном ориентирован на обнаружение объектов. Ему не хватает встроенной поддержки для других задач компьютерного зрения, таких как сегментация экземпляров, классификация изображений и оценка позы, которые изначально поддерживаются в моделях Ultralytics.

Случаи использования

  • Приложения, требующие максимально возможной точности обнаружения объектов, такие как расширенная видеоаналитика и высокоточный промышленный контроль.
  • Сценарии, где вычислительная эффективность должна быть сбалансирована с первоклассной производительностью, как, например, в AI для управления дорожным движением.
  • Исследования и разработки в области передового компьютерного зрения, где приоритетом является изучение новых архитектур.

Узнайте больше о YOLOv9

Ultralytics YOLOv5: Устоявшийся и универсальный стандарт

Выпущенная в 2020 году, Ultralytics YOLOv5 быстро стала отраслевым стандартом благодаря исключительному балансу скорости, точности и простоты использования. Разработанная полностью на PyTorch, она постоянно совершенствовалась и поддерживается надежной экосистемой.

Автор: Гленн Джокер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/

Архитектура и особенности

YOLOv5 использует проверенную архитектуру, включающую CSPDarknet53 backbone и PANet neck для эффективной агрегации признаков. Его anchor-based detection head очень эффективен. Модель доступна в различных размерах (n, s, m, l, x), что позволяет разработчикам выбирать идеальный компромисс между производительностью и ограничениями ресурсов.

Сильные стороны

  • Исключительная скорость и эффективность: YOLOv5 высоко оптимизирована для быстрого вывода, что делает ее идеальной для приложений реального времени на широком спектре оборудования, от мощных GPU до периферийных устройств с ограниченными ресурсами.
  • Простота использования: YOLOv5, известный своим оптимизированным пользовательским интерфейсом, предлагает простые интерфейсы Python и CLI, а также обширную и понятную документацию.
  • Хорошо поддерживаемая экосистема: YOLOv5 выигрывает от комплексной экосистемы Ultralytics, которая включает активную разработку, большое и поддерживающее сообщество в Discord, частые обновления и мощные инструменты, такие как Ultralytics HUB, для обучения и развертывания без кода.
  • Баланс производительности: Обеспечивает надежный компромисс между скоростью инференса и точностью обнаружения, что делает ее подходящей для широкого спектра реальных сценариев развертывания.
  • Универсальность: В отличие от многих специализированных моделей, YOLOv5 поддерживает несколько задач «из коробки», включая обнаружение объектов, сегментацию экземпляров и классификацию изображений.
  • Эффективность обучения: YOLOv5 предлагает эффективные процессы обучения, легкодоступные предварительно обученные веса и, как правило, более низкие требования к памяти по сравнению со многими другими архитектурами, особенно моделями на основе трансформеров.

Слабые стороны

  • Пиковая точность: Будучи весьма точными для своего времени, новые модели, такие как YOLOv9, могут достигать более высоких показателей mAP на эталонных тестах, таких как COCO.
  • Дизайн на основе Anchor: Он опирается на предопределенные anchor boxes, что может потребовать большей настройки для наборов данных с объектами необычной формы по сравнению с современными подходами без anchor.

Случаи использования

Узнайте больше о YOLOv5

Производительность и тесты: YOLOv9 против YOLOv5

Сравнение производительности YOLOv9 и YOLOv5 подчеркивает прогресс в архитектуре моделей за эти годы. Модели YOLOv9 стабильно достигают более высоких показателей mAP, чем их аналоги YOLOv5, часто с более эффективным использованием параметров и FLOPs на более высоком уровне. Например, YOLOv9-C достигает 53,0% mAP с 25,3 млн параметров, превосходя 50,7% mAP YOLOv5x с 86,7 млн параметров.

Тем не менее, YOLOv5 превосходит по скорости, особенно ее меньшие варианты, такие как YOLOv5n и YOLOv5s, которые предлагают чрезвычайно быстрое время инференса как на CPU, так и на GPU, что делает их непревзойденными для многих периферийных приложений реального времени.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Заключение: какую модель вам следует выбрать?

Выбор между YOLOv9 и YOLOv5 во многом зависит от конкретных потребностей вашего проекта.

  • YOLOv9 — превосходный выбор для приложений, где максимальная точность является основной целью, и у вас достаточно вычислительных ресурсов для обучения. Ее инновационная архитектура делает ее идеальной для расширения границ производительности обнаружения объектов в специализированных областях.

  • Ultralytics YOLOv5 остается более практичным и универсальным вариантом для более широкого спектра приложений. Ее ключевые преимущества — простота использования, скорость, поддержка нескольких задач и зрелая, хорошо поддерживаемая экосистема — делают ее предпочтительной моделью для разработчиков, которым необходимо быстро и эффективно создавать надежные решения для реального мира. Для проектов, требующих развертывания на периферийных устройствах или баланса между скоростью и точностью, YOLOv5 часто является оптимальным выбором.

Для тех, кто ищет золотую середину или даже более продвинутые функции, Ultralytics предлагает полный набор моделей. Рекомендуем изучить YOLOv8, которая сочетает в себе многие преимущества YOLOv5 с точки зрения удобства использования с безанкерной архитектурой и еще большей универсальностью, или новейшую YOLO11 для современной производительности в экосистеме Ultralytics. Дополнительные сравнения можно найти на нашей странице сравнения моделей.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии