Перейти к содержанию

YOLOv9 против YOLOv7: подробное техническое сравнение

При выборе модели YOLO для обнаружения объектов крайне важно понимать нюансы между различными версиями. На этой странице представлено подробное техническое сравнение YOLOv7 и YOLOv9, двух значимых моделей в серии YOLO, разработанных исследователями из Института информатики, Academia Sinica, Тайвань. Мы рассмотрим их архитектурные инновации, показатели производительности и пригодность для различных приложений, чтобы помочь вам принять обоснованное решение для ваших проектов в области компьютерного зрения.

YOLOv9: Programmable Gradient Information для расширенного обучения

YOLOv9, представленная в феврале 2024 года, представляет собой значительный шаг вперед в решении проблемы потери информации в глубоких нейронных сетях, распространенной проблемы, которая может ухудшить производительность модели.

Авторы: Чен-Яо Ванг и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Документация: https://docs.ultralytics.com/models/yolov9/

Архитектура и ключевые особенности

YOLOv9 представляет новые концепции для улучшения потока информации и эффективности обучения, что отличает его от предшественников.

  • Программируемая градиентная информация (PGI): Это основное новшество YOLOv9. Оно решает проблему информационного узкого места в глубоких сетях, генерируя надежные градиенты через вспомогательные обратимые ветви. Это гарантирует, что важная информация сохраняется на всех слоях, что приводит к более эффективному обучению модели и повышению конечной точности.
  • Обобщенная эффективная сеть агрегации слоев (GELAN): YOLOv9 имеет новую сетевую архитектуру, которая оптимизирует использование параметров и вычислительную эффективность. GELAN — это легкая архитектура, основанная на планировании градиентного пути, которая опирается на успехи таких разработок, как CSPNet, которая сыграла важную роль в моделях, таких как YOLOv5.

Сильные стороны

  • Повышенная точность: Комбинация PGI и GELAN обеспечивает превосходное извлечение признаков и более высокие показатели средней точности (mAP) по сравнению с YOLOv7, особенно заметные в более крупных вариантах моделей.
  • Повышенная эффективность: YOLOv9 достигает лучшей точности с меньшим количеством параметров и вычислений (FLOPs), чем YOLOv7. Например, YOLOv9-C достигает аналогичного mAP с YOLOv7x с на 66% меньшим количеством параметров и на 46% меньшим количеством FLOPs.
  • Современный уровень: Представляет собой последние инновации от оригинальных авторов YOLO, расширяя границы возможного в обнаружении объектов в реальном времени.

Слабые стороны

  • Вычислительные требования: Несмотря на эффективность с точки зрения точности, продвинутая архитектура, особенно более крупные варианты, такие как YOLOv9-E, все еще может требовать значительных вычислительных ресурсов для обучения и развертывания.
  • Более новая модель: Будучи более новым релизом, поддержка сообщества и доступные руководства по развертыванию могут быть менее обширными, чем для хорошо зарекомендовавшей себя YOLOv7. Однако, реализация Ultralytics YOLOv9 смягчает это, предоставляя оптимизированную, хорошо документированную и поддерживаемую среду.

Случаи использования

YOLOv9 идеально подходит для приложений, требующих высочайшей точности и эффективности, где критически важно точное обнаружение объектов.

Узнайте больше о YOLOv9

YOLOv7: Оптимизировано для скорости и эффективности

YOLOv7, выпущенная в июле 2022 года, стала знаковой моделью, нацеленной на значительную оптимизацию компромисса между скоростью и точностью для инференса в реальном времени.

Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/

Архитектура и ключевые особенности

YOLOv7 был сосредоточен на оптимизации архитектуры и процесса обучения, чтобы сделать модели быстрее и точнее без увеличения стоимости вывода.

  • Расширенная сеть агрегации эффективных слоев (E-ELAN): Этот архитектурный блок повышает способность сети к обучению, позволяя ей изучать более разнообразные признаки, улучшая производительность, не нарушая исходный путь градиента.
  • Масштабирование модели: YOLOv7 представила методы сложного масштабирования для глубины и ширины модели, что позволяет эффективно оптимизировать ее для различных размеров моделей и вычислительных ресурсов.
  • Обучаемый набор бесплатных улучшений: Эта концепция включает в себя различные методы оптимизации во время обучения, такие как расширенная аугментация данных и стратегии назначения меток. Эти методы повышают точность, не добавляя никаких вычислительных затрат во время вывода.

Сильные стороны

  • Высокая скорость инференса: YOLOv7 высоко оптимизирована для скорости и остается одним из самых быстрых детекторов объектов, что делает ее превосходной для приложений реального времени на различном оборудовании.
  • Высокая производительность: Он достигает конкурентоспособных показателей mAP, что делает его надежным и мощным выбором для многих стандартных задач обнаружения объектов.
  • Устоявшаяся модель: Будучи доступной дольше, YOLOv7 выигрывает от более широкого распространения, обширных ресурсов сообщества и множества проверенных примеров развертывания в различных отраслях.

Слабые стороны

  • Более низкая пиковая точность: Будучи быстрой, она может демонстрировать несколько более низкую пиковую точность по сравнению с более новой YOLOv9 в сложных сценариях со сложными объектами.
  • На основе Anchor: Использует предопределенные anchor boxes, что иногда может быть менее гибким, чем подходы без anchor, для обнаружения объектов с необычными пропорциями.

Случаи использования

YOLOv7 хорошо подходит для приложений, где скорость inference является наиболее важным фактором.

  • Анализ видео и видеонаблюдение в реальном времени на периферийных устройствах с ИИ.
  • Высокопроизводительные системы, такие как контроль качества на быстро движущейся производственной линии.
  • Быстрое прототипирование систем обнаружения объектов, где важна скорость развертывания.

Узнайте больше о YOLOv7

Производительность и эффективность: прямое сравнение

Основное различие между YOLOv9 и YOLOv7 заключается в компромиссе между точностью, размером модели и вычислительными затратами. YOLOv9 расширяет границы эффективности, обеспечивая более высокую точность с меньшим количеством параметров и FLOPs. Например, YOLOv9-M достигает тех же 51.4% mAP, что и YOLOv7l, но с на 46% меньшим количеством параметров и на 27% меньшим количеством FLOPs. Эта тенденция сохраняется и в большем масштабе, где YOLOv9-E устанавливает новый уровень с 55.6% mAP, превосходя все варианты YOLOv7.

Такое повышение эффективности означает, что для достижения заданной точности YOLOv9 предлагает меньшую, более быструю и энергоэффективную модель.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Заключение: какая модель подходит именно вам?

YOLOv7 и YOLOv9 — это мощные модели, но они служат разным потребностям.

  • Выбирайте YOLOv9, если ваше приложение требует максимально возможной точности и эффективности. Его архитектурные достижения делают его превосходным для сложных сцен и развертываний с ограниченными ресурсами, где вам нужна максимальная производительность от меньшей модели.

  • Выбирайте YOLOv7, если вам нужна проверенная в боях, чрезвычайно быстрая модель для стандартных приложений реального времени и вы предпочитаете работать с более устоявшейся архитектурой с огромными ресурсами сообщества.

Для разработчиков и исследователей, ищущих наилучшие возможности, мы рекомендуем использовать эти модели в экосистеме Ultralytics. Новые модели, такие как Ultralytics YOLOv8 и YOLO11, не только предлагают конкурентоспособную производительность, но и обладают значительными преимуществами:

  • Простота использования: Оптимизированный пользовательский опыт с простым Python API и подробной документацией.
  • Хорошо поддерживаемая экосистема: Активная разработка, сильная поддержка сообщества и интеграция с такими инструментами, как Ultralytics HUB для обучения и развертывания без кода.
  • Универсальность: Поддержка нескольких задач, помимо обнаружения, включая сегментацию экземпляров, оценку позы и классификацию, и все это в рамках единой структуры.
  • Эффективность обучения: Эффективные процессы обучения с готовыми предварительно обученными весами и меньшими требованиями к памяти по сравнению со многими другими типами моделей.

Изучите другие модели

Для дальнейших сравнений рассмотрите возможность изучения других современных моделей, доступных в документации Ultralytics:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии