Перейти к содержанию

YOLO против YOLOv9: подробное техническое сравнение

Выбор оптимальной модели обнаружения объектов очень важен для задач компьютерного зрения, поскольку различные модели обладают уникальными преимуществами в точности, скорости и эффективности. На этой странице представлено техническое сравнение YOLO и YOLOv9, двух передовых моделей в данной области. Мы анализируем их архитектуру, эталоны производительности и подходящие приложения, чтобы помочь вам в выборе модели.

DAMO-YOLO

YOLO представлен компанией Alibaba Group в ноябре 2022 года(arXiv). В ней особое внимание уделяется балансу между скоростью и точностью, используются магистрали с нейронной архитектурой поиска (NAS) и эффективные сетевые компоненты.

Архитектура и особенности

Архитектура YOLO отличается несколькими ключевыми инновациями:

  • Магистраль NAS: Используется магистраль, оптимизированная с помощью нейронной архитектуры поиска для эффективного извлечения функций.
  • RepGFPN: Использует эффективную репараметризованную градиентную сеть пирамид признаков (GFPN) для объединения признаков.
  • ZeroHead: облегченная головка обнаружения, разработанная для снижения вычислительных затрат.
  • AlignedOTA: Реализует выровненное оптимальное назначение транспорта (OTA) для улучшения назначения меток во время обучения.
  • Улучшение дистилляции: Использует методы дистилляции знаний для повышения производительности.

Показатели производительности

YOLO предлагает модели различных размеров (крошечные, маленькие, средние, большие) для удовлетворения различных вычислительных потребностей. Ключевые показатели производительности включают:

  • mAP: Достижение конкурентоспособной средней точности (mAP) на таких наборах данных, как COCO.
  • Скорость вывода: Разработан для быстрого вывода, подходит для задач обнаружения объектов в реальном времени.
  • Размер модели: Доступны различные размеры, что обеспечивает гибкость развертывания.

Сильные и слабые стороны

Сильные стороны:

  • Высокая точность и скорость: баланс между точностью и скоростью вывода.
  • Инновационная архитектура: Включает в себя NAS и эффективные компоненты для оптимизации производительности.
  • Адаптивность: Предлагает модели разных размеров для различных условий применения.

Слабые стороны:

  • Сложность: Усовершенствованная архитектура может быть более сложной для настройки или модификации по сравнению с более простыми моделями.
  • Ограниченная документация: Документация может быть менее обширной по сравнению с более распространенными моделями, такими как серия YOLO (GitHub README).

Примеры использования

YOLO хорошо подходит для приложений, требующих сочетания точности и скорости, таких как:

  • Наблюдение в реальном времени: Системы безопасности и мониторинга, где своевременное обнаружение имеет решающее значение.
  • Робототехника: Приложения в робототехнике, требующие эффективного и точного восприятия.
  • Промышленный контроль: Автоматизированные процессы контроля качества на производстве.

Узнайте больше о YOLO

YOLOv9

YOLOv9 - это новейшая серия YOLO , представленная в феврале 2024 года(arXiv) исследователями из Института информационных наук, Academia Sinica, Тайвань. YOLOv9 фокусируется на решении проблемы потери информации в глубоких сетях для повышения точности и эффективности.

Архитектура и особенности

YOLOv9 представляет инновационные методы для преодоления ограничений в моделях глубокого обучения:

  • Программируемая градиентная информация (PGI): Ключевая инновация, позволяющая сохранять важную информацию во всей сети и смягчать ее потерю.
  • Обобщенная эффективная сеть агрегирования слоев (GELAN): Использует GELAN для эффективных вычислений и использования параметров.
  • Усовершенствования основы и головки: Усовершенствование основы и головки обнаружения для лучшего извлечения и обнаружения признаков.

Показатели производительности

YOLOv9 демонстрирует передовую производительность в обнаружении объектов в реальном времени:

  • mAP: Достигает высоких показателей mAP на эталонных наборах данных, таких как COCO, превосходя предыдущие модели.
  • Скорость вывода: Поддерживает впечатляющую скорость вывода, подходящую для приложений реального времени.
  • Размер модели: Предлагает различные размеры моделей (крошечные, маленькие, средние и т.д.) с разным количеством параметров и FLOP'ов.

Сильные и слабые стороны

Сильные стороны:

  • Современная точность: Достигает высочайшей точности по сравнению со многими детекторами объектов в реальном времени.
  • Эффективный дизайн: PGI и GELAN способствуют повышению эффективности и снижению вычислительных затрат.
  • Универсальность: Возможность адаптации к различным задачам обнаружения объектов и сценариям развертывания.
  • Интеграция сUltralytics : Простота использования благодаряпакету Ultralytics Python и исчерпывающей документации.

Слабые стороны:

  • Новая модель: Поскольку это новая модель, поддержка сообщества и доступные ресурсы могут еще расти по сравнению с более устоявшимися моделями.
  • Вычислительная потребность: Большие модели YOLOv9 могут потребовать значительных вычислительных ресурсов.

Примеры использования

YOLOv9 идеально подходит для приложений, требующих высочайшей точности и обработки данных в режиме реального времени:

  • Передовые системы помощи водителю (ADAS): Самоуправляемые автомобили и автономные системы, требующие точного обнаружения объектов.
  • Анализ изображений высокого разрешения: Области применения, в которых необходимо детальное и точное обнаружение на изображениях высокого разрешения, например, анализ спутниковых снимков.
  • Промышленная автоматизация: Сложные задачи автоматизации, требующие высокой точности и надежности.

Узнайте больше о YOLOv9

Сравнительная таблица моделей

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

И YOLO , и YOLOv9 представляют собой значительные достижения в области обнаружения объектов. YOLO предлагает сильный баланс скорости и точности благодаря эффективной архитектуре, а YOLOv9 расширяет границы точности благодаря инновационным технологиям PGI и GELAN. Ваш выбор будет зависеть от конкретных потребностей вашего приложения, будь то приоритет передовой точности или хорошо продуманный профиль производительности.

Пользователям также может быть интересно сравнить эти модели с другими вариантами YOLO , такими как YOLOv8, YOLOv7, YOLOv5, и YOLO11а также такие модели, как YOLOX, RT-DETRи PP-YOLOE для дальнейшего изучения моделей обнаружения объектов.

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии