YOLO против YOLOv9: подробное техническое сравнение
Выбор оптимальной модели обнаружения объектов очень важен для задач компьютерного зрения, поскольку различные модели обладают уникальными преимуществами в точности, скорости и эффективности. На этой странице представлено техническое сравнение YOLO и YOLOv9, двух передовых моделей в данной области. Мы анализируем их архитектуру, эталоны производительности и подходящие приложения, чтобы помочь вам в выборе модели.
DAMO-YOLO
YOLO представлен компанией Alibaba Group в ноябре 2022 года(arXiv). В ней особое внимание уделяется балансу между скоростью и точностью, используются магистрали с нейронной архитектурой поиска (NAS) и эффективные сетевые компоненты.
Архитектура и особенности
Архитектура YOLO отличается несколькими ключевыми инновациями:
- Магистраль NAS: Используется магистраль, оптимизированная с помощью нейронной архитектуры поиска для эффективного извлечения функций.
- RepGFPN: Использует эффективную репараметризованную градиентную сеть пирамид признаков (GFPN) для объединения признаков.
- ZeroHead: облегченная головка обнаружения, разработанная для снижения вычислительных затрат.
- AlignedOTA: Реализует выровненное оптимальное назначение транспорта (OTA) для улучшения назначения меток во время обучения.
- Улучшение дистилляции: Использует методы дистилляции знаний для повышения производительности.
Показатели производительности
YOLO предлагает модели различных размеров (крошечные, маленькие, средние, большие) для удовлетворения различных вычислительных потребностей. Ключевые показатели производительности включают:
- mAP: Достижение конкурентоспособной средней точности (mAP) на таких наборах данных, как COCO.
- Скорость вывода: Разработан для быстрого вывода, подходит для задач обнаружения объектов в реальном времени.
- Размер модели: Доступны различные размеры, что обеспечивает гибкость развертывания.
Сильные и слабые стороны
Сильные стороны:
- Высокая точность и скорость: баланс между точностью и скоростью вывода.
- Инновационная архитектура: Включает в себя NAS и эффективные компоненты для оптимизации производительности.
- Адаптивность: Предлагает модели разных размеров для различных условий применения.
Слабые стороны:
- Сложность: Усовершенствованная архитектура может быть более сложной для настройки или модификации по сравнению с более простыми моделями.
- Ограниченная документация: Документация может быть менее обширной по сравнению с более распространенными моделями, такими как серия YOLO (GitHub README).
Примеры использования
YOLO хорошо подходит для приложений, требующих сочетания точности и скорости, таких как:
- Наблюдение в реальном времени: Системы безопасности и мониторинга, где своевременное обнаружение имеет решающее значение.
- Робототехника: Приложения в робототехнике, требующие эффективного и точного восприятия.
- Промышленный контроль: Автоматизированные процессы контроля качества на производстве.
YOLOv9
YOLOv9 - это новейшая серия YOLO , представленная в феврале 2024 года(arXiv) исследователями из Института информационных наук, Academia Sinica, Тайвань. YOLOv9 фокусируется на решении проблемы потери информации в глубоких сетях для повышения точности и эффективности.
Архитектура и особенности
YOLOv9 представляет инновационные методы для преодоления ограничений в моделях глубокого обучения:
- Программируемая градиентная информация (PGI): Ключевая инновация, позволяющая сохранять важную информацию во всей сети и смягчать ее потерю.
- Обобщенная эффективная сеть агрегирования слоев (GELAN): Использует GELAN для эффективных вычислений и использования параметров.
- Усовершенствования основы и головки: Усовершенствование основы и головки обнаружения для лучшего извлечения и обнаружения признаков.
Показатели производительности
YOLOv9 демонстрирует передовую производительность в обнаружении объектов в реальном времени:
- mAP: Достигает высоких показателей mAP на эталонных наборах данных, таких как COCO, превосходя предыдущие модели.
- Скорость вывода: Поддерживает впечатляющую скорость вывода, подходящую для приложений реального времени.
- Размер модели: Предлагает различные размеры моделей (крошечные, маленькие, средние и т.д.) с разным количеством параметров и FLOP'ов.
Сильные и слабые стороны
Сильные стороны:
- Современная точность: Достигает высочайшей точности по сравнению со многими детекторами объектов в реальном времени.
- Эффективный дизайн: PGI и GELAN способствуют повышению эффективности и снижению вычислительных затрат.
- Универсальность: Возможность адаптации к различным задачам обнаружения объектов и сценариям развертывания.
- Интеграция сUltralytics : Простота использования благодаряпакету Ultralytics Python и исчерпывающей документации.
Слабые стороны:
- Новая модель: Поскольку это новая модель, поддержка сообщества и доступные ресурсы могут еще расти по сравнению с более устоявшимися моделями.
- Вычислительная потребность: Большие модели YOLOv9 могут потребовать значительных вычислительных ресурсов.
Примеры использования
YOLOv9 идеально подходит для приложений, требующих высочайшей точности и обработки данных в режиме реального времени:
- Передовые системы помощи водителю (ADAS): Самоуправляемые автомобили и автономные системы, требующие точного обнаружения объектов.
- Анализ изображений высокого разрешения: Области применения, в которых необходимо детальное и точное обнаружение на изображениях высокого разрешения, например, анализ спутниковых снимков.
- Промышленная автоматизация: Сложные задачи автоматизации, требующие высокой точности и надежности.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
И YOLO , и YOLOv9 представляют собой значительные достижения в области обнаружения объектов. YOLO предлагает сильный баланс скорости и точности благодаря эффективной архитектуре, а YOLOv9 расширяет границы точности благодаря инновационным технологиям PGI и GELAN. Ваш выбор будет зависеть от конкретных потребностей вашего приложения, будь то приоритет передовой точности или хорошо продуманный профиль производительности.
Пользователям также может быть интересно сравнить эти модели с другими вариантами YOLO , такими как YOLOv8, YOLOv7, YOLOv5, и YOLO11а также такие модели, как YOLOX, RT-DETRи PP-YOLOE для дальнейшего изучения моделей обнаружения объектов.