YOLOv9 против YOLOv7: подробное техническое сравнение
При выборе модели YOLO для обнаружения объектов крайне важно понимать нюансы между различными версиями. На этой странице представлено подробное техническое сравнение YOLOv7 и YOLOv9, двух значимых моделей в серии YOLO, разработанных исследователями из Института информатики, Academia Sinica, Тайвань. Мы рассмотрим их архитектурные инновации, показатели производительности и пригодность для различных приложений, чтобы помочь вам принять обоснованное решение для ваших проектов в области компьютерного зрения.
YOLOv9: Programmable Gradient Information для расширенного обучения
YOLOv9, представленная в феврале 2024 года, представляет собой значительный шаг вперед в решении проблемы потери информации в глубоких нейронных сетях, распространенной проблемы, которая может ухудшить производительность модели.
Авторы: Чен-Яо Ванг и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Документация: https://docs.ultralytics.com/models/yolov9/
Архитектура и ключевые особенности
YOLOv9 представляет новые концепции для улучшения потока информации и эффективности обучения, что отличает его от предшественников.
- Программируемая градиентная информация (PGI): Это основное новшество YOLOv9. Оно решает проблему информационного узкого места в глубоких сетях, генерируя надежные градиенты через вспомогательные обратимые ветви. Это гарантирует, что важная информация сохраняется на всех слоях, что приводит к более эффективному обучению модели и повышению конечной точности.
- Обобщенная эффективная сеть агрегации слоев (GELAN): YOLOv9 имеет новую сетевую архитектуру, которая оптимизирует использование параметров и вычислительную эффективность. GELAN — это легкая архитектура, основанная на планировании градиентного пути, которая опирается на успехи таких разработок, как CSPNet, которая сыграла важную роль в моделях, таких как YOLOv5.
Сильные стороны
- Повышенная точность: Комбинация PGI и GELAN обеспечивает превосходное извлечение признаков и более высокие показатели средней точности (mAP) по сравнению с YOLOv7, особенно заметные в более крупных вариантах моделей.
- Повышенная эффективность: YOLOv9 достигает лучшей точности с меньшим количеством параметров и вычислений (FLOPs), чем YOLOv7. Например, YOLOv9-C достигает аналогичного mAP с YOLOv7x с на 66% меньшим количеством параметров и на 46% меньшим количеством FLOPs.
- Современный уровень: Представляет собой последние инновации от оригинальных авторов YOLO, расширяя границы возможного в обнаружении объектов в реальном времени.
Слабые стороны
- Вычислительные требования: Несмотря на эффективность с точки зрения точности, продвинутая архитектура, особенно более крупные варианты, такие как YOLOv9-E, все еще может требовать значительных вычислительных ресурсов для обучения и развертывания.
- Более новая модель: Будучи более новым релизом, поддержка сообщества и доступные руководства по развертыванию могут быть менее обширными, чем для хорошо зарекомендовавшей себя YOLOv7. Однако, реализация Ultralytics YOLOv9 смягчает это, предоставляя оптимизированную, хорошо документированную и поддерживаемую среду.
Случаи использования
YOLOv9 идеально подходит для приложений, требующих высочайшей точности и эффективности, где критически важно точное обнаружение объектов.
- Сложные задачи обнаружения в автономных транспортных средствах и робототехнике.
- Продвинутые системы безопасности, требующие точного обнаружения небольших или перекрытых объектов.
- Приложения в анализе медицинских изображений, где высокая точность является обязательным условием.
YOLOv7: Оптимизировано для скорости и эффективности
YOLOv7, выпущенная в июле 2022 года, стала знаковой моделью, нацеленной на значительную оптимизацию компромисса между скоростью и точностью для инференса в реальном времени.
Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/
Архитектура и ключевые особенности
YOLOv7 был сосредоточен на оптимизации архитектуры и процесса обучения, чтобы сделать модели быстрее и точнее без увеличения стоимости вывода.
- Расширенная сеть агрегации эффективных слоев (E-ELAN): Этот архитектурный блок повышает способность сети к обучению, позволяя ей изучать более разнообразные признаки, улучшая производительность, не нарушая исходный путь градиента.
- Масштабирование модели: YOLOv7 представила методы сложного масштабирования для глубины и ширины модели, что позволяет эффективно оптимизировать ее для различных размеров моделей и вычислительных ресурсов.
- Обучаемый набор бесплатных улучшений: Эта концепция включает в себя различные методы оптимизации во время обучения, такие как расширенная аугментация данных и стратегии назначения меток. Эти методы повышают точность, не добавляя никаких вычислительных затрат во время вывода.
Сильные стороны
- Высокая скорость инференса: YOLOv7 высоко оптимизирована для скорости и остается одним из самых быстрых детекторов объектов, что делает ее превосходной для приложений реального времени на различном оборудовании.
- Высокая производительность: Он достигает конкурентоспособных показателей mAP, что делает его надежным и мощным выбором для многих стандартных задач обнаружения объектов.
- Устоявшаяся модель: Будучи доступной дольше, YOLOv7 выигрывает от более широкого распространения, обширных ресурсов сообщества и множества проверенных примеров развертывания в различных отраслях.
Слабые стороны
- Более низкая пиковая точность: Будучи быстрой, она может демонстрировать несколько более низкую пиковую точность по сравнению с более новой YOLOv9 в сложных сценариях со сложными объектами.
- На основе Anchor: Использует предопределенные anchor boxes, что иногда может быть менее гибким, чем подходы без anchor, для обнаружения объектов с необычными пропорциями.
Случаи использования
YOLOv7 хорошо подходит для приложений, где скорость inference является наиболее важным фактором.
- Анализ видео и видеонаблюдение в реальном времени на периферийных устройствах с ИИ.
- Высокопроизводительные системы, такие как контроль качества на быстро движущейся производственной линии.
- Быстрое прототипирование систем обнаружения объектов, где важна скорость развертывания.
Производительность и эффективность: прямое сравнение
Основное различие между YOLOv9 и YOLOv7 заключается в компромиссе между точностью, размером модели и вычислительными затратами. YOLOv9 расширяет границы эффективности, обеспечивая более высокую точность с меньшим количеством параметров и FLOPs. Например, YOLOv9-M достигает тех же 51.4% mAP, что и YOLOv7l, но с на 46% меньшим количеством параметров и на 27% меньшим количеством FLOPs. Эта тенденция сохраняется и в большем масштабе, где YOLOv9-E устанавливает новый уровень с 55.6% mAP, превосходя все варианты YOLOv7.
Такое повышение эффективности означает, что для достижения заданной точности YOLOv9 предлагает меньшую, более быструю и энергоэффективную модель.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Заключение: какая модель подходит именно вам?
YOLOv7 и YOLOv9 — это мощные модели, но они служат разным потребностям.
-
Выбирайте YOLOv9, если ваше приложение требует максимально возможной точности и эффективности. Его архитектурные достижения делают его превосходным для сложных сцен и развертываний с ограниченными ресурсами, где вам нужна максимальная производительность от меньшей модели.
-
Выбирайте YOLOv7, если вам нужна проверенная в боях, чрезвычайно быстрая модель для стандартных приложений реального времени и вы предпочитаете работать с более устоявшейся архитектурой с огромными ресурсами сообщества.
Для разработчиков и исследователей, ищущих наилучшие возможности, мы рекомендуем использовать эти модели в экосистеме Ultralytics. Новые модели, такие как Ultralytics YOLOv8 и YOLO11, не только предлагают конкурентоспособную производительность, но и обладают значительными преимуществами:
- Простота использования: Оптимизированный пользовательский опыт с простым Python API и подробной документацией.
- Хорошо поддерживаемая экосистема: Активная разработка, сильная поддержка сообщества и интеграция с такими инструментами, как Ultralytics HUB для обучения и развертывания без кода.
- Универсальность: Поддержка нескольких задач, помимо обнаружения, включая сегментацию экземпляров, оценку позы и классификацию, и все это в рамках единой структуры.
- Эффективность обучения: Эффективные процессы обучения с готовыми предварительно обученными весами и меньшими требованиями к памяти по сравнению со многими другими типами моделей.
Изучите другие модели
Для дальнейших сравнений рассмотрите возможность изучения других современных моделей, доступных в документации Ultralytics:
- YOLOv5 против YOLOv9
- YOLOv8 vs. YOLOv9
- YOLOv10 против YOLOv9
- YOLO11 против YOLOv9
- RT-DETR против YOLOv9