Перейти к содержанию

YOLOv9 против YOLOv6-3.0: подробное техническое сравнение

Выбор оптимальной модели обнаружения объектов — критически важное решение для любого проекта компьютерного зрения, напрямую влияющее на производительность, скорость и возможность развертывания. На этой странице представлено углубленное техническое сравнение между YOLOv9, современной моделью, известной своей точностью и эффективностью, и YOLOv6-3.0, моделью, разработанной для высокоскоростных промышленных приложений. Мы рассмотрим их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для ваших нужд.

YOLOv9: Современная точность и эффективность

YOLOv9 представляет собой значительный скачок вперед в обнаружении объектов в реальном времени, представленный в феврале 2024 года. Он решает фундаментальные проблемы потери информации в глубоких нейронных сетях, достигая новых высот в точности, сохраняя при этом впечатляющую эффективность.

Авторы: Чен-Яо Ванг и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Документация: https://docs.ultralytics.com/models/yolov9/

Архитектура и ключевые особенности

YOLOv9 представляет две новаторские концепции: Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). Как подробно описано в статье о YOLOv9, PGI предназначен для борьбы с потерей информации, поскольку данные проходят через слои глубокой сети, гарантируя, что модель сохраняет важную информацию о градиенте для точных обновлений. GELAN — это новая архитектура сети, которая оптимизирует использование параметров и вычислительную эффективность, позволяя YOLOv9 обеспечивать превосходную производительность без тяжелого вычислительного бремени.

При интеграции в экосистему Ultralytics YOLOv9 выигрывает от упрощенного пользовательского опыта, всеобъемлющей документации и надежной сети поддержки. Это делает его не только мощным, но и исключительно простым в обучении и развертывании.

Сильные стороны

  • Превосходная точность: Достигает самых современных показателей mAP на стандартных бенчмарках, таких как набор данных COCO, превосходя многие предыдущие модели.
  • Высокая эффективность: Архитектура GELAN обеспечивает отличную производительность с меньшим количеством параметров и FLOPs по сравнению с конкурентами, что делает ее подходящей для развертывания на периферийных AI устройствах.
  • Сохранение информации: PGI эффективно смягчает проблему информационного узкого места, распространенную в глубоких сетях, что приводит к лучшему обучению модели и более надежным обнаружениям.
  • Экосистема Ultralytics: Преимущества: активная разработка, простой API, эффективные процессы обучения с предварительно обученными весами и интеграция с Ultralytics HUB для MLOps. Он также обычно имеет более низкие требования к памяти во время обучения по сравнению с другими архитектурами.
  • Универсальность: Оригинальное исследование показывает потенциал для многозадачных возможностей, таких как сегментация экземпляров и паноптическая сегментация, что соответствует универсальному характеру моделей Ultralytics.

Слабые стороны

  • Новизна: Будучи более новой моделью, объем примеров развертывания, предоставленных сообществом, все еще растет, хотя ее интеграция в фреймворк Ultralytics ускоряет широкое распространение.

Случаи использования

YOLOv9 идеально подходит для приложений, где высокая точность является обязательным требованием:

  • Передовые системы помощи водителю (ADAS): Критически важны для точного обнаружения транспортных средств, пешеходов и препятствий в реальном времени.
  • Медицинская визуализация высокого разрешения: Подходит для детального анализа, где целостность информации является ключевым фактором для таких задач, как обнаружение опухолей.
  • Сложная промышленная автоматизация: Идеально подходит для контроля качества в производстве, где необходимо надежно выявлять небольшие дефекты.

Узнайте больше о YOLOv9

YOLOv6-3.0: оптимизирован для промышленной скорости

YOLOv6-3.0 — это итерация серии YOLOv6, разработанная Meituan, китайской технологической платформой. Выпущенный в январе 2023 года, он был разработан с особым акцентом на скорость инференса и эффективность для промышленного развертывания.

Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/

Архитектура и ключевые особенности

YOLOv6-3.0 использует аппаратный дизайн нейронной сети, оптимизируя свою архитектуру для более быстрого инференса на конкретном оборудовании, таком как GPU. Он имеет эффективный репараметризованный backbone и neck, построенный с использованием гибридных блоков для балансировки точности и скорости. Модель построена как обычная сверточная нейронная сеть (CNN) с акцентом на вычислительную эффективность.

Сильные стороны

  • Высокая скорость инференса: Архитектура сильно оптимизирована для быстрого обнаружения объектов, особенно на GPU оборудовании.
  • Хороший компромисс между точностью и скоростью: Достигает конкурентоспособных показателей mAP, сохраняя при этом очень быстрое время inference, что делает его отличным выбором для систем реального времени.
  • Промышленная направленность: Разработана с учетом конкретных потребностей реальных промышленных применений.

Слабые стороны

  • Более низкая пиковая точность: Будучи быстрой, она не достигает тех же пиковых уровней точности, что и YOLOv9, особенно в более крупных вариантах моделей.
  • Меньшая экосистема: Сообщество и экосистема вокруг YOLOv6 меньше по сравнению с более широко используемыми моделями от Ultralytics, что может означать меньшее количество документации, меньше учебных пособий и более медленную поддержку.
  • Ограниченная универсальность: В первую очередь ориентирован на обнаружение объектов, не имея встроенной поддержки других задач, таких как сегментация или оценка позы, которые есть во фреймворке Ultralytics.

Случаи использования

YOLOv6-3.0 хорошо подходит для сценариев, где скорость инференса является главным приоритетом:

  • Наблюдение в реальном времени: Приложения, требующие быстрого анализа видеопотоков, такие как системы охранной сигнализации.
  • Мобильные приложения: Его эффективная конструкция делает его кандидатом для развертывания на мобильных устройствах с ограниченными ресурсами.
  • Высокопроизводительные системы: Среды, такие как сортировка посылок, где скорость важнее, чем обнаружение каждого отдельного объекта с идеальной точностью.

Узнайте больше о YOLOv6-3.0

Анализ производительности: YOLOv9 против YOLOv6-3.0

Сравнение производительности YOLOv9 и YOLOv6-3.0 подчеркивает компромиссы между точностью и эффективностью. YOLOv9 стабильно демонстрирует превосходную точность во всех своих вариантах моделей.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Из таблицы вытекает несколько ключевых выводов:

  • Пиковая точность: YOLOv9-E достигает замечательного показателя 55,6 mAP, значительно превосходя лучшую модель YOLOv6-3.0 (52,8 mAP).
  • Эффективность: YOLOv9 демонстрирует превосходную эффективность параметров. Например, YOLOv9-C достигает более высокого mAP (53.0), чем YOLOv6-3.0l (52.8), с меньшим количеством параметров (25.3M против 59.6M) и меньшим количеством FLOPs (102.1B против 150.7B).
  • Скорость: Меньшие модели YOLOv6-3.0, такие как YOLOv6-3.0n, чрезвычайно быстры (задержка 1,17 мс), что делает их отличными для приложений, где скорость является абсолютным приоритетом и небольшое снижение точности приемлемо. Однако для заданного уровня точности YOLOv9 часто оказывается более эффективной.

Методологии обучения

Обе модели используют стандартные методы обучения глубокому обучению, но пользовательский опыт значительно различается. Обучение YOLOv9 в рамках Ultralytics исключительно простое. Экосистема предоставляет оптимизированные рабочие процессы обучения, простую настройку гиперпараметров, эффективные загрузчики данных и простую интеграцию с инструментами ведения журналов, такими как TensorBoard и Weights & Biases. Эта комплексная система поддержки ускоряет разработку и упрощает управление экспериментами. Кроме того, модели Ultralytics оптимизированы для эффективного использования памяти во время обучения.

Обучение YOLOv6-3.0 требует выполнения процедур, описанных в его официальном репозитории GitHub, который может быть менее доступен для разработчиков, ищущих готовое решение.

Заключение: почему YOLOv9 является предпочтительным выбором

Несмотря на то, что YOLOv6-3.0 является эффективной моделью, которая превосходно подходит для высокоскоростных промышленных сценариев, YOLOv9 становится лучшим выбором для подавляющего большинства современных приложений компьютерного зрения.

YOLOv9 предлагает более привлекательный пакет, обеспечивая современную точность с замечательной вычислительной эффективностью. Его инновационная архитектура эффективно решает ключевые проблемы глубокого обучения, что приводит к созданию более надежных и стабильных моделей. Однако ключевое преимущество заключается в его интеграции в экосистему Ultralytics. Это предоставляет разработчикам и исследователям беспрецедентную простоту использования, обширную документацию, активную поддержку сообщества и универсальную платформу, которая поддерживает множество задач, помимо простого обнаружения объектов.

Для проектов, требующих высочайшей точности, большей эффективности и плавного процесса разработки, YOLOv9 — явный победитель.

Пользователям, изучающим другие передовые модели, Ultralytics предлагает ряд высокопроизводительных альтернатив, включая универсальную Ultralytics YOLOv8, отраслевой стандарт Ultralytics YOLOv5 и передовую Ultralytics YOLO11. Дополнительные сравнения с моделями, такими как RT-DETR, можно найти в нашем центре сравнения моделей.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии