Сравнение моделей: YOLOv8 и YOLOv9 для обнаружения объектов
Выбор подходящей модели обнаружения объектов имеет решающее значение для балансировки точности, скорости и вычислительных ресурсов. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и YOLOv9, обеих современных моделей в серии YOLO. Мы проанализируем их архитектуры, производительность и варианты использования, чтобы помочь вам определить, что лучше всего подходит для ваших нужд, подчеркнув, почему универсальность и развитая экосистема YOLOv8 делают ее предпочтительным выбором для большинства приложений.
Ultralytics YOLOv8: Оптимизированная и универсальная
Ultralytics YOLOv8 — это очень успешная модель, разработанная Гленном Джохером, Аюшем Чаурасией и Цзин Цю в Ultralytics и выпущенная 10 января 2023 года. Она известна своим превосходным балансом скорости и точности, разработана как удобная в использовании и исключительно универсальная. Ключевым преимуществом YOLOv8 является поддержка широкого спектра задач компьютерного зрения, помимо обнаружения объектов, включая сегментацию экземпляров, оценку позы, классификацию изображений и ориентированные ограничивающие рамки (OBB), и все это в рамках единой унифицированной платформы.
Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Архитектура и ключевые особенности
YOLOv8 основывается на предыдущих версиях YOLO со значительными архитектурными усовершенствованиями, такими как anchor-free detection head и модифицированный backbone CSPDarknet с модулем C2f. Этот выбор конструкции повышает гибкость и эффективность. Однако ее самые сильные стороны заключаются в удобстве использования и надежной экосистеме, в которой она находится.
- Простота использования: YOLOv8 предлагает оптимизированный пользовательский интерфейс благодаря простому Python API и CLI, подкрепленному обширной документацией. Это делает его доступным как для начинающих, так и для экспертов.
- Хорошо поддерживаемая экосистема: Преимущества непрерывной разработки, сильного сообщества с открытым исходным кодом, частых обновлений и глубокой интеграции с Ultralytics HUB для обучения без кода и рабочих процессов MLOps.
- Баланс производительности: Семейство моделей обеспечивает отличный компромисс между скоростью и точностью, что делает его подходящим для различных реальных сценариев развертывания, от периферийных устройств до облачных серверов.
- Эффективность использования памяти: Обычно требует меньше памяти CUDA для обучения и инференса по сравнению с более крупными архитектурами, такими как трансформеры, что позволяет разрабатывать решения на более широком спектре оборудования.
- Универсальность: Это выдающаяся особенность. YOLOv8 превосходно справляется с несколькими задачами компьютерного зрения (обнаружение, сегментация, классификация, поза, OBB) в рамках единой структуры, что часто отсутствует в более специализированных моделях, таких как YOLOv9.
- Эффективность обучения: Отличается эффективными процессами обучения и готовыми предварительно обученными весами на наборах данных, таких как COCO, что ускоряет циклы разработки.
Сильные и слабые стороны
Преимущества:
- Универсальная поддержка задач: Единая модельная архитектура может быть обучена для обнаружения, сегментации, определения позы и многого другого, что упрощает сложные проектные требования.
- Удобство использования: Обширная документация и простой API снижают порог вхождения для разработки передовых решений в области компьютерного зрения.
- Сильное сообщество и экосистема: Активно поддерживается обширными ресурсами и интеграциями, такими как TensorRT и OpenVINO, для оптимизированного развертывания.
Слабые стороны:
- Пиковая точность: Будучи весьма точными, самые большие модели YOLOv9 могут достигать несколько более высоких показателей mAP на эталонных тестах COCO для чистого обнаружения объектов.
- Требовательность к ресурсам (большие модели): Более крупные модели YOLOv8 (L, X) требуют значительных вычислительных ресурсов, хотя и остаются эффективными для своего класса производительности.
YOLOv9: Повышение точности с помощью новых техник
YOLOv9 был представлен 21 февраля 2024 года Чиен-Яо Вангом и Хонг-Юанем Марком Ляо из Института информатики, Academia Sinica, Тайвань. Он представляет значительные архитектурные инновации, направленные на расширение границ точности обнаружения объектов в реальном времени за счет решения проблемы потери информации в глубоких нейронных сетях.
Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
Документация: https://docs.ultralytics.com/models/yolov9/
Архитектура и Ключевые Инновации
Основными вкладами YOLOv9 являются Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Программируемая градиентная информация (PGI): Эта концепция разработана для смягчения проблемы информационного узкого места, когда важные данные теряются при распространении через слои глубокой сети. PGI помогает генерировать надежные градиенты для поддержания ключевой информации для точного обновления модели.
- Обобщенная эффективная сеть агрегации слоев (GELAN): GELAN — это новая архитектура, которая оптимизирует использование параметров и вычислительную эффективность. Это позволяет YOLOv9 достигать более высокой точности с меньшим количеством параметров по сравнению с некоторыми предыдущими моделями.
Сильные и слабые стороны
Преимущества:
- Повышенная точность: Устанавливает новые передовые результаты на наборе данных COCO для детекторов объектов в реальном времени, превосходя многие другие модели по mAP.
- Повышенная эффективность: Архитектура GELAN обеспечивает высокое соотношение производительности на параметр.
Слабые стороны:
- Ограниченная универсальность: YOLOv9 в основном ориентирован на обнаружение объектов. Ему не хватает встроенной поддержки нескольких задач, таких как сегментация, оценка позы и классификация, что делает YOLOv8 более гибким и практичным решением для комплексных проектов в области ИИ.
- Ресурсы для обучения: Как отмечено в документации, обучение моделей YOLOv9 может потребовать больше ресурсов и времени по сравнению с моделями Ultralytics.
- Новая архитектура: Поскольку это более новая модель от другой исследовательской группы, ее экосистема, поддержка сообщества и интеграция со сторонними разработчиками менее развиты, чем у хорошо зарекомендовавшей себя Ultralytics YOLOv8. Это может привести к более крутой кривой обучения и меньшему количеству готовых решений для развертывания.
Производительность и тесты: YOLOv8 против YOLOv9
При сравнении производительности становится ясно, что обе модели обладают большими возможностями. YOLOv9 расширяет границы чистой точности обнаружения, при этом его самый большой вариант, YOLOv9e, достигает самого высокого mAP. Однако Ultralytics YOLOv8 предлагает более убедительный общий пакет. Его модели обеспечивают превосходный баланс скорости и точности с хорошо документированной скоростью инференса как на CPU, так и на GPU, что имеет решающее значение для принятия решений о развертывании в реальных условиях.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Таблица показывает, что, хотя модели YOLOv9 эффективны с точки зрения параметров, YOLOv8 обеспечивает более полную картину производительности, включая важные тесты CPU, которые демонстрируют ее готовность к различным аппаратным средам.
Идеальные варианты использования
Выбор между YOLOv8 и YOLOv9 во многом зависит от приоритетов проекта.
YOLOv8 - идеальный выбор для:
- Многозадачные приложения: Проекты, требующие сочетания обнаружения, сегментации и оценки позы, например, в робототехнике, здравоохранении или передовых системах безопасности.
- Быстрая разработка и развертывание: Разработчики, которым необходимо быстро перейти от прототипа к производству, получат огромную выгоду от простоты использования YOLOv8, обширной документации и интегрированной экосистемы.
- Balanced Performance Needs: Приложения, где важен баланс между скоростью и точностью, а не достижение абсолютно наивысшего показателя mAP, например, в аналитике видео в реальном времени для розничной торговли или производства.
YOLOv9 лучше всего подходит для:
- Исследования и специализированное высокоточное обнаружение: Сценарии, в которых основная цель состоит в максимальном увеличении точности обнаружения объектов на таких бенчмарках, как COCO.
- Высокоточный промышленный контроль: Приложения, в которых обнаружение мельчайших дефектов с максимально возможной точностью является основной задачей.
- Расширенная видеоаналитика: Используется в инфраструктуре умного города, где требуется обнаружение высшего уровня и система может учитывать ее конкретные зависимости.
Заключение: какую модель вам следует выбрать?
Для подавляющего большинства разработчиков и приложений Ultralytics YOLOv8 — превосходный выбор. Его беспрецедентная универсальность, простота использования и зрелая, хорошо поддерживаемая экосистема обеспечивают значительное преимущество перед YOLOv9. Возможность обрабатывать несколько задач в рамках единой платформы не только упрощает разработку, но и снижает сложность и стоимость производства. Хотя YOLOv9 предлагает впечатляющее повышение точности при обнаружении объектов, его узкая направленность и менее развитая экосистема делают его более специализированным инструментом.
YOLOv8 представляет собой комплексное решение, которое позволяет разработчикам эффективно создавать надежные, многофункциональные AI-системы. Для тех, кто ищет надежную, высокопроизводительную и гибкую модель, YOLOv8 — явный победитель. Если вы ищете еще более устоявшуюся модель, рассмотрите YOLOv5, или, чтобы ознакомиться с новейшими передовыми технологиями от Ultralytics, обратите внимание на YOLO11.