YOLOv9 YOLOv8: архитектура, производительность и применение
Развитие моделей обнаружения объектов продолжает ускоряться, предлагая разработчикам все более совершенные инструменты для задач компьютерного зрения. Двумя наиболее значительными вкладами в эту область являются YOLOv9, разработанная исследователями из Academia Sinica, и YOLOv8 от Ultralytics. Хотя обе модели представляют собой прорыв в области искусственного интеллекта, они используют разные архитектурные стратегии и удовлетворяют разные потребности внедрения.
В этом руководстве представлено подробное техническое сравнение YOLOv9 YOLOv8 с анализом их архитектуры, показателей производительности и методологий обучения, чтобы помочь вам выбрать подходящий инструмент для вашего приложения.
Обзор модели
Прежде чем углубляться в технические характеристики, необходимо понять происхождение и основные принципы проектирования этих двух мощных архитектур.
YOLOv9: Программируемая градиентная информация
Выпущенная в феврале 2024 года Чень-Яо Ваном и Хонг-Юанем Марком Ляо из Института информационных наук Академии Синика, YOLOv9 на решение проблемы потери информации в глубоких сетях. Авторы представляют две основные инновации: программируемая градиентная информация (PGI) и обобщенная эффективная сеть агрегации слоев (GELAN).
- PGI: Решает проблему «информационного бутылочного горлышка», когда данные теряются при прохождении через глубокие слои. Обеспечивает вспомогательный контроль, чтобы основная ветвь сохраняла важную информацию о характеристиках.
- GELAN: Легкая архитектура, оптимизирующая эффективность параметров, сочетающая в себе лучшие аспекты CSPNet и ELAN для максимального планирования градиентного пути.
YOLOv8: стандарт удобства использования и скорости
Запущенная компанией Ultralytics январе 2023 года, YOLOv8 стала отраслевым стандартом для обнаружения объектов в реальном времени. Она представила анкерную головку обнаружения и новую основу, разработанную для обеспечения скорости и точности. Помимо сырых метрик, YOLOv8 опыту разработчиков, предлагая унифицированную структуру для обнаружения, сегментации, классификации и оценки положения.
- Безанкерный дизайн: Уменьшает количество предсказаний ограничивающих рамок, ускоряя подавление немаксимумов (NMS).
- Мозаичное усиление: усовершенствованные алгоритмы обучения, которые повышают устойчивость к разнообразным фоновым условиям.
- Интеграция с экосистемой: беспроблемная интеграция с инструментами для развертывания, экспорта и отслеживания.
Сравнение производительности
При выборе модели для производства крайне важно найти оптимальный баланс между скоростью инференции и точностью обнаружения (mAP). В таблице ниже представлены результаты тестирования на COCO , который является стандартным тестом для оценки качества обнаружения объектов.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Основные выводы
- Точность: YOLOv9 достигает более высоких mAP при аналогичных масштабах модели. Архитектура GELAN эффективно улавливает сложные особенности, что делает ее сильным кандидатом для академических исследований, где важен каждый процентный пункт точности.
- Скорость: YOLOv8 превосходную скорость вывода, особенно на GPU (TensorRT). Его оптимизированные модули C2f и анкерная головка позволяют ускорить обработку, что имеет решающее значение для вывода в реальном времени в видеопотоках.
- Эффективность: хотя YOLOv9 меньше параметров в некоторых конфигурациях, Ultralytics обычно демонстрируют более низкое потребление памяти во время обучения. Эта эффективность позволяет разработчикам обучать YOLOv8 потребительском оборудовании с меньшим CUDA по сравнению с более сложными исследовательскими архитектурами.
Обучение и простота использования
Пользовательский опыт часто определяет, насколько быстро проект переходит от концепции к внедрению. Здесь становится очевидной разница в поддержке экосистемы.
Преимущество Ultralytics
Ultralytics , включая YOLOv8 более новую YOLO26, построены на основе унифицированного Python . Это обеспечивает единый API, позволяющий разработчикам переключаться между версиями моделей или задачами с помощью одной строки кода.
Особенности Ultralytics включают:
- Автоматизированные MLOps: интегрированная поддержка Comet и MLflow для отслеживания экспериментов.
- Простой экспорт: экспорт в один клик в такие форматы, как ONNX, OpenVINOи CoreML мобильного и периферийного развертывания.
- Обширная документация: обширная библиотека руководств, охватывающих все от настройки гиперпараметров до расширения данных.
from ultralytics import YOLO
# Load a model (YOLOv8 or YOLOv9)
model = YOLO("yolov8n.pt") # Switch to 'yolov9c.pt' instantly
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export for deployment
model.export(format="onnx")
YOLOv9
Хотя YOLOv9 в Ultralytics для удобства, исходная реализация основана на отдельных скриптах и файлах конфигурации. Пользователи, переходящие с исходного кода, могут обнаружить, что Ultralytics значительно упрощает их рабочий процесс, устраняя необходимость управлять сложными структурами папок или вручную загружать веса.
Оптимизированный рабочий процесс
Использование YOLOv9 ultralytics Пакет предоставляет доступ ко всем преимуществам экосистемы, включая Хаб интеграция и Explorer API, которые недоступны в автономном репозитории.
Реальные примеры использования
Выбор подходящей модели в значительной степени зависит от конкретных ограничений вашего приложения.
Идеальные сценарии для YOLOv9
- Медицинская визуализация: при выполнении таких задач, как обнаружение опухолей головного мозга или анализ рентгеновских снимков, программируемая градиентная информация (PGI) помогает сохранить важные детали текстуры, которые в противном случае могли бы быть утрачены, обеспечивая высокую точность диагностики.
- Обнаружение мелких объектов: архитектура GELAN отличается превосходной способностью сохранять особенности, благодаря чему YOLOv9 для обнаружения мелких объектов на аэрофотоснимках высокого разрешения или в потоках данных с дронов.
- Академический бенчмаркинг: Исследователи, стремящиеся опубликовать передовые результаты, получат преимущество от высоких mAP , обеспечиваемых более крупными моделями YOLOv9.
Идеальные сценарии для YOLOv8
- Аналитика розничной торговли: для таких приложений, как автоматическая касса или тепловое картирование в магазинах, YOLOv8 необходимую скорость для одновременной обработки нескольких потоков с камер без использования дорогостоящего оборудования.
- Встроенные системы: Совместимость модели с TFLite и Edge TPU ее идеальной для работы на таких устройствах, как Raspberry Pi или NVIDIA .
- Робототехника: в динамичных средах, где задержка имеет решающее значение для навигации и обхода препятствий, быстрое вычисление YOLOv8 , что роботы могут реагировать в режиме реального времени.
Будущее: YOLO26
Хотя YOLOv9 YOLOv8 отличным выбором, в этой области продолжаются активные разработки. Разработчики, стремящиеся к абсолютному передовому уровню, должны обратить внимание на YOLO26. Выпущенная в январе 2026 года, она представляет собой значительный скачок вперед в области эффективности и производительности.
YOLO26 представляет несколько революционных функций:
- Полная NMS: благодаря устранению не максимального подавления, YOLO26 упрощает развертывание и значительно сокращает задержку, что является усовершенствованной технологией по сравнению с YOLOv10.
- MuSGD Optimizer: гибридный оптимизатор, сочетающий SGD Muon, который обеспечивает стабильность обучения, наблюдаемую в LLM, для компьютерного зрения.
- Повышенная универсальность: специальные усовершенствования для ориентированных ограничительных прямоугольников (OBB) и оценки позы делают его наиболее универсальным инструментом для сложных задач машинного зрения.
- Оптимизация для периферийных устройств: благодаря на 43 % более быстрой CPU по сравнению с предыдущими поколениями, он специально разработан для периферийных вычислений и мобильных приложений.
Для новых проектов настоятельно YOLOv9 оценить YOLO26 наряду с YOLOv8 YOLOv9 , чтобы убедиться, что вы используете последние достижения в области эффективности искусственного интеллекта.
Заключение
Как YOLOv9 YOLOv8 свои преимущества. YOLOv9 надежную архитектуру для максимальной точности благодаря усовершенствованному управлению градиентной информацией, а YOLOv8 непревзойденный баланс скорости, простоты использования и поддержки экосистемы.
Для разработчиков, которые ищут беспроблемный опыт с обширной документацией и поддержкой сообщества, Ultralytics , включая YOLOv8 новую YOLO26, остаются лучшим выбором. Возможность легко переходить между обнаружением, сегментацией и классификацией в рамках одной платформы позволяет командам быстрее и надежнее создавать сложные решения на базе искусственного интеллекта.
Изучите весь спектр моделей и начните обучение уже сегодня с помощью Ultralytics — самого простого способа аннотировать, обучать и развертывать ваши модели компьютерного зрения.