Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 против YOLOv8#

Ландшафт компьютерного зрения реального времени значительно изменился за последние несколько лет, и каждая новая модель расширяет теоретические границы возможного как на граничных устройствах (edge devices), так и на облачных серверах. При сравнении более новой архитектуры YOLOv9 с популярным фреймворком Ultralytics YOLOv8 разработчики часто стоят перед выбором между передовыми теоретическими путями градиента и проверенной в боях экосистемой, готовой к промышленному использованию.

Это подробное руководство сопоставляет этих двух тяжеловесов, анализируя их архитектурные инновации, метрики производительности и идеальные сценарии развертывания, чтобы помочь тебе выбрать подходящую модель для твоего следующего проекта в области искусственного интеллекта.

Link to this sectionТехнические характеристики и авторство#

Понимание происхождения этих моделей дает важный контекст для их соответствующих проектных решений.

YOLOv9 Разработанная Чиен-Яо Ваном и Хун-Юань Марком Ляо в Институте информационных наук Academia Sinica, Тайвань, YOLOv9 была выпущена 21 февраля 2024 года. Основные исследования сосредоточены на решении проблемы «узкого места» (bottleneck) информации в глубоких нейронных сетях. Ты можешь изучить оригинальную научную статью о YOLOv9 на Arxiv или посмотреть исходный код в официальном репозитории YOLOv9 на GitHub.

Узнай больше о YOLOv9

Ultralytics YOLOv8 Разработанная Гленном Джочером, Аюшем Чаурасией и Цзин Цю в Ultralytics, модель YOLOv8 была выпущена 10 января 2023 года. Она зарекомендовала себя как промышленный стандарт универсальности, предлагая унифицированный API для огромного множества задач компьютерного зрения. Исходный код поддерживается в основном репозитории Ultralytics на GitHub, что гарантирует непрерывные обновления и долгосрочную стабильность.

Узнай больше о YOLOv8

Link to this sectionАрхитектурные инновации#

Link to this sectionYOLOv9: программируемая градиентная информация#

Определяющей особенностью YOLOv9 является внедрение Программируемой градиентной информации (PGI) и сети обобщенного эффективного агрегирования слоев (GELAN). По мере того как сверточные нейронные сети становятся глубже, они обычно теряют критически важную информацию о признаках в процессе прямого прохода. PGI решает эту проблему «информационного узкого места», сохраняя точные градиенты, используемые для обновления весов, что обеспечивает надежное извлечение признаков. Эта архитектура максимизирует эффективность параметров, позволяя YOLOv9 достигать высокой точности при меньшем количестве операций с плавающей запятой (FLOPs).

Link to this sectionYOLOv8: Универсальная рабочая лошадка#

В YOLOv8 представлен оптимизированный механизм обнаружения без анкоров (anchor-free), который сокращает количество предсказаний рамок и ускоряет немаксимальное подавление (NMS) во время пост-обработки. Модуль C2f (Cross-Stage Partial Bottleneck с двумя свертками) улучшает прохождение градиента по сети по сравнению с более старыми моделями. Что еще важнее, YOLOv8 была спроектирована с упором на универсальность, нативно поддерживая «из коробки» обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и извлечение ориентированных ограничивающих рамок (OBB).

Интеграция с экосистемой

Хотя YOLOv9 предлагает исключительные показатели обнаружения, ее нативная интеграция в сложные конвейеры может быть затруднительной. Использование YOLOv9 через фреймворк Ultralytics устраняет этот разрыв, предоставляя доступ к нашим надежным инструментам экспорта и развертывания.

Link to this sectionБаланс производительности и бенчмарки#

Компромисс между скоростью и точностью — самый критический фактор при развертывании моделей компьютерного зрения. Ниже приведено детальное сравнение размеров моделей, задержки и среднего показателя точности (mAP), оцененных на стандартном наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

При анализе метрик YOLOv9 демонстрирует поразительное соотношение параметров к точности. Модель YOLOv9c достигает впечатляющих 53,0% mAP, используя всего 25,3 млн параметров. Однако YOLOv8 сохраняет значительное преимущество в требованиях к памяти и скорости вывода на аппаратных ускорителях, особенно вариант YOLOv8n, показывающий 1,47 мс в конфигурации NVIDIA TensorRT.

Link to this sectionПреимущества экосистемы Ultralytics#

Важным фактором при выборе архитектуры является простота использования и окружающая программная экосистема. Управление зависимостями, написание пользовательских загрузчиков данных и работа со сложными скриптами экспорта могут затормозить разработку. Интегрированная экосистема Ultralytics абстрагирует эти сложности.

Независимо от того, выбираешь ли ты YOLOv8 или YOLOv9 (которая полностью поддерживается в библиотеке Ultralytics), ты получаешь преимущества унифицированного API, автоматических методов аугментации данных и упрощенного экспорта в формат ONNX. Кроме того, архитектуры Ultralytics обычно отличаются высокооптимизированной эффективностью обучения, позволяя избежать значительного раздувания памяти CUDA, обычно связанного с большими моделями на основе Transformer.

Link to this sectionПример кода обучения#

Обучение любой из этих моделей с использованием Python API выполняется просто и требует лишь нескольких строк кода.

from ultralytics import YOLO

# Load the preferred model (swap 'yolov9c.pt' with 'yolov8n.pt' as needed)
model = YOLO("yolov8n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance metrics
metrics = model.val()

# Export to ONNX for production deployment
model.export(format="onnx")

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv9 и YOLOv8 зависит от специфических требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLOv9#

YOLOv9 — отличный выбор для:

  • Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
  • Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
  • Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.

Link to this sectionКогда выбирать YOLOv8#

YOLOv8 рекомендуется для:

  • Универсального развертывания с несколькими задачами: проектов, требующих проверенной модели для обнаружения, сегментации, классификации и оценки позы в рамках экосистемы Ultralytics.
  • Устоявшихся производственных систем: существующих производственных сред, уже построенных на архитектуре YOLOv8 со стабильными и хорошо протестированными пайплайнами развертывания.
  • Широкой поддержки сообщества и экосистемы: приложений, которым нужны обширные руководства по YOLOv8, сторонние интеграции и активные ресурсы сообщества.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionВзгляд в будущее: появление YOLO26#

Хотя YOLOv8 и YOLOv9 невероятно функциональны, ландшафт компьютерного зрения развивается быстро. Для современных развертываний мы настоятельно рекомендуем использовать Ultralytics YOLO26, выпущенную в январе 2026 года.

YOLO26 представляет собой сдвиг парадигмы в работе детекторов объектов в продакшене. Она отличается нативным дизайном без NMS (End-to-End NMS-Free), что эффективно устраняет задержки и недетерминированное поведение пост-обработки. Для лучшей поддержки граничных и маломощных устройств YOLO26 включает полное удаление DFL (Distribution Focal Loss), что делает мобильный экспорт значительно проще.

Кроме того, YOLO26 использует прорывной оптимизатор MuSGD, гибрид SGD и Muon, который обеспечивает стабильность обучения уровня LLM для задач компьютерного зрения, что приводит к значительно более быстрой сходимости. Благодаря увеличению скорости вывода на CPU до 43% и интеграции ProgLoss + STAL для значительного улучшения распознавания мелких объектов, YOLO26 является бесспорным выбором для новых корпоративных инициатив.

Узнай больше о YOLO26

Альтернативные архитектуры

В зависимости от твоих аппаратных ограничений, тебе может быть интересно сравнить эти модели с Ultralytics YOLO11 для сбалансированных задач общего назначения или изучить модели на основе Transformer, такие как RT-DETR, для специализированных высокоточных исследований.

Link to this sectionРеальные применения и варианты использования#

Выбор между YOLOv8 и YOLOv9 во многом зависит от ограничений твоего проекта и целевого оборудования.

  • Здравоохранение и медицинская визуализация: Когда на счету каждый пиксель, например, в системах обнаружения опухолей, архитектура GELAN модели YOLOv9 исключительно хорошо сохраняет детали, уменьшая количество ложноотрицательных результатов при критически важных диагнозах.
  • Ритейл и аналитика запасов: Для умных супермаркетов, отслеживающих плотно заполненные полки, YOLOv9 обеспечивает необходимый mAP для надежного разделения перекрывающихся товаров.
  • Умные города и мониторинг трафика: В динамичной логистике и управлении дорожным движением сверхнизкая задержка и проверенная надежность YOLOv8 делают ее идеальной для одновременного отслеживания транспортных средств через несколько потоков камер.
  • Граничные развертывания (Edge Deployments): Если ты разворачиваешься на ограниченных устройствах, таких как Raspberry Pi или мобильное оборудование, высокооптимизированные блоки C2f модели YOLOv8 (и оптимизации CPU в YOLO26) обеспечивают гораздо более плавный и энергоэффективный конвейер вывода.
Контрибьюторы

Комментарии