Перейти к содержанию

YOLO26 против YOLOv9: следующий этап эволюции в области обнаружения объектов в реальном времени

Эволюция архитектур обнаружения объектов характеризовалась постоянным стремлением к повышению скорости, точности и эффективности. Сравнение YOLO26 и YOLOv9 подчеркивает этот быстрый прогресс. В то время как YOLOv9 границы хранения информации с помощью программируемых градиентов, новая версия YOLO26 переопределяет ландшафт с помощью сквозной архитектуры NMS, специально оптимизированной для производительности на периферии и значительного CPU .

Обзор модели

YOLO26

YOLO26 представляет собой передовую технологию в области искусственного интеллекта для распознавания изображений по состоянию на начало 2026 года. Разработана компанией Ultralytics, он представляет собой нативный комплексный дизайн, который устраняет необходимость в немаксимальном подавлении (NMS), оптимизируя процессы развертывания. Благодаря удалению распределительной фокальной потери (DFL) и интеграции нового оптимизатора MuSGD— гибрида SGD Muon, вдохновленного обучением LLM — YOLO26 достигает до 43% более быстрой CPU , сохраняя при этом высочайшую точность.

  • Авторы: Гленн Джохер, Цзин Цю
  • Организация:Ultralytics
  • Дата: 14 января 2026 года
  • Ключевая особенность: сквозное обнаружение NMS, оптимизатор MuSGD, ProgLoss + STAL
  • GitHub:Репозиторий Ultralytics

Узнайте больше о YOLO26

YOLOv9

Выпущенный в начале 2024 года, YOLOv9 представил концепцию программируемой градиентной информации (PGI) и архитектуру GELAN. Эти инновации решили проблему «информационного бутылочного горлышка» в глубоких сетях, обеспечив, что критически важные данные не теряются в процессе прямой передачи. Это по-прежнему мощная модель, особенно для исследовательских приложений, требующих высокой эффективности параметров.

  • Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
  • Организация: Институт информатики, Academia Sinica
  • Дата: 21 февраля 2024 г.
  • Ключевая особенность: программируемая градиентная информация (PGI), архитектура GELAN
  • Arxiv:YOLOv9
  • GitHub:Репозиторий YOLOv9

Узнайте больше о YOLOv9

Сравнение технической архитектуры

Архитектурные различия между этими двумя моделями означают переход от теоретической оптимизации информационных потоков к практической эффективности развертывания.

YOLO26: Эффективность и дизайн с приоритетом краев

YOLO26 направлен на снижение вычислительных затрат на постобработку и расчет потерь.

  • Полная NMS: в отличие от традиционных детекторов, которые выводят избыточные ограничительные рамки, требующие NMS, YOLO26 напрямую прогнозирует точный набор объектов. Это снижает разброс задержек и упрощает экспорт в такие форматы, как ONNX TensorRT, поскольку больше не требуются сложные пользовательские NMS .
  • ProgLoss + STAL: внедрение прогрессивных потерь и маркировки мягких целей значительно улучшает обнаружение мелких объектов, что является важным требованием для съемки с дронов и роботизированного контроля.
  • MuSGD Optimizer: благодаря инновациям, заимствованным из области обучения больших языковых моделей, этот гибридный оптимизатор стабилизирует динамику обучения, обеспечивая более быструю конвергенцию с меньшей настройкой гиперпараметров.

YOLOv9: Сохранение информации

Архитектура YOLOv9 построена на решении проблемы исчезновения информации в глубоких сетях.

  • PGI (Programmable Gradient Information): вспомогательная ветвь контроля генерирует надежные градиенты для обновления весов сети, обеспечивая сохранение семантической информации в глубоких слоях.
  • GELAN (Generalized Efficient Layer Aggregation Network): эта магистраль оптимизирует использование параметров, позволяя YOLOv9 высокой точности с меньшим количеством параметров, чем некоторые из его предшественников, хотя зачастую за счет более высокой вычислительной сложности (FLOP) по сравнению с оптимизированным YOLO26.

Простота развертывания

Удаление NMS YOLO26 кардинально меняет ситуацию с развертыванием на периферии. В более старых моделях, таких как YOLOv9, NMS выполняется на CPU если модель работает на GPU, что создает узкое место. Результаты YOLO26 готовы к использованию сразу же, что значительно ускоряет работу на Raspberry Pi и мобильных устройствах.

Метрики производительности

В следующей таблице представлено сравнение моделей по стандартным тестам. Обратите внимание на значительное преимущество YOLO26 по скорости на CPU , что является прямым результатом оптимизации его архитектуры.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Преимущества экосистемы Ultralytics

Хотя YOLOv9 прочную теоретическую основу, использование YOLO26 в Ultralytics дает разработчикам и предприятиям ряд явных преимуществ.

Непревзойденная простота использования

Python Ultralytics преобразует сложные рабочие процессы обучения в несколько строк кода. Этот подход «от нуля до героя» контрастирует с ориентированной на исследования структурой многих других репозиториев.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Универсальность в различных задачах

В отличие от YOLOv9, который в основном ориентирован на обнаружение, Ultralytics и YOLO26 изначально поддерживают более широкий спектр задач компьютерного зрения. Это позволяет использовать единый унифицированный API для:

Эффективность обучения и памяти

Ultralytics разработаны с учетом эффективного использования ресурсов. YOLO26 обычно требует меньше GPU (VRAM) во время обучения по сравнению с альтернативными моделями, в которых широко используются трансформеры. Такая эффективность позволяет:

Приложения в реальном мире

Выбор подходящей модели зависит от конкретных ограничений развертывания.

Периферийные вычисления и IoT

YOLO26 — бесспорный чемпион среди периферийных устройств. Благодаря на 43 % более быстрой CPU , он подходит для мониторинга в реальном времени на таких устройствах, как Raspberry Pi или NVIDIA Nano, без необходимости в интенсивной квантовании. Например, интеллектуальная парковочная система, работающая на локальном оборудовании, получает огромные преимущества от конструкции NMS, что снижает пики задержки.

Высотная инспекция

Для мониторинга сельского хозяйства или инспекции инфраструктуры с помощью дронов YOLO26 отлично подходит благодаря функциям ProgLoss + STAL. Они специально настроены для лучшей обработки небольших объектов и сложных соотношений сторон по сравнению с предыдущими поколениями, что обеспечивает более высокую точность обнаружения трещин в трубопроводах или вредителей на сельскохозяйственных культурах.

Академические исследования

YOLOv9 остается сильным кандидатом для академических исследований, особенно для исследований, посвященных теории градиентного потока и архитектуры сетей. Его концепция PGI предоставляет увлекательную возможность для изучения того, как нейронные сети сохраняют глубину информации.

Заключение

Обе архитектуры являются важными вехами в области компьютерного зрения. YOLOv9 важность градиентной информации в глубоких сетях. Однако YOLO26 преобразует эти уроки в готовую к производству мощную систему. Благодаря своей сквозной конструкции NMS, превосходной CPU и бесшовной интеграции в Ultralytics , YOLO26 предлагает оптимальный баланс скорости, точности и простоты использования для современных приложений искусственного интеллекта.

Разработчикам, стремящимся оставаться на передовом крае, мы рекомендуем перейти на YOLO26, чтобы воспользоваться последними достижениями в области стабильности оптимизатора и производительности на периферии.

Дополнительная литература

Если вас интересуют другие высокопроизводительные модели Ultralytics , ознакомьтесь с YOLO11 для задач общего назначения или RT-DETR для обнаружения в реальном времени на основе трансформатора.


Комментарии