YOLO26 против YOLOv9: следующий этап эволюции в области обнаружения объектов в реальном времени

Эволюция архитектур обнаружения объектов характеризовалась постоянным стремлением к повышению скорости, точности и эффективности. Сравнение YOLO26 и YOLOv9 подчеркивает этот быстрый прогресс. В то время как YOLOv9 границы хранения информации с помощью программируемых градиентов, новая версия YOLO26 переопределяет ландшафт с помощью сквозной архитектуры NMS, специально оптимизированной для производительности на периферии и значительного CPU .

Обзор модели

YOLO26

YOLO26 представляет собой передовую технологию в области искусственного интеллекта для распознавания изображений по состоянию на начало 2026 года. Разработана компанией Ultralytics, он представляет собой нативный комплексный дизайн, который устраняет необходимость в немаксимальном подавлении (NMS), оптимизируя процессы развертывания. Благодаря удалению распределительной фокальной потери (DFL) и интеграции нового оптимизатора MuSGD— гибрида SGD Muon, вдохновленного обучением LLM — YOLO26 достигает до 43% более быстрой CPU , сохраняя при этом высочайшую точность.

Авторы: Гленн Джохер, Цзин Цю
Организация:Ultralytics
Дата: 14 января 2026 года
Ключевая особенность: сквозное обнаружение NMS, оптимизатор MuSGD, ProgLoss + STAL
GitHub:Репозиторий Ultralytics

Узнайте больше о YOLO26

YOLOv9

Выпущенный в начале 2024 года, YOLOv9 представил концепцию программируемой градиентной информации (PGI) и архитектуру GELAN. Эти инновации решили проблему «информационного бутылочного горлышка» в глубоких сетях, обеспечив, что критически важные данные не теряются в процессе прямой передачи. Это по-прежнему мощная модель, особенно для исследовательских приложений, требующих высокой эффективности параметров.

Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica
Дата: 21 февраля 2024 г.
Ключевая особенность: программируемая градиентная информация (PGI), архитектура GELAN
Arxiv:YOLOv9
GitHub:Репозиторий YOLOv9

Узнайте больше о YOLOv9

Сравнение технической архитектуры

Архитектурные различия между этими двумя моделями означают переход от теоретической оптимизации информационных потоков к практической эффективности развертывания.

YOLO26: Эффективность и дизайн с приоритетом краев

YOLO26 направлен на снижение вычислительных затрат на постобработку и расчет потерь.

Полная NMS: в отличие от традиционных детекторов, которые выводят избыточные ограничительные рамки, требующие NMS, YOLO26 напрямую прогнозирует точный набор объектов. Это снижает разброс задержек и упрощает экспорт в такие форматы, как ONNX TensorRT, поскольку больше не требуются сложные пользовательские NMS .
ProgLoss + STAL: внедрение прогрессивных потерь и маркировки мягких целей значительно улучшает обнаружение мелких объектов, что является важным требованием для съемки с дронов и роботизированного контроля.
MuSGD Optimizer: благодаря инновациям, заимствованным из области обучения больших языковых моделей, этот гибридный оптимизатор стабилизирует динамику обучения, обеспечивая более быструю конвергенцию с меньшей настройкой гиперпараметров.

YOLOv9: Сохранение информации

Архитектура YOLOv9 построена на решении проблемы исчезновения информации в глубоких сетях.

PGI (Programmable Gradient Information): вспомогательная ветвь контроля генерирует надежные градиенты для обновления весов сети, обеспечивая сохранение семантической информации в глубоких слоях.
GELAN (Generalized Efficient Layer Aggregation Network): эта магистраль оптимизирует использование параметров, позволяя YOLOv9 высокой точности с меньшим количеством параметров, чем некоторые из его предшественников, хотя зачастую за счет более высокой вычислительной сложности (FLOP) по сравнению с оптимизированным YOLO26.

Простота развертывания

Удаление NMS YOLO26 кардинально меняет ситуацию с развертыванием на периферии. В более старых моделях, таких как YOLOv9, NMS выполняется на CPU если модель работает на GPU, что создает узкое место. Результаты YOLO26 готовы к использованию сразу же, что значительно ускоряет работу на Raspberry Pi и мобильных устройствах.

Метрики производительности

В следующей таблице представлено сравнение моделей по стандартным тестам. Обратите внимание на значительное преимущество YOLO26 по скорости на CPU , что является прямым результатом оптимизации его архитектуры.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Преимущества экосистемы Ultralytics

Хотя YOLOv9 прочную теоретическую основу, использование YOLO26 в Ultralytics дает разработчикам и предприятиям ряд явных преимуществ.

Непревзойденная простота использования

Python Ultralytics преобразует сложные рабочие процессы обучения в несколько строк кода. Этот подход «от нуля до героя» контрастирует с ориентированной на исследования структурой многих других репозиториев.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Универсальность в различных задачах

В отличие от YOLOv9, который в основном ориентирован на обнаружение, Ultralytics и YOLO26 изначально поддерживают более широкий спектр задач компьютерного зрения. Это позволяет использовать единый унифицированный API для:

Сегментация экземпляров: точное маскирование объектов на уровне пикселей.
Оценка позы: обнаружение ключевых точек для анализа активности человека.
OBB (ориентированная ограничивающая рамка): обнаружение повернутых объектов, таких как корабли, на спутниковых снимках.
Классификация: категоризация всего изображения.

Эффективность обучения и памяти

Ultralytics разработаны с учетом эффективного использования ресурсов. YOLO26 обычно требует меньше GPU (VRAM) во время обучения по сравнению с альтернативными моделями, в которых широко используются трансформеры. Такая эффективность позволяет:

Более крупные размеры партий на потребительском оборудовании.
Снижение затрат на облачные вычисления.
Более быстрые циклы экспериментов с помощью готовых предварительно обученных весов.

Приложения в реальном мире

Выбор подходящей модели зависит от конкретных ограничений развертывания.

Периферийные вычисления и IoT

YOLO26 — бесспорный чемпион среди периферийных устройств. Благодаря на 43 % более быстрой CPU , он подходит для мониторинга в реальном времени на таких устройствах, как Raspberry Pi или NVIDIA Nano, без необходимости в интенсивной квантовании. Например, интеллектуальная парковочная система, работающая на локальном оборудовании, получает огромные преимущества от конструкции NMS, что снижает пики задержки.

Высотная инспекция

Для мониторинга сельского хозяйства или инспекции инфраструктуры с помощью дронов YOLO26 отлично подходит благодаря функциям ProgLoss + STAL. Они специально настроены для лучшей обработки небольших объектов и сложных соотношений сторон по сравнению с предыдущими поколениями, что обеспечивает более высокую точность обнаружения трещин в трубопроводах или вредителей на сельскохозяйственных культурах.

Академические исследования

YOLOv9 остается сильным кандидатом для академических исследований, особенно для исследований, посвященных теории градиентного потока и архитектуры сетей. Его концепция PGI предоставляет увлекательную возможность для изучения того, как нейронные сети сохраняют глубину информации.

Заключение

Обе архитектуры являются важными вехами в области компьютерного зрения. YOLOv9 важность градиентной информации в глубоких сетях. Однако YOLO26 преобразует эти уроки в готовую к производству мощную систему. Благодаря своей сквозной конструкции NMS, превосходной CPU и бесшовной интеграции в Ultralytics , YOLO26 предлагает оптимальный баланс скорости, точности и простоты использования для современных приложений искусственного интеллекта.

Разработчикам, стремящимся оставаться на передовом крае, мы рекомендуем перейти на YOLO26, чтобы воспользоваться последними достижениями в области стабильности оптимизатора и производительности на периферии.

Дополнительная литература

Если вас интересуют другие высокопроизводительные модели Ultralytics , ознакомьтесь с YOLO11 для задач общего назначения или RT-DETR для обнаружения в реальном времени на основе трансформатора.