YOLO26 против YOLOv9: следующий этап эволюции в области обнаружения объектов в реальном времени
Эволюция архитектур обнаружения объектов характеризовалась постоянным стремлением к повышению скорости, точности и эффективности. Сравнение YOLO26 и YOLOv9 подчеркивает этот быстрый прогресс. В то время как YOLOv9 границы хранения информации с помощью программируемых градиентов, новая версия YOLO26 переопределяет ландшафт с помощью сквозной архитектуры NMS, специально оптимизированной для производительности на периферии и значительного CPU .
Обзор модели
YOLO26
YOLO26 представляет собой передовую технологию в области искусственного интеллекта для распознавания изображений по состоянию на начало 2026 года. Разработана компанией Ultralytics, он представляет собой нативный комплексный дизайн, который устраняет необходимость в немаксимальном подавлении (NMS), оптимизируя процессы развертывания. Благодаря удалению распределительной фокальной потери (DFL) и интеграции нового оптимизатора MuSGD— гибрида SGD Muon, вдохновленного обучением LLM — YOLO26 достигает до 43% более быстрой CPU , сохраняя при этом высочайшую точность.
- Авторы: Гленн Джохер, Цзин Цю
- Организация:Ultralytics
- Дата: 14 января 2026 года
- Ключевая особенность: сквозное обнаружение NMS, оптимизатор MuSGD, ProgLoss + STAL
- GitHub:Репозиторий Ultralytics
YOLOv9
Выпущенный в начале 2024 года, YOLOv9 представил концепцию программируемой градиентной информации (PGI) и архитектуру GELAN. Эти инновации решили проблему «информационного бутылочного горлышка» в глубоких сетях, обеспечив, что критически важные данные не теряются в процессе прямой передачи. Это по-прежнему мощная модель, особенно для исследовательских приложений, требующих высокой эффективности параметров.
- Авторы: Чен-Яо Ванг, Хонг-Юань Марк Ляо
- Организация: Институт информатики, Academia Sinica
- Дата: 21 февраля 2024 г.
- Ключевая особенность: программируемая градиентная информация (PGI), архитектура GELAN
- Arxiv:YOLOv9
- GitHub:Репозиторий YOLOv9
Сравнение технической архитектуры
Архитектурные различия между этими двумя моделями означают переход от теоретической оптимизации информационных потоков к практической эффективности развертывания.
YOLO26: Эффективность и дизайн с приоритетом краев
YOLO26 направлен на снижение вычислительных затрат на постобработку и расчет потерь.
- Полная NMS: в отличие от традиционных детекторов, которые выводят избыточные ограничительные рамки, требующие NMS, YOLO26 напрямую прогнозирует точный набор объектов. Это снижает разброс задержек и упрощает экспорт в такие форматы, как ONNX TensorRT, поскольку больше не требуются сложные пользовательские NMS .
- ProgLoss + STAL: внедрение прогрессивных потерь и маркировки мягких целей значительно улучшает обнаружение мелких объектов, что является важным требованием для съемки с дронов и роботизированного контроля.
- MuSGD Optimizer: благодаря инновациям, заимствованным из области обучения больших языковых моделей, этот гибридный оптимизатор стабилизирует динамику обучения, обеспечивая более быструю конвергенцию с меньшей настройкой гиперпараметров.
YOLOv9: Сохранение информации
Архитектура YOLOv9 построена на решении проблемы исчезновения информации в глубоких сетях.
- PGI (Programmable Gradient Information): вспомогательная ветвь контроля генерирует надежные градиенты для обновления весов сети, обеспечивая сохранение семантической информации в глубоких слоях.
- GELAN (Generalized Efficient Layer Aggregation Network): эта магистраль оптимизирует использование параметров, позволяя YOLOv9 высокой точности с меньшим количеством параметров, чем некоторые из его предшественников, хотя зачастую за счет более высокой вычислительной сложности (FLOP) по сравнению с оптимизированным YOLO26.
Простота развертывания
Удаление NMS YOLO26 кардинально меняет ситуацию с развертыванием на периферии. В более старых моделях, таких как YOLOv9, NMS выполняется на CPU если модель работает на GPU, что создает узкое место. Результаты YOLO26 готовы к использованию сразу же, что значительно ускоряет работу на Raspberry Pi и мобильных устройствах.
Метрики производительности
В следующей таблице представлено сравнение моделей по стандартным тестам. Обратите внимание на значительное преимущество YOLO26 по скорости на CPU , что является прямым результатом оптимизации его архитектуры.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Преимущества экосистемы Ultralytics
Хотя YOLOv9 прочную теоретическую основу, использование YOLO26 в Ultralytics дает разработчикам и предприятиям ряд явных преимуществ.
Непревзойденная простота использования
Python Ultralytics преобразует сложные рабочие процессы обучения в несколько строк кода. Этот подход «от нуля до героя» контрастирует с ориентированной на исследования структурой многих других репозиториев.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
Универсальность в различных задачах
В отличие от YOLOv9, который в основном ориентирован на обнаружение, Ultralytics и YOLO26 изначально поддерживают более широкий спектр задач компьютерного зрения. Это позволяет использовать единый унифицированный API для:
- Сегментация экземпляров: точное маскирование объектов на уровне пикселей.
- Оценка позы: обнаружение ключевых точек для анализа активности человека.
- OBB (ориентированная ограничивающая рамка): обнаружение повернутых объектов, таких как корабли, на спутниковых снимках.
- Классификация: категоризация всего изображения.
Эффективность обучения и памяти
Ultralytics разработаны с учетом эффективного использования ресурсов. YOLO26 обычно требует меньше GPU (VRAM) во время обучения по сравнению с альтернативными моделями, в которых широко используются трансформеры. Такая эффективность позволяет:
- Более крупные размеры партий на потребительском оборудовании.
- Снижение затрат на облачные вычисления.
- Более быстрые циклы экспериментов с помощью готовых предварительно обученных весов.
Приложения в реальном мире
Выбор подходящей модели зависит от конкретных ограничений развертывания.
Периферийные вычисления и IoT
YOLO26 — бесспорный чемпион среди периферийных устройств. Благодаря на 43 % более быстрой CPU , он подходит для мониторинга в реальном времени на таких устройствах, как Raspberry Pi или NVIDIA Nano, без необходимости в интенсивной квантовании. Например, интеллектуальная парковочная система, работающая на локальном оборудовании, получает огромные преимущества от конструкции NMS, что снижает пики задержки.
Высотная инспекция
Для мониторинга сельского хозяйства или инспекции инфраструктуры с помощью дронов YOLO26 отлично подходит благодаря функциям ProgLoss + STAL. Они специально настроены для лучшей обработки небольших объектов и сложных соотношений сторон по сравнению с предыдущими поколениями, что обеспечивает более высокую точность обнаружения трещин в трубопроводах или вредителей на сельскохозяйственных культурах.
Академические исследования
YOLOv9 остается сильным кандидатом для академических исследований, особенно для исследований, посвященных теории градиентного потока и архитектуры сетей. Его концепция PGI предоставляет увлекательную возможность для изучения того, как нейронные сети сохраняют глубину информации.
Заключение
Обе архитектуры являются важными вехами в области компьютерного зрения. YOLOv9 важность градиентной информации в глубоких сетях. Однако YOLO26 преобразует эти уроки в готовую к производству мощную систему. Благодаря своей сквозной конструкции NMS, превосходной CPU и бесшовной интеграции в Ultralytics , YOLO26 предлагает оптимальный баланс скорости, точности и простоты использования для современных приложений искусственного интеллекта.
Разработчикам, стремящимся оставаться на передовом крае, мы рекомендуем перейти на YOLO26, чтобы воспользоваться последними достижениями в области стабильности оптимизатора и производительности на периферии.
Дополнительная литература
Если вас интересуют другие высокопроизводительные модели Ultralytics , ознакомьтесь с YOLO11 для задач общего назначения или RT-DETR для обнаружения в реальном времени на основе трансформатора.