Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против YOLO26#

Стремительное развитие компьютерного зрения постоянно расширяет границы скорости, точности и эффективности развертывания. В области детектирования объектов в реальном времени Ultralytics неизменно задает стандарты. Это техническое сравнение посвящено переходу от высокоэффективной YOLO11 к передовой YOLO26, с анализом их архитектур, метрик производительности и оптимальных сценариев развертывания.

Независимо от того, разрабатываешь ли ты системы доставки дронами или оптимизируешь глобальный конвейер интеллектуального производства, понимание тонких различий между этими двумя моделями поможет тебе создавать надежные и перспективные ИИ-решения.

Link to this sectionЛинейка моделей и экосистема#

Обе модели выигрывают от использования комплексной экосистемы Ultralytics, отличающейся простым API, постоянной поддержкой и активным сообществом. Они предлагают непревзойденную универсальность, «из коробки» поддерживая задачи детектирования объектов, сегментации экземпляров, классификации изображений, оценки позы и ориентированных ограничивающих рамок (OBB).

Link to this sectionYOLO11: Устоявшийся стандарт#

Выпущенная в конце 2024 года, YOLO11 усовершенствовала достижения предыдущих поколений, закрепив за собой статус надежной рабочей лошадки для производственных сред.

Узнай больше о YOLO11

Link to this sectionYOLO26: Новый рубеж#

Представленная в начале 2026 года, YOLO26 знаменует собой смену парадигмы в периферийных вычислениях (edge computing) и архитектуре end-to-end, обеспечивая значительные улучшения в скорости обработки и простоте интеграции.

Узнай больше о YOLO26

Управление данными и развертыванием

И YOLO11, и YOLO26 полностью интегрированы с платформой Ultralytics, предоставляя удобные no-code рабочие процессы для разметки наборов данных, облачного обучения и мониторинга парка устройств.

Link to this sectionАрхитектурные инновации#

В то время как YOLO11 полагается на традиционные методы постобработки, которые годами лежали в основе компьютерного зрения, YOLO26 внедряет ряд структурных прорывов, призванных устранить «узкие места».

Link to this sectionСквозной дизайн без NMS#

Одним из самых значимых обновлений в YOLO26 является её архитектура end-to-end. Она исключает постобработку с помощью немаксимального подавления (NMS) — концепцию, впервые примененную в YOLOv10. Отказ от NMS кардинально упрощает конвейер развертывания и гарантирует стабильную задержку, что критически важно для приложений реального времени, таких как алгоритмы автономного вождения.

Link to this sectionУдаление DFL для оптимизации на периферийных устройствах#

YOLO26 удаляет Distribution Focal Loss (DFL). Хотя DFL был полезен в YOLO11 для точной локализации, его удаление упрощает граф экспорта сети. Эта модификация обеспечивает улучшенную совместимость с маломощным оборудованием, превращая YOLO26 в абсолютного лидера производительности на периферийных устройствах, таких как Raspberry Pi или NVIDIA Jetson.

Link to this sectionОптимизатор MuSGD#

Черпая вдохновение в механизмах обучения больших языковых моделей (LLM), в частности Kimi K2 от Moonshot AI, YOLO26 использует революционный оптимизатор MuSGD. Этот гибрид стохастического градиентного спуска (SGD) и Muon обеспечивает удивительно стабильное обучение, сходясь гораздо быстрее, чем стандартные оптимизаторы AdamW, используемые в более старых архитектурах.

Link to this sectionПродвинутые функции потерь#

YOLO26 включает в себя ProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning). Эта комбинация кардинально улучшает обнаружение мелких и плотно расположенных объектов. Кроме того, YOLO26 вводит улучшения для специфических задач: выделенный многомасштабный прототип для семантической сегментации, Residual Log-Likelihood Estimation (RLE) для сложных задач оценки позы человека и специализированную функцию потерь по углу для снижения граничных проблем при решении задач OBB.

Link to this sectionСравнение производительности#

При оценке этих моделей выбор оборудования определяется балансом между количеством параметров, вычислительной сложностью (FLOPs) и скоростью. YOLO26 специально ориентирована на скорость инференса на CPU, обеспечивая до 43% более быстрый инференс на CPU по сравнению с предшественницей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как было продемонстрировано, YOLO26 Nano (YOLO26n) делает значительный рывок в точности, одновременно сокращая время инференса на CPU с 56,1 мс до 38,9 мс при использовании ONNX Runtime.

Экспорт для достижения максимальной скорости

Чтобы выжать максимум производительности из этих моделей, используй экспорт через TensorRT на оборудовании NVIDIA или OpenVINO для CPU Intel. Дизайн YOLO26 без NMS делает процесс экспорта более гладким, чем когда-либо.

Link to this sectionСценарии использования и реальные приложения#

Выбор между YOLO11 и YOLO26 во многом зависит от твоей инфраструктуры и целей проекта.

Link to this sectionПериферийные вычисления и IoT#

Для приложений с жесткими ограничениями по питанию и аппаратному обеспечению, таких как мониторинг в умном сельском хозяйстве с помощью дронов или локальные системы охранной сигнализации, YOLO26 является бесспорным чемпионом. Удаление DFL и 43% прирост скорости CPU означают, что ты можешь запускать сложные модели компьютерного зрения на устройствах без выделенных GPU, сохраняя при этом высокую частоту кадров.

Link to this sectionОблачные решения и корпоративный масштаб#

YOLO11 остается отличным выбором для корпоративных решений, где огромные серверные фермы уже оптимизированы под её тензорные структуры. Она идеально подходит для облачной видеоаналитики и масштабных конвейеров обработки медиаданных, которые уже глубоко интегрированы с её специфическими форматами вывода.

Link to this sectionКомплексные многозадачные проекты#

Если твой проект требует предельной точности на очень маленьких объектах — например, детектирование дефектов на печатной плате или отслеживание удаленных транспортных средств на аэроснимках — реализация ProgLoss + STAL в YOLO26 обеспечивает заметный прирост полноты (recall) и точности (precision) для таких сложных граничных случаев.

Link to this sectionЭффективность обучения и требования к памяти#

Главное преимущество фреймворка Ultralytics — невероятно низкое потребление памяти во время обучения. В отличие от массивных трансформеров для зрения, таких как RT-DETR или старая YOLOv8, которые могут потреблять колоссальные объемы памяти CUDA, и YOLO11, и YOLO26 оптимизированы для эффективного обучения на потребительском оборудовании.

Интеграция оптимизатора MuSGD в YOLO26 дополнительно усиливает это преимущество, гарантируя, что модель быстрее находит оптимальные веса, сокращая общие затраты вычислительных часов GPU и расходы на облачные вычисления.

Вот простой пример, демонстрирующий, насколько легко обучить новейшую модель YOLO26, используя встроенный Python API:

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Link to this sectionИзучение альтернативных архитектур#

Хотя YOLO26 представляет собой вершину детектирования в реальном времени, изучение других моделей в документации Ultralytics может быть полезным. Для пользователей, привязанных к устаревшим средам, архитектуры прошлых лет, такие как YOLOv5, по-прежнему обеспечивают надежную производительность. Для задач zero-shot, где невозможно заранее определить классы, YOLO-World предлагает детектирование с открытым словарем на основе текстовых промптов.

Link to this sectionЗаключение#

Переход от YOLO11 к YOLO26 — это не просто инкрементальное обновление; это структурное переосмысление того, как работают модели детектирования объектов в реальном времени в продакшене. Благодаря отказу от сложных этапов постобработки и оптимизации для выполнения на периферийных устройствах, YOLO26 выделяется как лучший выбор для современных разработчиков. Опираясь на мощную экосистему Ultralytics и исчерпывающую документацию, переход на YOLO26 гарантирует более быстрое развертывание, стабильное обучение и SOTA-точность практически для любой задачи компьютерного зрения.

Контрибьюторы

Комментарии