YOLO11 против YOLO26: эволюция зрения ИИ следующего поколения

Быстрая эволюция компьютерного зрения постоянно расширяет границы скорости, точности и эффективности развертывания. В области обнаружения объектов в реальном времени Ultralytics неизменно задает стандарт. Это техническое сравнение исследует переход от весьма успешной модели YOLO11 к передовой YOLO26, анализируя их архитектуры, показатели производительности и идеальные сценарии развертывания.

Независимо от того, создаешь ли ты системы доставки дронами или оптимизируешь глобальный конвейер «умного» производства, понимание тонких различий между этими двумя моделями поможет тебе создавать надежные и перспективные ИИ-решения.

Линейка моделей и экосистема

Обе модели получают преимущество от комплексной экосистемы Ultralytics, отличающейся простым API, постоянной поддержкой и активным сообществом. Они предлагают непревзойденную универсальность, «из коробки» поддерживая задачи обнаружения объектов, сегментации экземпляров, классификации изображений, оценки позы и ориентированных ограничивающих рамок (OBB).

YOLO11: признанный стандарт

Выпущенная в конце 2024 года, YOLO11 усовершенствовала достижения предыдущих поколений, закрепив за собой статус надежной рабочей лошадки для производственных сред.

Узнай больше о YOLO11

YOLO26: новый рубеж

Представленная в начале 2026 года, YOLO26 знаменует собой сдвиг парадигмы в граничных вычислениях и архитектуре «от конца к концу» (end-to-end), обеспечивая значительные улучшения в скорости обработки и простоте интеграции.

Узнай больше о YOLO26

Управление данными и развертыванием

И YOLO11, и YOLO26 полностью интегрированы с платформой Ultralytics, предоставляя бесшовные no-code рабочие процессы для аннотирования наборов данных, обучения в облаке и мониторинга парка устройств.

Архитектурные инновации

В то время как YOLO11 опирается на традиционные методы постобработки, которые годами обеспечивали работу компьютерного зрения, YOLO26 внедряет несколько структурных прорывов, призванных устранить узкие места.

Сквозной дизайн без NMS

Одним из наиболее значимых обновлений в YOLO26 является ее архитектура «от конца к концу» (end-to-end). Она устраняет постобработку методом подавления немаксимумов (NMS), концепцию, впервые опробованную в YOLOv10. Отказ от NMS радикально упрощает конвейер развертывания и гарантирует стабильную задержку, что крайне важно для приложений реального времени, таких как алгоритмы автономного вождения.

Удаление DFL для оптимизации на периферии

YOLO26 исключает функцию Distribution Focal Loss (DFL). Хотя DFL была полезна в YOLO11 для точной локализации, ее удаление упрощает граф экспорта сети. Эта модификация обеспечивает повышенную совместимость с маломощным оборудованием, превращая YOLO26 в абсолютную мощь для периферийных устройств, таких как Raspberry Pi или NVIDIA Jetson.

Оптимизатор MuSGD

Черпая вдохновение в механизмах обучения больших языковых моделей (LLM), в частности Kimi K2 от Moonshot AI, YOLO26 использует революционный оптимизатор MuSGD. Этот гибрид стохастического градиентного спуска (SGD) и Muon обеспечивает удивительно стабильные прогоны обучения, сходясь гораздо быстрее, чем стандартные оптимизаторы AdamW, используемые в старых архитектурах.

Продвинутые функции потерь

YOLO26 включает ProgLoss + STAL (Progressive Loss and Scale-Aware Task Alignment Learning). Эта комбинация кардинально улучшает обнаружение мелких и плотно упакованных объектов. Кроме того, YOLO26 вводит улучшения, специфичные для задач: специализированный многомасштабный прототип для семантической сегментации, Residual Log-Likelihood Estimation (RLE) для сложных оценок позы человека и специальную функцию потерь угла для снижения проблем с границами в задачах обнаружения OBB.

Сравнение производительности

При оценке этих моделей баланс между количеством параметров, вычислительной сложностью (FLOPs) и скоростью определяет выбор оборудования. YOLO26 специально нацелена на скорость инференса на CPU, достигая до 43% более быстрого инференса на CPU по сравнению с предшественником.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как было показано, YOLO26 Nano (YOLO26n) значительно увеличивает точность, одновременно сокращая время инференса на CPU с 56,1 мс до 38,9 мс при использовании ONNX Runtime.

Экспорт для достижения максимальной скорости

Чтобы выжать максимум производительности из этих моделей, экспортируй их с использованием TensorRT на оборудовании NVIDIA или OpenVINO для CPU Intel. Благодаря дизайну YOLO26 без NMS этот процесс экспорта стал как никогда гладким.

Варианты использования и реальные приложения

Выбор между YOLO11 и YOLO26 в значительной степени зависит от твоей конкретной инфраструктуры и целей проекта.

Периферийные вычисления и IoT

Для приложений, ограниченных питанием и аппаратными средствами, таких как мониторинг «умного» сельского хозяйства с помощью дронов или локальные системы охранной сигнализации, YOLO26 является бесспорным чемпионом. Удаление DFL и 43% прирост скорости CPU означают, что ты можешь запускать сложные модели зрения на устройствах без выделенных GPU, сохраняя при этом высокую частоту кадров.

Облачные решения и корпоративный масштаб

YOLO11 остается отличным выбором для корпоративных решений, где массивные серверные фермы уже оптимизированы под ее тензорные структуры. Она идеально подходит для облачной видеоаналитики и крупномасштабных конвейеров обработки медиаданных, которые уже глубоко интегрированы с ее специфическими форматами вывода.

Сложные многозадачные проекты

Если твой проект требует предельной точности при работе с мелкими объектами — например, обнаружение дефектов на печатной плате или отслеживание удаленных транспортных средств на аэрофотоснимках — реализация ProgLoss + STAL в YOLO26 обеспечивает заметный прирост полноты (recall) и точности для таких сложных случаев.

Эффективность обучения и требования к памяти

Главное преимущество фреймворка Ultralytics — невероятно низкое потребление памяти во время обучения. В отличие от огромных трансформеров зрения, таких как RT-DETR или более старой YOLOv8, которые могут потреблять огромные объемы памяти CUDA, и YOLO11, и YOLO26 оптимизированы для эффективного обучения на потребительском оборудовании.

Интеграция оптимизатора MuSGD в YOLO26 дополнительно усиливает это преимущество, гарантируя, что модель быстрее находит оптимальные веса, сокращая общие часы вычислений GPU и затраты на облачные вычисления.

Вот простой пример, демонстрирующий, насколько легко обучить новейшую модель YOLO26 с помощью Python API:

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Исследование альтернативных архитектур

Хотя YOLO26 представляет собой вершину обнаружения в реальном времени, изучение других моделей в документации Ultralytics может быть полезным. Для пользователей, привязанных к устаревшим средам, более ранние архитектуры, такие как YOLOv5, по-прежнему обеспечивают надежную производительность. Для задач zero-shot, где невозможно заранее определить классы, YOLO-World предлагает обнаружение с открытым словарем, работающее на основе текстовых подсказок.

Заключение

Скачок от YOLO11 к YOLO26 — это не просто инкрементальное обновление; это структурное переосмысление того, как работают модели обнаружения объектов в реальном времени в производстве. Отказавшись от сложных этапов постобработки и оптимизировавшись для выполнения преимущественно на периферии, YOLO26 выделяется как лучший выбор для современных разработчиков. При поддержке надежной экосистемы Ultralytics и исчерпывающей документации, обновление до YOLO26 гарантирует более быстрое развертывание, стабильное обучение и SOTA-точность практически для любой задачи компьютерного зрения.

Комментарии