Перейти к содержанию

YOLO11 против YOLO26: Эволюция ИИ для компьютерного зрения в реальном времени

Область компьютерного зрения быстро развивается, и Ultralytics продолжает лидировать, предлагая передовые модели обнаружения объектов. Это сравнение исследует архитектурную эволюцию, метрики производительности и практические применения YOLO11, выпущенной в конце 2024 года, и новаторской YOLO26, выпущенной в январе 2026 года. Хотя обе модели представляют собой вершину ИИ для компьютерного зрения на момент их выпуска, YOLO26 вводит значительные архитектурные изменения, которые переопределяют эффективность и скорость для развертывания на периферии.

Обзор модели

YOLO11

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHub:Репозиторий Ultralytics
Документация:Документация YOLO11

YOLO11 ознаменовал значительное усовершенствование в серии YOLO, предлагая сокращение параметров на 22% по сравнению с YOLOv8 при одновременном повышении точности detect. Он представил улучшенную архитектурную конструкцию, которая сбалансировала скорость и точность, что сделало его надежным выбором для различных задач компьютерного зрения, начиная от обнаружения объектов до сегментации экземпляров.

Узнайте больше о YOLO11

YOLO26

Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 2026-01-14
GitHub:Репозиторий Ultralytics
Документация:Документация YOLO26

YOLO26 представляет собой смену парадигмы благодаря своей нативной сквозной NMS-free архитектуре, устраняющей необходимость в постобработке Non-Maximum Suppression. Это нововведение, впервые примененное в YOLOv10, значительно упрощает конвейеры развертывания и снижает задержку. YOLO26 специально оптимизирован для граничных вычислений, обеспечивая до 43% более быстрый вывод на CPU и включая новые методы обучения, такие как оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM.

Узнайте больше о YOLO26

Преимущество сквозной задержки

Удаляя шаг NMS, YOLO26 обеспечивает стабильное время инференса независимо от количества обнаруженных объектов в сцене. Это критически важно для приложений реального времени, таких как автономное вождение, где пики пост-обработки могут вызывать опасные задержки.

Сравнение производительности

В таблице ниже представлены улучшения производительности YOLO26 по сравнению с YOLO11. Обратите внимание на существенный прирост скорости CPU, что делает YOLO26 исключительно эффективным для устройств без выделенных GPU, таких как Raspberry Pi или мобильные телефоны.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Архитектурное Глубокое Погружение

Архитектура YOLO11

YOLO11 основывался на концепции бэкбона CSPNet, уточняя слои извлечения признаков для захвата более детальной информации. Он использовал стандартную безъякорную голову обнаружения и полагался на Distribution Focal Loss (DFL) для уточнения регрессии ограничивающих рамок. Хотя он был очень эффективен, зависимость от NMS означала, что скорость инференса могла колебаться в зависимости от плотности сцены, что является распространенным узким местом в видеонаблюдении умного города.

Архитектура YOLO26

YOLO26 представляет несколько радикальных изменений, разработанных для повышения эффективности и стабильности:

  1. Комплексный подход без NMS: Модель предсказывает фиксированный набор ограничивающих рамок с сопоставлением один к одному во время обучения, устраняя эвристический шаг NMS во время инференса.
  2. Удаление DFL: Distribution Focal Loss был удален для упрощения процесса экспорта в такие форматы, как ONNX и TensorRT, что повышает совместимость с маломощными периферийными устройствами.
  3. Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI и обучением больших языковых моделей (LLM), этот гибридный оптимизатор сочетает SGD и Muon для обеспечения более быстрой сходимости и более стабильных циклов обучения, уменьшая «пики потерь», часто наблюдаемые при обучении крупномасштабных моделей компьютерного зрения.
  4. ProgLoss + STAL: Новые функции потерь (Progressive Loss и Soft-Target Assignment Loss) специально нацелены на распознавание мелких объектов, обеспечивая значительный прирост для анализа аэрофотоснимков и датчиков IoT.

Универсальность задач

Обе модели поддерживают широкий спектр задач в экосистеме Ultralytics, позволяя разработчикам переключаться между моделями без переписывания своих конвейеров.

  • Обнаружение: Стандартное обнаружение ограничивающих рамок.
  • Сегментация: Маски на уровне пикселей. YOLO26 добавляет специфическую потерю семантической сегментации и многомасштабный прототип для лучшего качества масок.
  • Классификация: Категоризация целых изображений.
  • Оценка позы: Обнаружение ключевых точек. YOLO26 использует Residual Log-Likelihood Estimation (RLE) для более высокой точности в сложных позах, что полезно для спортивной аналитики.
  • OBB (ориентированные ограничивающие рамки): Повернутые рамки для аэрофотоснимков или объектов под углом. YOLO26 включает специализированную потерю угла для решения проблем разрыва границ, распространенных на спутниковых снимках.

Обучение и использование

Одной из отличительных черт экосистемы Ultralytics является унифицированный API. Независимо от того, используете ли вы YOLO11 или обновляетесь до YOLO26, код остается практически идентичным, что минимизирует технический долг.

Пример на Python

Вот как вы можете обучить новую модель YOLO26, используя тот же привычный интерфейс, что и для YOLO11. Этот пример демонстрирует обучение на наборе данных COCO8, небольшом наборе из 8 изображений, идеально подходящем для тестирования.

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model
# The MuSGD optimizer is handled automatically internally for YOLO26 models
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Use '0' for GPU
)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Пример CLI

Интерфейс командной строки одинаково оптимизирован, что позволяет быстро проводить эксперименты и бенчмаркинг моделей.

# Train YOLO26n on the COCO8 dataset
yolo train model=yolo26n.pt data=coco8.yaml epochs=100 imgsz=640

# Export to ONNX for simplified edge deployment
yolo export model=yolo26n.pt format=onnx

Идеальные варианты использования

Выберите YOLO11, если:

  • У вас есть существующий производственный конвейер, высоко оптимизированный для YOLO11, и вы не можете позволить себе время на валидацию новой архитектуры.
  • Ваше оборудование для развертывания имеет специфические оптимизации для структуры слоев YOLO11, которые еще не были обновлены для YOLO26.

Выберите YOLO26, если:

  • Критически важно развертывание на периферии: Удаление NMS и DFL делает YOLO26 превосходным выбором для приложений для Android/iOS и встроенных систем, где циклы CPU ценны.
  • Обнаружение мелких объектов: Функции ProgLoss и STAL делают его значительно лучше для идентификации вредителей в сельском хозяйстве или удаленных объектов на кадрах с дронов.
  • Стабильность обучения: Если вы обучаетесь на массивных пользовательских наборах данных и сталкивались с проблемами расходимости, оптимизатор MuSGD в YOLO26 предлагает более стабильный путь обучения.
  • Простейший экспорт: Сквозная архитектура экспортируется более чисто в такие форматы, как CoreML и TensorRT, без необходимости в сложных внешних плагинах NMS.

Для разработчиков, заинтересованных в изучении других вариантов в семействе Ultralytics, модели, такие как YOLOv10 (предшественник сквозного YOLO) или YOLO-World (для обнаружения с открытым словарем), также полностью поддерживаются.

Заключение

Хотя YOLO11 остается надежной и высокопроизводительной моделью, YOLO26 устанавливает новую планку для возможностей компьютерного зрения в реальном времени. Интегрируя динамику обучения, вдохновленную LLM, и упрощая конвейер вывода за счет архитектуры без NMS, Ultralytics создала модель, которая не только более точна, но и значительно проще в развертывании в реальных условиях.

Экосистема Ultralytics обеспечивает бесшовное обновление. Благодаря более низким требованиям к памяти во время обучения и более высокой скорости CPU во время вывода, YOLO26 является рекомендуемой отправной точкой для всех новых проектов в 2026 году.

Начать работу с Ultralytics


Комментарии