Meet YOLO26: next-gen vision AI.

Link to this sectionUltralytics YOLO26#

Link to this sectionОбзор#

Ultralytics YOLO26 — это единое семейство моделей компьютерного зрения реального времени, описанное в статье об Ultralytics YOLO26. Оно внедряет нативный end-to-end инференс, облегченную «голову» детекции, обновленный рецепт обучения и специализированные «головы» для решения задач детекции, сегментации, оценки поз, классификации и ориентированной детекции.

По всем пяти масштабам детекции YOLO26 достигает 40.9–57.5 mAP на COCO при 1.7–11.8 мс задержки T4 TensorRT. В статье также сообщается о до 43% более быстром CPU ONNX инференсе для YOLO26n по сравнению с YOLO11n на процессоре Intel Xeon @ 2.00 ГГц.

Графики сравнения Ultralytics YOLO26

Попробуй на платформе Ultralytics

Исследуй и запускай модели YOLO26 напрямую на платформе Ultralytics.

Семейство моделей YOLO26 построено вокруг четырех областей проектирования:

  • Нативный end-to-end инференс: «голова» детекции one-to-one по умолчанию выдает предсказания без подавления немаксимумов (NMS), что упрощает развертывание и снижает затраты на постпроцессинг.
  • Более легкая регрессия bbox: YOLO26 удаляет Distribution Focal Loss (DFL), уменьшая сложность «головы» детекции при сохранении неограниченного диапазона регрессии.
  • Обновления рецепта обучения: конвейер обучения сочетает в себе MuSGD, Progressive Loss и STAL для улучшения оптимизации, смещения фокуса обучения в сторону «головы» для инференса и сохранения покрытия позитивных меток для мелких объектов.
  • Специализированные «головы» и функции потерь для задач: YOLO26 добавляет целевые разработки для сегментации экземпляров, вариантов семантической сегментации, оценки поз и ориентированной детекции, сохраняя при этом единый конвейер моделей для всех задач.

В совокупности эти обновления улучшают баланс между точностью и задержкой для разных масштабов моделей и целей развертывания.

Link to this sectionКлючевые особенности#

  • Регрессия без DFL YOLO26 удаляет Distribution Focal Loss (DFL), снижая сложность «головы» детекции и упрощая экспорт.

  • End-to-End инференс без NMS В отличие от традиционных детекторов, полагающихся на NMS как отдельный этап постпроцессинга, YOLO26 по умолчанию является нативно end-to-end. Предсказания генерируются напрямую, что снижает задержку и упрощает интеграцию в продакшн.

  • Progressive Loss + STAL Progressive Loss смещает акцент обучения на «голову» для инференса, в то время как STAL улучшает покрытие позитивных меток для мелких объектов.

  • Оптимизатор MuSGD Гибридный оптимизатор, объединяющий SGD и Muon, адаптирующий идеи оптимизации из обучения больших языковых моделей для компьютерного зрения.

  • Эффективное развертывание Упрощенная «голова» и путь по умолчанию без NMS снижают накладные расходы на инференс для различных целей экспорта и профилей оборудования, включая упомянутое в статье ускорение CPU ONNX для YOLO26n по сравнению с YOLO11n.

  • Улучшения сегментации экземпляров Внедряет функцию потерь семантической сегментации для улучшения сходимости модели и обновленный модуль proto, использующий многомасштабную информацию для обеспечения превосходного качества масок. В статье сообщается о приросте по сравнению с YOLO11 до +2.5 box AP и +3.7 mask AP на сегментации экземпляров COCO.

  • Точная оценка поз Интегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для повышения скорости инференса. В статье сообщается о приросте до +7.2 AP по сравнению с YOLO11 на оценке поз COCO.

  • Улучшенное декодирование OBB Внедряет специализированную функцию потерь по углу для повышения точности детекции квадратных объектов и оптимизирует декодирование OBB для решения проблем разрыва границ. В статье сообщается о приросте до +3.4 mAP по сравнению с YOLO11 на ориентированной детекции DOTA-v1.0.

Графики сравнения Ultralytics YOLO26 End-to-End


Link to this sectionПоддерживаемые задачи и режимы#

YOLO26 поддерживает стандартный набор задач Ultralytics для пяти масштабов моделей:

МодельИмена файловЗадачаInferenceValidationTrainingЭкспорт
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptДетекция
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptInstance Segmentation
YOLO26-semyolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.ptСемантическая сегментация
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptПозы/Ключевые точки
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptОриентированная детекция
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptКлассификация

Этот единый фреймворк охватывает детекцию реального времени, сегментацию экземпляров, семантическую сегментацию, классификацию, оценку поз и ориентированную детекцию объектов с поддержкой обучения, валидации, инференса и экспорта.

Только архитектурные варианты

yolo26-p2.yaml и yolo26-p6.yaml добавляют «голову» детекции P2 (для мелких объектов) или P6 (для больших входных данных) и поставляются только в виде YAML-архитектур. Веса в масштабах yolo26*-p2.pt или yolo26*-p6.pt не выпускаются. Создавай экземпляр масштабируемой конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай его по мере необходимости.


Link to this sectionМетрики производительности#

Производительность

Смотри документацию по детекции для примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.

Модельразмер
(пиксели)
mAPval
50-95
mAPval
50-95(e2e)
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Значения параметров и FLOPs приведены для объединенной модели после model.fuse(), которая объединяет слои Conv и BatchNorm и удаляет вспомогательную «one-to-many» голову детектирования. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие показатели.


Link to this sectionПримеры использования#

В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах документации Predict, Train, Val и Export.

Обрати внимание, что пример ниже относится к моделям YOLO26 Detect для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации по Segment, семантической сегментации, классификации, OBB и оценке позы (pose).

Пример

PyTorch предобученные модели *.pt, а также конфигурационные файлы *.yaml могут быть переданы в класс YOLO() для создания экземпляра модели в Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
Двухголовая архитектура

Модели детектирования YOLO26 используют двухголовую архитектуру, которая обеспечивает гибкость для различных сценариев развертывания:

  • Голова One-to-One (по умолчанию): выдает предсказания напрямую, без использования NMS, выводя (N, 300, 6) с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания.
  • Голова One-to-Many: создает традиционные выходы YOLO, требующие пост-обработки NMS, выводя (N, nc + 4, 8400), где nc — количество классов. Эта голова обычно обеспечивает чуть более высокую точность ценой дополнительных вычислений.

Ты можешь переключаться между головами во время экспорта, предсказания или валидации:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

Выбор зависит от требований твоего развертывания: используй голову one-to-one для максимальной скорости и простоты, или голову one-to-many, когда точность является главным приоритетом.

Link to this sectionYOLOE-26: детектирование и сегментация с открытым словарем#

YOLOE-26 расширяет YOLO26 возможностями открытого словаря серии YOLOE. Это позволяет выполнять детектирование и сегментацию в реальном времени для категорий объектов из открытого множества с помощью текстовых промптов, визуальных промптов или режима без промптов.

Благодаря NMS-free, end-to-end дизайну YOLO26, YOLOE-26 обеспечивает инференс с открытым словарем, достаточно быстрый для динамических сред, где целевые категории могут меняться со временем. YOLOE-26x достигает 40.6 AP на LVIS minival при текстовых промптах, 38.5 AP при визуальных промптах и 31.1 AP в режиме без промптов (Non-E2E).

Производительность

Смотри YOLOE Docs для получения примеров использования этих моделей, обученных на наборах данных Objects365v1, GQA и Flickr30k.

Модельразмер
(пиксели)
Тип промптаmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfпараметры
(М)
FLOPs
(Б)
YOLOE-26n-seg640Текст/Визуальный23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640Текст/Визуальный29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640Текст/Визуальный35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640Текст/Визуальный36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640Текст/Визуальный39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

Link to this sectionПример использования#

YOLOE-26 поддерживает как текстовое, так и визуальное промптирование. Использовать промпты просто — достаточно передать их через метод predict, как показано ниже:

Пример

Текстовые промпты позволяют указывать классы, которые ты хочешь обнаружить, с помощью текстовых описаний. Следующий код показывает, как ты можешь использовать YOLOE-26 для обнаружения людей и автобусов на изображении:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

Чтобы узнать больше о техниках промптирования и увидеть полные примеры использования, посети документацию YOLOE.

Link to this sectionЦитирование и благодарности#

Для получения полного технического описания архитектуры YOLO26, рецепта обучения, головок задач и расширения YOLOE-26 с открытым словарем прочитай Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models. Если ты используешь YOLO26 в своих исследованиях, пожалуйста, процитируй:

Цитата
@misc{jocher2026ultralyticsyolo26unifiedrealtime,
  title = {Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models},
  author = {Glenn Jocher and Jing Qiu and Mengyu Liu and Shuai Lyu and Fatih Cagatay Akyon and Muhammet Esat Kalfaoglu},
  year = {2026},
  eprint = {2606.03748},
  archivePrefix = {arXiv},
  primaryClass = {cs.CV},
  doi = {10.48550/arXiv.2606.03748},
  url = {https://arxiv.org/abs/2606.03748},
}

Код, модели и документация YOLO26 доступны в репозитории Ultralytics на GitHub и в документации Ultralytics по лицензиям AGPL-3.0 и Enterprise.


Link to this sectionFAQ#

Link to this sectionКаковы ключевые улучшения в YOLO26?#

  • Регрессия без DFL: упрощает детектирующую головку и путь экспорта
  • Сквозной инференс без NMS: удаляет NMS из стандартного пути инференса
  • Прогрессивная функция потерь + STAL: улучшает выравнивание при обучении и покрытие меток для мелких объектов
  • Оптимизатор MuSGD: объединяет SGD с оптимизацией, вдохновленной Muon, для стабильного обучения
  • Специализированные головки и функции потерь: улучшает поддержку сегментации, оценки позы и ориентированного обнаружения

Link to this sectionКакие задачи поддерживает YOLO26?#

YOLO26 — это унифицированное семейство моделей, обеспечивающее сквозную поддержку нескольких задач компьютерного зрения:

Каждый вариант размера (n, s, m, l, x) поддерживает все задачи, а также версии с открытым словарем через YOLOE-26.

Link to this sectionПочему YOLO26 эффективен для развертывания?#

YOLO26 повышает эффективность развертывания за счет:

  • Нативной сквозной (end-to-end) инференции без NMS по умолчанию
  • Регрессии без DFL и более легкой «головы» детекции
  • Экспорта объединенной модели, который удаляет вспомогательные компоненты, необходимые только для обучения
  • До 43% более быстрой CPU ONNX инференции для YOLO26n по сравнению с YOLO11n на процессоре Intel Xeon CPU @ 2.00 GHz
  • Гибких форматов экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO

Link to this sectionКак мне начать работу с YOLO26?#

Модели YOLO26 доступны для скачивания через пакет ultralytics. Установи или обнови пакет и загрузи модель:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

Смотри раздел Usage Examples для инструкций по обучению, валидации и экспорту.

Комментарии