Link to this sectionUltralytics YOLO26#
Link to this sectionОбзор#
Ultralytics YOLO26 — это единое семейство моделей компьютерного зрения реального времени, описанное в статье об Ultralytics YOLO26. Оно внедряет нативный end-to-end инференс, облегченную «голову» детекции, обновленный рецепт обучения и специализированные «головы» для решения задач детекции, сегментации, оценки поз, классификации и ориентированной детекции.
По всем пяти масштабам детекции YOLO26 достигает 40.9–57.5 mAP на COCO при 1.7–11.8 мс задержки T4 TensorRT. В статье также сообщается о до 43% более быстром CPU ONNX инференсе для YOLO26n по сравнению с YOLO11n на процессоре Intel Xeon @ 2.00 ГГц.

Исследуй и запускай модели YOLO26 напрямую на платформе Ultralytics.
Семейство моделей YOLO26 построено вокруг четырех областей проектирования:
- Нативный end-to-end инференс: «голова» детекции one-to-one по умолчанию выдает предсказания без подавления немаксимумов (NMS), что упрощает развертывание и снижает затраты на постпроцессинг.
- Более легкая регрессия bbox: YOLO26 удаляет Distribution Focal Loss (DFL), уменьшая сложность «головы» детекции при сохранении неограниченного диапазона регрессии.
- Обновления рецепта обучения: конвейер обучения сочетает в себе MuSGD, Progressive Loss и STAL для улучшения оптимизации, смещения фокуса обучения в сторону «головы» для инференса и сохранения покрытия позитивных меток для мелких объектов.
- Специализированные «головы» и функции потерь для задач: YOLO26 добавляет целевые разработки для сегментации экземпляров, вариантов семантической сегментации, оценки поз и ориентированной детекции, сохраняя при этом единый конвейер моделей для всех задач.
В совокупности эти обновления улучшают баланс между точностью и задержкой для разных масштабов моделей и целей развертывания.
Link to this sectionКлючевые особенности#
-
Регрессия без DFL YOLO26 удаляет Distribution Focal Loss (DFL), снижая сложность «головы» детекции и упрощая экспорт.
-
End-to-End инференс без NMS В отличие от традиционных детекторов, полагающихся на NMS как отдельный этап постпроцессинга, YOLO26 по умолчанию является нативно end-to-end. Предсказания генерируются напрямую, что снижает задержку и упрощает интеграцию в продакшн.
-
Progressive Loss + STAL Progressive Loss смещает акцент обучения на «голову» для инференса, в то время как STAL улучшает покрытие позитивных меток для мелких объектов.
-
Оптимизатор MuSGD Гибридный оптимизатор, объединяющий SGD и Muon, адаптирующий идеи оптимизации из обучения больших языковых моделей для компьютерного зрения.
-
Эффективное развертывание Упрощенная «голова» и путь по умолчанию без NMS снижают накладные расходы на инференс для различных целей экспорта и профилей оборудования, включая упомянутое в статье ускорение CPU ONNX для YOLO26n по сравнению с YOLO11n.
-
Улучшения сегментации экземпляров Внедряет функцию потерь семантической сегментации для улучшения сходимости модели и обновленный модуль proto, использующий многомасштабную информацию для обеспечения превосходного качества масок. В статье сообщается о приросте по сравнению с YOLO11 до +2.5 box AP и +3.7 mask AP на сегментации экземпляров COCO.
-
Точная оценка поз Интегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для повышения скорости инференса. В статье сообщается о приросте до +7.2 AP по сравнению с YOLO11 на оценке поз COCO.
-
Улучшенное декодирование OBB Внедряет специализированную функцию потерь по углу для повышения точности детекции квадратных объектов и оптимизирует декодирование OBB для решения проблем разрыва границ. В статье сообщается о приросте до +3.4 mAP по сравнению с YOLO11 на ориентированной детекции DOTA-v1.0.

Link to this sectionПоддерживаемые задачи и режимы#
YOLO26 поддерживает стандартный набор задач Ultralytics для пяти масштабов моделей:
| Модель | Имена файлов | Задача | Inference | Validation | Training | Экспорт |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | Детекция | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | Instance Segmentation | ✅ | ✅ | ✅ | ✅ |
| YOLO26-sem | yolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.pt | Семантическая сегментация | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | Позы/Ключевые точки | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | Ориентированная детекция | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | Классификация | ✅ | ✅ | ✅ | ✅ |
Этот единый фреймворк охватывает детекцию реального времени, сегментацию экземпляров, семантическую сегментацию, классификацию, оценку поз и ориентированную детекцию объектов с поддержкой обучения, валидации, инференса и экспорта.
yolo26-p2.yaml и yolo26-p6.yaml добавляют «голову» детекции P2 (для мелких объектов) или P6 (для больших входных данных) и поставляются только в виде YAML-архитектур. Веса в масштабах yolo26*-p2.pt или yolo26*-p6.pt не выпускаются. Создавай экземпляр масштабируемой конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай его по мере необходимости.
Link to this sectionМетрики производительности#
Смотри документацию по детекции для примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.
| Модель | размер (пиксели) | mAPval 50-95 | mAPval 50-95(e2e) | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Значения параметров и FLOPs приведены для объединенной модели после model.fuse(), которая объединяет слои Conv и BatchNorm и удаляет вспомогательную «one-to-many» голову детектирования. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие показатели.
Link to this sectionПримеры использования#
В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах документации Predict, Train, Val и Export.
Обрати внимание, что пример ниже относится к моделям YOLO26 Detect для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации по Segment, семантической сегментации, классификации, OBB и оценке позы (pose).
PyTorch предобученные модели *.pt, а также конфигурационные файлы *.yaml могут быть переданы в класс YOLO() для создания экземпляра модели в Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Модели детектирования YOLO26 используют двухголовую архитектуру, которая обеспечивает гибкость для различных сценариев развертывания:
- Голова One-to-One (по умолчанию): выдает предсказания напрямую, без использования NMS, выводя
(N, 300, 6)с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания. - Голова One-to-Many: создает традиционные выходы YOLO, требующие пост-обработки NMS, выводя
(N, nc + 4, 8400), гдеnc— количество классов. Эта голова обычно обеспечивает чуть более высокую точность ценой дополнительных вычислений.
Ты можешь переключаться между головами во время экспорта, предсказания или валидации:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # exportВыбор зависит от требований твоего развертывания: используй голову one-to-one для максимальной скорости и простоты, или голову one-to-many, когда точность является главным приоритетом.
Link to this sectionYOLOE-26: детектирование и сегментация с открытым словарем#
YOLOE-26 расширяет YOLO26 возможностями открытого словаря серии YOLOE. Это позволяет выполнять детектирование и сегментацию в реальном времени для категорий объектов из открытого множества с помощью текстовых промптов, визуальных промптов или режима без промптов.
Благодаря NMS-free, end-to-end дизайну YOLO26, YOLOE-26 обеспечивает инференс с открытым словарем, достаточно быстрый для динамических сред, где целевые категории могут меняться со временем. YOLOE-26x достигает 40.6 AP на LVIS minival при текстовых промптах, 38.5 AP при визуальных промптах и 31.1 AP в режиме без промптов (Non-E2E).
Смотри YOLOE Docs для получения примеров использования этих моделей, обученных на наборах данных Objects365v1, GQA и Flickr30k.
| Модель | размер (пиксели) | Тип промпта | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | Текст/Визуальный | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | Текст/Визуальный | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | Текст/Визуальный | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | Текст/Визуальный | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | Текст/Визуальный | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
Link to this sectionПример использования#
YOLOE-26 поддерживает как текстовое, так и визуальное промптирование. Использовать промпты просто — достаточно передать их через метод predict, как показано ниже:
Текстовые промпты позволяют указывать классы, которые ты хочешь обнаружить, с помощью текстовых описаний. Следующий код показывает, как ты можешь использовать YOLOE-26 для обнаружения людей и автобусов на изображении:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()Чтобы узнать больше о техниках промптирования и увидеть полные примеры использования, посети документацию YOLOE.
Link to this sectionЦитирование и благодарности#
Для получения полного технического описания архитектуры YOLO26, рецепта обучения, головок задач и расширения YOLOE-26 с открытым словарем прочитай Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models. Если ты используешь YOLO26 в своих исследованиях, пожалуйста, процитируй:
@misc{jocher2026ultralyticsyolo26unifiedrealtime,
title = {Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models},
author = {Glenn Jocher and Jing Qiu and Mengyu Liu and Shuai Lyu and Fatih Cagatay Akyon and Muhammet Esat Kalfaoglu},
year = {2026},
eprint = {2606.03748},
archivePrefix = {arXiv},
primaryClass = {cs.CV},
doi = {10.48550/arXiv.2606.03748},
url = {https://arxiv.org/abs/2606.03748},
}Код, модели и документация YOLO26 доступны в репозитории Ultralytics на GitHub и в документации Ultralytics по лицензиям AGPL-3.0 и Enterprise.
Link to this sectionFAQ#
Link to this sectionКаковы ключевые улучшения в YOLO26?#
- Регрессия без DFL: упрощает детектирующую головку и путь экспорта
- Сквозной инференс без NMS: удаляет NMS из стандартного пути инференса
- Прогрессивная функция потерь + STAL: улучшает выравнивание при обучении и покрытие меток для мелких объектов
- Оптимизатор MuSGD: объединяет SGD с оптимизацией, вдохновленной Muon, для стабильного обучения
- Специализированные головки и функции потерь: улучшает поддержку сегментации, оценки позы и ориентированного обнаружения
Link to this sectionКакие задачи поддерживает YOLO26?#
YOLO26 — это унифицированное семейство моделей, обеспечивающее сквозную поддержку нескольких задач компьютерного зрения:
- Обнаружение объектов (Object Detection)
- Instance Segmentation
- Семантическая сегментация
- Классификация изображений (Image Classification)
- Оценка позы (Pose Estimation)
- Ориентированное обнаружение объектов (OBB)
Каждый вариант размера (n, s, m, l, x) поддерживает все задачи, а также версии с открытым словарем через YOLOE-26.
Link to this sectionПочему YOLO26 эффективен для развертывания?#
YOLO26 повышает эффективность развертывания за счет:
- Нативной сквозной (end-to-end) инференции без NMS по умолчанию
- Регрессии без DFL и более легкой «головы» детекции
- Экспорта объединенной модели, который удаляет вспомогательные компоненты, необходимые только для обучения
- До 43% более быстрой CPU ONNX инференции для YOLO26n по сравнению с YOLO11n на процессоре Intel Xeon CPU @ 2.00 GHz
- Гибких форматов экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO
Link to this sectionКак мне начать работу с YOLO26?#
Модели YOLO26 доступны для скачивания через пакет ultralytics. Установи или обнови пакет и загрузи модель:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")Смотри раздел Usage Examples для инструкций по обучению, валидации и экспорту.