Ultralytics YOLO26
Обзор
Ultralytics YOLO26 — это новейшая эволюция в серии детекторов объектов реального времени YOLO, созданная с нуля для периферийных устройств и устройств с низким энергопотреблением. В ней представлен оптимизированный дизайн, который устраняет ненужную сложность и интегрирует целевые инновации для обеспечения более быстрого, легкого и доступного развертывания.

Исследуй и запускай модели YOLO26 прямо на платформе Ultralytics.
Архитектура YOLO26 основана на трех ключевых принципах:
- Простота: YOLO26 — это нативная end-to-end модель, формирующая предсказания напрямую без необходимости в не-максимальном подавлении (NMS). Исключение этого этапа пост-обработки делает вывод быстрее, легче и проще для развертывания в реальных системах. Этот прорывной подход был впервые предложен в YOLOv10 Ао Ваном из Университета Цинхуа и получил дальнейшее развитие в YOLO26.
- Эффективность развертывания: End-to-end дизайн исключает целый этап конвейера, значительно упрощая интеграцию, уменьшая задержку и делая развертывание более надежным в разнообразных средах.
- Инновации в обучении: YOLO26 представляет оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный прорывами Moonshot AI в Kimi K2 при обучении LLM. Этот оптимизатор обеспечивает повышенную стабильность и более быструю сходимость, перенося достижения в оптимизации из языковых моделей в компьютерное зрение.
- Специфические оптимизации задач: YOLO26 предлагает целевые улучшения для специализированных задач, включая лосс семантической сегментации и мультимасштабные прото-модули для сегментации (Segmentation), RLE (Residual Log-Likelihood Estimation) для высокоточного оценки поз (Pose) и оптимизированное декодирование с угловым лоссом для устранения проблем границ в OBB.
Вместе эти инновации создают семейство моделей, которое достигает более высокой точности на малых объектах, обеспечивает бесшовное развертывание и работает до 43% быстрее на CPU, делая YOLO26 одной из самых практичных и готовых к развертыванию моделей YOLO для сред с ограниченными ресурсами.
Основные характеристики
-
Удаление DFL\nМодуль Distribution Focal Loss (DFL), хотя и эффективен, часто усложнял экспорт и ограничивал аппаратную совместимость. YOLO26 полностью удаляет DFL, упрощая вывод и расширяя поддержку периферийных устройств и устройств с низким энергопотреблением.
-
End-to-End вывод без NMS\nВ отличие от традиционных детекторов, которые полагаются на NMS как отдельный этап пост-обработки, YOLO26 является нативно end-to-end. Предсказания генерируются напрямую, что уменьшает задержку и делает интеграцию в производственные системы быстрее, легче и надежнее.
-
ProgLoss + STAL\nУлучшенные функции потерь повышают точность детекции, с заметными улучшениями в распознавании малых объектов, что критически важно для IoT, робототехники, аэрофотосъемки и других периферийных приложений.
-
Оптимизатор MuSGD\nНовый гибридный оптимизатор, сочетающий SGD с Muon. Вдохновленный Kimi K2 от Moonshot AI, MuSGD внедряет передовые методы оптимизации из обучения LLM в компьютерное зрение, обеспечивая более стабильное обучение и быструю сходимость.
-
До 43% быстрее вывод на CPU\nСпециально оптимизированная для периферийных вычислений, YOLO26 обеспечивает значительно более быстрый вывод на CPU, гарантируя производительность в реальном времени на устройствах без GPU.
-
Улучшения сегментации экземпляров\nВнедряет лосс семантической сегментации для улучшения сходимости модели и обновленный прото-модуль, использующий мультимасштабную информацию для превосходного качества масок.
-
Точная оценка поз\nИнтегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для увеличения скорости вывода.
-
Уточненное декодирование OBB\nВнедряет специализированный угловой лосс для повышения точности детекции квадратных объектов и оптимизирует декодирование OBB для устранения проблем разрывов на границах.

Поддерживаемые задачи и режимы
YOLO26 продолжает развивать универсальный модельный ряд, созданный предыдущими выпусками Ultralytics YOLO, предлагая расширенную поддержку различных задач компьютерного зрения:
| Модель | Имена файлов | Задача | Логический вывод | Валидация | Обучение | Экспорт (Export) |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | Детекция | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | Сегментация экземпляров | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | Поза/Ключевые точки | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | Ориентированная детекция | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | Классификация | ✅ | ✅ | ✅ | ✅ |
Этот унифицированный фреймворк гарантирует, что YOLO26 применим для детекции, сегментации, классификации, оценки позы и ориентированной детекции объектов в реальном времени — и всё это с поддержкой обучения, валидации, вывода и экспорта.
yolo26-p2.yaml и yolo26-p6.yaml добавляют голову детекции P2 (для малых объектов) или P6 (для больших входных данных) и поставляются только в виде архитектур YAML. Веса yolo26*-p2.pt или yolo26*-p6.pt конкретных масштабов не выпускаются. Создай экземпляр масштабируемой конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай его по мере необходимости.
Метрики производительности
Смотри документацию по детекции для примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.
| Модель | размер (пиксели) | mAPval 50-95 | mAPval 50-95(e2e) | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Значения параметров и FLOPs указаны для объединенной (fused) модели после вызова model.fuse(), который объединяет слои Conv и BatchNorm и удаляет вспомогательную «один-ко-многим» голову обнаружения. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие значения.
Примеры использования
В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах Predict, Train, Val и Export.
Обрати внимание, что приведенный ниже пример предназначен для моделей YOLO26 Detect, используемых для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации Segment, Classify, OBB и Pose.
Предобученные PyTorch модели в формате *.pt, а также конфигурационные файлы *.yaml, можно передавать в класс YOLO() для создания экземпляра модели в Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")YOLO26 отличается архитектурой с двумя головами (dual-head), которая обеспечивает гибкость для различных сценариев развертывания:
- Голова «один-к-одному» (по умолчанию): создает сквозные (end-to-end) предсказания без NMS, выдавая
(N, 300, 6)с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания. - Голова «один-ко-многим»: генерирует традиционные для YOLO выходы, требующие постобработки NMS, выдавая
(N, nc + 4, 8400), гдеnc— количество классов. Эта голова обычно обеспечивает чуть более высокую точность ценой дополнительных вычислений.
Ты можешь переключаться между головами во время экспорта, предсказания или валидации:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # exportВыбор зависит от требований твоего развертывания: используй голову «один-к-одному» для максимальной скорости и простоты или голову «один-ко-многим», если приоритетом является точность.
YOLOE-26: Сегментация экземпляров с открытым словарем
YOLOE-26 объединяет высокопроизводительную архитектуру YOLO26 с возможностями открытого словаря серии YOLOE. Это позволяет выполнять обнаружение и сегментацию в реальном времени для любого класса объектов с помощью текстовых подсказок, визуальных подсказок или режима без подсказок для zero-shot инференса, эффективно устраняя ограничения обучения на фиксированных категориях.
Благодаря дизайну без NMS и сквозному (end-to-end) принципу YOLO26, YOLOE-26 обеспечивает быстрый инференс в открытом мире. Это делает его мощным решением для граничных (edge) вычислений в динамических средах, где интересующие объекты представляют собой широкий и постоянно меняющийся набор категорий.
Смотри документацию YOLOE для примеров использования с моделями, обученными на датасетах Objects365v1, GQA и Flickr30k.
| Модель | размер (пиксели) | Тип подсказки | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | Текст/Визуал | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | Текст/Визуал | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | Текст/Визуал | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | Текст/Визуал | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | Текст/Визуал | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
Пример использования
YOLOE-26 поддерживает текстовые и визуальные подсказки. Использовать подсказки просто — достаточно передать их через метод predict, как показано ниже:
Текстовые подсказки позволяют тебе указывать классы, которые ты хочешь обнаружить, с помощью текстовых описаний. В следующем коде показано, как ты можешь использовать YOLOE-26 для поиска людей и автобусов на изображении:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()Для более глубокого изучения методов подсказок, обучения с нуля и полных примеров использования посети документацию YOLOE.
Цитирование и благодарности
Ultralytics не публиковала официальную исследовательскую работу по YOLO26 из-за быстрого развития моделей. Вместо этого мы фокусируемся на предоставлении передовых моделей и их простоте использования. Последние обновления функций, архитектур и использования YOLO ты найдешь в нашем репозитории на GitHub и в документации.
Если ты используешь YOLO26 или другое программное обеспечение Ultralytics в своей работе, пожалуйста, сошлися на него так:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2026},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}DOI в ожидании. YOLO26 доступна по лицензиям AGPL-3.0 и Enterprise.
Часто задаваемые вопросы (FAQ)
Каковы ключевые улучшения в YOLO26 по сравнению с YOLO11?
- Удаление DFL: упрощает экспорт и расширяет совместимость с периферийными устройствами
- Сквозной вывод без NMS: исключает NMS для более быстрой и простой реализации
- ProgLoss + STAL: повышает точность, особенно для мелких объектов
- Оптимизатор MuSGD: объединяет SGD и Muon (вдохновлено Kimi K2 от Moonshot) для более стабильного и эффективного обучения
- До 43% быстрее вывод на CPU: значительный прирост производительности для устройств, работающих только на CPU
Какие задачи поддерживает YOLO26?
YOLO26 — это унифицированное семейство моделей, обеспечивающее комплексную поддержку множества задач компьютерного зрения:
- Обнаружение объектов
- Сегментация экземпляров
- Классификация изображений
- Оценка позы
- Ориентированное обнаружение объектов (OBB)
Каждый размер (n, s, m, l, x) поддерживает все задачи, плюс версии с открытым словарем через YOLOE-26.
Почему YOLO26 оптимизирована для развертывания на периферии?
YOLO26 обеспечивает передовую производительность на периферийных устройствах благодаря:
- Выводу на CPU, работающему до 43% быстрее
- Уменьшенному размеру модели и занимаемой памяти
- Архитектуре, упрощенной для совместимости (нет DFL, нет NMS)
- Гибким форматам экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO
Как мне начать работать с YOLO26?
Модели YOLO26 были выпущены 14 января 2026 года и доступны для скачивания. Установи или обнови пакет ultralytics и загрузи модель:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")Инструкции по обучению, проверке и экспорту смотри в разделе Примеры использования.