Ultralytics YOLO26
Обзор
Ultralytics YOLO26 — это новейшая эволюция в серии детекторов объектов реального времени YOLO, разработанная с нуля для периферийных устройств и устройств с низким энергопотреблением. Она представляет собой оптимизированную архитектуру, которая устраняет излишнюю сложность и объединяет целевые инновации для обеспечения более быстрого, легкого и доступного развертывания.

Исследуй и запускай модели YOLO26 напрямую на платформе Ultralytics.
Архитектура YOLO26 опирается на три основных принципа:
- Простота: YOLO26 — это нативная сквозная (end-to-end) модель, создающая предсказания напрямую, без необходимости использования подавления немаксимумов (NMS). Исключение этого этапа постобработки делает логический вывод быстрее, легче и проще для развертывания в реальных системах. Этот прорывной подход был впервые предложен в YOLOv10 Ао Ваном из Университета Цинхуа и получил дальнейшее развитие в YOLO26.
- Эффективность развертывания: Сквозной дизайн исключает целый этап конвейера, значительно упрощая интеграцию, уменьшая задержку и делая развертывание более надежным в различных средах.
- Инновации в обучении: YOLO26 представляет оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный прорывами Moonshot AI в Kimi K2 при обучении LLM. Этот оптимизатор обеспечивает повышенную стабильность и более быструю сходимость, перенося достижения в оптимизации из языковых моделей в компьютерное зрение.
- Оптимизации для конкретных задач: YOLO26 внедряет целевые улучшения для специализированных задач, включая функцию потерь для семантической сегментации и многомасштабные модули proto для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для высокоточной оценки позы, а также оптимизированное декодирование с угловой функцией потерь для устранения проблем с границами в OBB.
Вместе эти инновации формируют семейство моделей, которые достигают более высокой точности на мелких объектах, обеспечивают бесшовное развертывание и работают до 43% быстрее на CPU — что делает YOLO26 одной из самых практичных и готовых к развертыванию моделей YOLO на сегодняшний день для сред с ограниченными ресурсами.
Ключевые особенности
-
Удаление DFL
Модуль Distribution Focal Loss (DFL), хотя и эффективен, часто усложнял экспорт и ограничивал аппаратную совместимость. YOLO26 полностью удаляет DFL, упрощая логический вывод и расширяя поддержку периферийных устройств и устройств с низким энергопотреблением. -
Сквозной (end-to-end) логический вывод без NMS
В отличие от традиционных детекторов, полагающихся на NMS как отдельный этап постобработки, YOLO26 является нативно сквозным. Предсказания генерируются напрямую, что уменьшает задержку и делает интеграцию в производственные системы быстрее, легче и надежнее. -
ProgLoss + STAL
Улучшенные функции потерь повышают точность обнаружения, с заметными улучшениями в распознавании мелких объектов, что является критически важным требованием для IoT, робототехники, аэрофотосъемки и других периферийных приложений. -
Оптимизатор MuSGD
Новый гибридный оптимизатор, сочетающий SGD с Muon. Вдохновленный Kimi K2 от Moonshot AI, MuSGD внедряет передовые методы оптимизации из обучения LLM в компьютерное зрение, обеспечивая более стабильное обучение и быструю сходимость. -
До 43% быстрее логический вывод на CPU
Специально оптимизированная для периферийных вычислений, YOLO26 обеспечивает значительно более быстрый вывод на CPU, гарантируя производительность в реальном времени на устройствах без GPU. -
Улучшения сегментации экземпляров
Внедряет функцию потерь для семантической сегментации для улучшения сходимости модели и обновленный модуль proto, который использует многомасштабную информацию для обеспечения превосходного качества масок. -
Точная оценка позы
Интегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для увеличения скорости логического вывода. -
Улучшенное декодирование OBB
Внедряет специализированную угловую функцию потерь для повышения точности обнаружения объектов квадратной формы и оптимизирует декодирование OBB для устранения проблем разрывности границ.

Поддерживаемые задачи и режимы
YOLO26 базируется на универсальном диапазоне моделей, заложенном предыдущими релизами Ultralytics YOLO, предлагая расширенную поддержку различных задач компьютерного зрения:
| Модель | Имена файлов | Задача | Вывод | Валидация | Обучение | Экспорт (Export) |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | Обнаружение | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | Сегментация экземпляров | ✅ | ✅ | ✅ | ✅ |
| YOLO26-sem | yolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.pt | Семантическая сегментация | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | Поза/Ключевые точки | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | Ориентированное обнаружение | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | Классификация | ✅ | ✅ | ✅ | ✅ |
Этот единый фреймворк гарантирует, что YOLO26 применим для обнаружения в реальном времени, сегментации экземпляров, семантической сегментации, классификации, оценки позы и ориентированного обнаружения объектов — и все это с поддержкой обучения, валидации, логического вывода и экспорта.
yolo26-p2.yaml и yolo26-p6.yaml добавляют детектирующую голову P2 (для мелких объектов) или P6 (для больших входных данных) и поставляются только в виде архитектур YAML. Веса yolo26*-p2.pt или yolo26*-p6.pt для определенных масштабов не выпускаются. Создай экземпляр масштабированной конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай её по мере необходимости.
Метрики производительности
Смотри документацию по обнаружению для получения примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.
| Модель | размер (пиксели) | mAPval 50-95 | mAPval 50-95(e2e) | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Значения Params и FLOPs указаны для объединенной модели после вызова model.fuse(), который объединяет слои Conv и BatchNorm и удаляет вспомогательную «один-ко-многим» голову детекции. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие значения.
Примеры использования
В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах Predict, Train, Val и Export.
Обрати внимание, что приведенный ниже пример относится к моделям YOLO26 Detect для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации по Segment, семантической сегментации, классификации, OBB и оценке позы.
Предобученные в PyTorch модели *.pt, а также конфигурационные файлы *.yaml можно передать в класс YOLO() для создания экземпляра модели в Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")YOLO26 оснащена архитектурой с двумя головами, что обеспечивает гибкость для различных сценариев развертывания:
- Голова «один-к-одному» (по умолчанию): Выдает предсказания end-to-end без NMS, возвращая
(N, 300, 6)с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания. - Голова «один-ко-многим»: Генерирует традиционные выходы YOLO, требующие постобработки NMS, возвращая
(N, nc + 4, 8400), гдеnc— количество классов. Эта голова обычно обеспечивает немного более высокую точность ценой дополнительных вычислений.
Ты можешь переключаться между головами во время экспорта, предсказания или валидации:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # exportВыбор зависит от требований твоего развертывания: используй голову «один-к-одному» для максимальной скорости и простоты, или голову «один-ко-многим», когда точность является главным приоритетом.
YOLOE-26: Сегментация экземпляров с открытым словарем
YOLOE-26 интегрирует высокопроизводительную архитектуру YOLO26 с возможностями открытого словаря серии YOLOE. Она обеспечивает обнаружение и сегментацию в реальном времени для любого класса объектов с использованием текстовых подсказок, визуальных подсказок или режима без подсказок для zero-shot инференса, эффективно устраняя ограничения обучения на фиксированных категориях.
Используя NMS-free, end-to-end дизайн YOLO26, YOLOE-26 обеспечивает быстрый инференс в условиях открытого мира. Это делает ее мощным решением для edge-приложений в динамических средах, где интересующие объекты представляют собой широкий и постоянно меняющийся словарь.
Смотри документацию YOLOE для примеров использования этих моделей, обученных на наборах данных Objects365v1, GQA и Flickr30k.
| Модель | размер (пиксели) | Тип подсказки | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | Текст/Визуальный | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | Текст/Визуальный | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | Текст/Визуальный | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | Текст/Визуальный | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | Текст/Визуальный | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
Пример использования
YOLOE-26 поддерживает как текстовые, так и визуальные промпты. Использовать их очень просто — достаточно передать их через метод predict, как показано ниже:
Текстовые промпты позволяют указать классы, которые ты хочешь детектировать, с помощью описаний. В следующем коде показано, как ты можешь использовать YOLOE-26 для обнаружения людей и автобусов на изображении:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()Чтобы глубоко изучить методы промптинга, обучение с нуля и полные примеры использования, посети документацию YOLOE.
Цитирование и благодарности
Ultralytics не публиковала официальную исследовательскую работу по YOLO26 из-за быстрого развития этих моделей. Вместо этого мы фокусируемся на предоставлении передовых моделей и их простоте использования. Актуальную информацию об обновлениях функций, архитектурах и использовании YOLO ты можешь найти в нашем репозитории GitHub и документации.
Если ты используешь YOLO26 или другое ПО Ultralytics в своей работе, пожалуйста, сошлися на него следующим образом:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2026},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}DOI в процессе получения. YOLO26 доступна по лицензиям AGPL-3.0 и Enterprise.
Часто задаваемые вопросы (FAQ)
Каковы основные улучшения в YOLO26 по сравнению с YOLO11?
- Удаление DFL: упрощает экспорт и расширяет совместимость с Edge-устройствами
- Конечный инференс без NMS: исключает NMS для более быстрой и простой развертки
- ProgLoss + STAL: повышает точность, особенно на мелких объектах
- Оптимизатор MuSGD: объединяет SGD и Muon (вдохновлено Kimi K2 от Moonshot) для более стабильного и эффективного обучения
- Инференс на CPU до 43% быстрее: значительный прирост производительности для устройств только с CPU
Какие задачи поддерживает YOLO26?
YOLO26 — это унифицированное семейство моделей, обеспечивающее комплексную поддержку нескольких задач компьютерного зрения:
- Детекция объектов
- Сегментация экземпляров
- Семантическая сегментация
- Классификация изображений
- Оценка позы
- Ориентированная детекция объектов (OBB)
Каждый размер модели (n, s, m, l, x) поддерживает все задачи, а также версии с открытым словарем через YOLOE-26.
Почему YOLO26 оптимизирована для развертывания на Edge-устройствах?
YOLO26 обеспечивает передовую производительность на Edge-устройствах благодаря:
- Инференс на CPU до 43% быстрее
- Уменьшенный размер модели и объем занимаемой памяти
- Упрощенная архитектура для совместимости (без DFL, без NMS)
- Гибкие форматы экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO
Как мне начать работу с YOLO26?
Модели YOLO26 были выпущены 14 января 2026 года и доступны для скачивания. Установи или обнови пакет ultralytics и загрузи модель:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")Ознакомься с разделом Usage Examples для получения инструкций по обучению, валидации и экспорту.