Ultralytics YOLO26

Обзор

Ultralytics YOLO26 — это новейшая эволюция в серии детекторов объектов реального времени YOLO, созданная с нуля для периферийных устройств и устройств с низким энергопотреблением. В ней представлен оптимизированный дизайн, который устраняет ненужную сложность и интегрирует целевые инновации для обеспечения более быстрого, легкого и доступного развертывания.

Графики сравнения Ultralytics YOLO26

Попробуй на платформе Ultralytics

Исследуй и запускай модели YOLO26 прямо на платформе Ultralytics.

Архитектура YOLO26 основана на трех ключевых принципах:

  • Простота: YOLO26 — это нативная end-to-end модель, формирующая предсказания напрямую без необходимости в не-максимальном подавлении (NMS). Исключение этого этапа пост-обработки делает вывод быстрее, легче и проще для развертывания в реальных системах. Этот прорывной подход был впервые предложен в YOLOv10 Ао Ваном из Университета Цинхуа и получил дальнейшее развитие в YOLO26.
  • Эффективность развертывания: End-to-end дизайн исключает целый этап конвейера, значительно упрощая интеграцию, уменьшая задержку и делая развертывание более надежным в разнообразных средах.
  • Инновации в обучении: YOLO26 представляет оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный прорывами Moonshot AI в Kimi K2 при обучении LLM. Этот оптимизатор обеспечивает повышенную стабильность и более быструю сходимость, перенося достижения в оптимизации из языковых моделей в компьютерное зрение.
  • Специфические оптимизации задач: YOLO26 предлагает целевые улучшения для специализированных задач, включая лосс семантической сегментации и мультимасштабные прото-модули для сегментации (Segmentation), RLE (Residual Log-Likelihood Estimation) для высокоточного оценки поз (Pose) и оптимизированное декодирование с угловым лоссом для устранения проблем границ в OBB.

Вместе эти инновации создают семейство моделей, которое достигает более высокой точности на малых объектах, обеспечивает бесшовное развертывание и работает до 43% быстрее на CPU, делая YOLO26 одной из самых практичных и готовых к развертыванию моделей YOLO для сред с ограниченными ресурсами.

Основные характеристики

  • Удаление DFL\nМодуль Distribution Focal Loss (DFL), хотя и эффективен, часто усложнял экспорт и ограничивал аппаратную совместимость. YOLO26 полностью удаляет DFL, упрощая вывод и расширяя поддержку периферийных устройств и устройств с низким энергопотреблением.

  • End-to-End вывод без NMS\nВ отличие от традиционных детекторов, которые полагаются на NMS как отдельный этап пост-обработки, YOLO26 является нативно end-to-end. Предсказания генерируются напрямую, что уменьшает задержку и делает интеграцию в производственные системы быстрее, легче и надежнее.

  • ProgLoss + STAL\nУлучшенные функции потерь повышают точность детекции, с заметными улучшениями в распознавании малых объектов, что критически важно для IoT, робототехники, аэрофотосъемки и других периферийных приложений.

  • Оптимизатор MuSGD\nНовый гибридный оптимизатор, сочетающий SGD с Muon. Вдохновленный Kimi K2 от Moonshot AI, MuSGD внедряет передовые методы оптимизации из обучения LLM в компьютерное зрение, обеспечивая более стабильное обучение и быструю сходимость.

  • До 43% быстрее вывод на CPU\nСпециально оптимизированная для периферийных вычислений, YOLO26 обеспечивает значительно более быстрый вывод на CPU, гарантируя производительность в реальном времени на устройствах без GPU.

  • Улучшения сегментации экземпляров\nВнедряет лосс семантической сегментации для улучшения сходимости модели и обновленный прото-модуль, использующий мультимасштабную информацию для превосходного качества масок.

  • Точная оценка поз\nИнтегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для увеличения скорости вывода.

  • Уточненное декодирование OBB\nВнедряет специализированный угловой лосс для повышения точности детекции квадратных объектов и оптимизирует декодирование OBB для устранения проблем разрывов на границах.

Графики сравнения Ultralytics YOLO26 End-to-End


Поддерживаемые задачи и режимы

YOLO26 продолжает развивать универсальный модельный ряд, созданный предыдущими выпусками Ultralytics YOLO, предлагая расширенную поддержку различных задач компьютерного зрения:

МодельИмена файловЗадачаЛогический выводВалидацияОбучениеЭкспорт (Export)
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptДетекция
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptСегментация экземпляров
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptПоза/Ключевые точки
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptОриентированная детекция
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptКлассификация

Этот унифицированный фреймворк гарантирует, что YOLO26 применим для детекции, сегментации, классификации, оценки позы и ориентированной детекции объектов в реальном времени — и всё это с поддержкой обучения, валидации, вывода и экспорта.

Варианты только архитектуры

yolo26-p2.yaml и yolo26-p6.yaml добавляют голову детекции P2 (для малых объектов) или P6 (для больших входных данных) и поставляются только в виде архитектур YAML. Веса yolo26*-p2.pt или yolo26*-p6.pt конкретных масштабов не выпускаются. Создай экземпляр масштабируемой конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай его по мере необходимости.


Метрики производительности

Производительность

Смотри документацию по детекции для примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.

Модельразмер
(пиксели)
mAPval
50-95
mAPval
50-95(e2e)
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Значения параметров и FLOPs указаны для объединенной (fused) модели после вызова model.fuse(), который объединяет слои Conv и BatchNorm и удаляет вспомогательную «один-ко-многим» голову обнаружения. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие значения.


Примеры использования

В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах Predict, Train, Val и Export.

Обрати внимание, что приведенный ниже пример предназначен для моделей YOLO26 Detect, используемых для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации Segment, Classify, OBB и Pose.

Пример

Предобученные PyTorch модели в формате *.pt, а также конфигурационные файлы *.yaml, можно передавать в класс YOLO() для создания экземпляра модели в Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
Архитектура с двумя головами

YOLO26 отличается архитектурой с двумя головами (dual-head), которая обеспечивает гибкость для различных сценариев развертывания:

  • Голова «один-к-одному» (по умолчанию): создает сквозные (end-to-end) предсказания без NMS, выдавая (N, 300, 6) с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания.
  • Голова «один-ко-многим»: генерирует традиционные для YOLO выходы, требующие постобработки NMS, выдавая (N, nc + 4, 8400), где nc — количество классов. Эта голова обычно обеспечивает чуть более высокую точность ценой дополнительных вычислений.

Ты можешь переключаться между головами во время экспорта, предсказания или валидации:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

Выбор зависит от требований твоего развертывания: используй голову «один-к-одному» для максимальной скорости и простоты или голову «один-ко-многим», если приоритетом является точность.

YOLOE-26: Сегментация экземпляров с открытым словарем

YOLOE-26 объединяет высокопроизводительную архитектуру YOLO26 с возможностями открытого словаря серии YOLOE. Это позволяет выполнять обнаружение и сегментацию в реальном времени для любого класса объектов с помощью текстовых подсказок, визуальных подсказок или режима без подсказок для zero-shot инференса, эффективно устраняя ограничения обучения на фиксированных категориях.

Благодаря дизайну без NMS и сквозному (end-to-end) принципу YOLO26, YOLOE-26 обеспечивает быстрый инференс в открытом мире. Это делает его мощным решением для граничных (edge) вычислений в динамических средах, где интересующие объекты представляют собой широкий и постоянно меняющийся набор категорий.

Производительность

Смотри документацию YOLOE для примеров использования с моделями, обученными на датасетах Objects365v1, GQA и Flickr30k.

Модельразмер
(пиксели)
Тип подсказкиmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfпараметры
(М)
FLOPs
(Б)
YOLOE-26n-seg640Текст/Визуал23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640Текст/Визуал29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640Текст/Визуал35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640Текст/Визуал36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640Текст/Визуал39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

Пример использования

YOLOE-26 поддерживает текстовые и визуальные подсказки. Использовать подсказки просто — достаточно передать их через метод predict, как показано ниже:

Пример

Текстовые подсказки позволяют тебе указывать классы, которые ты хочешь обнаружить, с помощью текстовых описаний. В следующем коде показано, как ты можешь использовать YOLOE-26 для поиска людей и автобусов на изображении:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

Для более глубокого изучения методов подсказок, обучения с нуля и полных примеров использования посети документацию YOLOE.

Цитирование и благодарности

Публикация Ultralytics YOLO26

Ultralytics не публиковала официальную исследовательскую работу по YOLO26 из-за быстрого развития моделей. Вместо этого мы фокусируемся на предоставлении передовых моделей и их простоте использования. Последние обновления функций, архитектур и использования YOLO ты найдешь в нашем репозитории на GitHub и в документации.

Если ты используешь YOLO26 или другое программное обеспечение Ultralytics в своей работе, пожалуйста, сошлися на него так:

Цитата
@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI в ожидании. YOLO26 доступна по лицензиям AGPL-3.0 и Enterprise.


Часто задаваемые вопросы (FAQ)

Каковы ключевые улучшения в YOLO26 по сравнению с YOLO11?

  • Удаление DFL: упрощает экспорт и расширяет совместимость с периферийными устройствами
  • Сквозной вывод без NMS: исключает NMS для более быстрой и простой реализации
  • ProgLoss + STAL: повышает точность, особенно для мелких объектов
  • Оптимизатор MuSGD: объединяет SGD и Muon (вдохновлено Kimi K2 от Moonshot) для более стабильного и эффективного обучения
  • До 43% быстрее вывод на CPU: значительный прирост производительности для устройств, работающих только на CPU

Какие задачи поддерживает YOLO26?

YOLO26 — это унифицированное семейство моделей, обеспечивающее комплексную поддержку множества задач компьютерного зрения:

Каждый размер (n, s, m, l, x) поддерживает все задачи, плюс версии с открытым словарем через YOLOE-26.

Почему YOLO26 оптимизирована для развертывания на периферии?

YOLO26 обеспечивает передовую производительность на периферийных устройствах благодаря:

  • Выводу на CPU, работающему до 43% быстрее
  • Уменьшенному размеру модели и занимаемой памяти
  • Архитектуре, упрощенной для совместимости (нет DFL, нет NMS)
  • Гибким форматам экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO

Как мне начать работать с YOLO26?

Модели YOLO26 были выпущены 14 января 2026 года и доступны для скачивания. Установи или обнови пакет ultralytics и загрузи модель:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

Инструкции по обучению, проверке и экспорту смотри в разделе Примеры использования.

Комментарии