Ultralytics YOLO26

Обзор

Ultralytics YOLO26 — это новейшая эволюция в серии детекторов объектов реального времени YOLO, разработанная с нуля для периферийных устройств и устройств с низким энергопотреблением. Она представляет собой оптимизированную архитектуру, которая устраняет излишнюю сложность и объединяет целевые инновации для обеспечения более быстрого, легкого и доступного развертывания.

Графики сравнения Ultralytics YOLO26

Попробуй на платформе Ultralytics

Исследуй и запускай модели YOLO26 напрямую на платформе Ultralytics.

Архитектура YOLO26 опирается на три основных принципа:

  • Простота: YOLO26 — это нативная сквозная (end-to-end) модель, создающая предсказания напрямую, без необходимости использования подавления немаксимумов (NMS). Исключение этого этапа постобработки делает логический вывод быстрее, легче и проще для развертывания в реальных системах. Этот прорывной подход был впервые предложен в YOLOv10 Ао Ваном из Университета Цинхуа и получил дальнейшее развитие в YOLO26.
  • Эффективность развертывания: Сквозной дизайн исключает целый этап конвейера, значительно упрощая интеграцию, уменьшая задержку и делая развертывание более надежным в различных средах.
  • Инновации в обучении: YOLO26 представляет оптимизатор MuSGD, гибрид SGD и Muon, вдохновленный прорывами Moonshot AI в Kimi K2 при обучении LLM. Этот оптимизатор обеспечивает повышенную стабильность и более быструю сходимость, перенося достижения в оптимизации из языковых моделей в компьютерное зрение.
  • Оптимизации для конкретных задач: YOLO26 внедряет целевые улучшения для специализированных задач, включая функцию потерь для семантической сегментации и многомасштабные модули proto для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для высокоточной оценки позы, а также оптимизированное декодирование с угловой функцией потерь для устранения проблем с границами в OBB.

Вместе эти инновации формируют семейство моделей, которые достигают более высокой точности на мелких объектах, обеспечивают бесшовное развертывание и работают до 43% быстрее на CPU — что делает YOLO26 одной из самых практичных и готовых к развертыванию моделей YOLO на сегодняшний день для сред с ограниченными ресурсами.

Ключевые особенности

  • Удаление DFL
    Модуль Distribution Focal Loss (DFL), хотя и эффективен, часто усложнял экспорт и ограничивал аппаратную совместимость. YOLO26 полностью удаляет DFL, упрощая логический вывод и расширяя поддержку периферийных устройств и устройств с низким энергопотреблением.

  • Сквозной (end-to-end) логический вывод без NMS
    В отличие от традиционных детекторов, полагающихся на NMS как отдельный этап постобработки, YOLO26 является нативно сквозным. Предсказания генерируются напрямую, что уменьшает задержку и делает интеграцию в производственные системы быстрее, легче и надежнее.

  • ProgLoss + STAL
    Улучшенные функции потерь повышают точность обнаружения, с заметными улучшениями в распознавании мелких объектов, что является критически важным требованием для IoT, робототехники, аэрофотосъемки и других периферийных приложений.

  • Оптимизатор MuSGD
    Новый гибридный оптимизатор, сочетающий SGD с Muon. Вдохновленный Kimi K2 от Moonshot AI, MuSGD внедряет передовые методы оптимизации из обучения LLM в компьютерное зрение, обеспечивая более стабильное обучение и быструю сходимость.

  • До 43% быстрее логический вывод на CPU
    Специально оптимизированная для периферийных вычислений, YOLO26 обеспечивает значительно более быстрый вывод на CPU, гарантируя производительность в реальном времени на устройствах без GPU.

  • Улучшения сегментации экземпляров
    Внедряет функцию потерь для семантической сегментации для улучшения сходимости модели и обновленный модуль proto, который использует многомасштабную информацию для обеспечения превосходного качества масок.

  • Точная оценка позы
    Интегрирует Residual Log-Likelihood Estimation (RLE) для более точной локализации ключевых точек и оптимизирует процесс декодирования для увеличения скорости логического вывода.

  • Улучшенное декодирование OBB
    Внедряет специализированную угловую функцию потерь для повышения точности обнаружения объектов квадратной формы и оптимизирует декодирование OBB для устранения проблем разрывности границ.

Графики сравнения сквозного логического вывода Ultralytics YOLO26


Поддерживаемые задачи и режимы

YOLO26 базируется на универсальном диапазоне моделей, заложенном предыдущими релизами Ultralytics YOLO, предлагая расширенную поддержку различных задач компьютерного зрения:

МодельИмена файловЗадачаВыводВалидацияОбучениеЭкспорт (Export)
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptОбнаружение
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptСегментация экземпляров
YOLO26-semyolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.ptСемантическая сегментация
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptПоза/Ключевые точки
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptОриентированное обнаружение
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptКлассификация

Этот единый фреймворк гарантирует, что YOLO26 применим для обнаружения в реальном времени, сегментации экземпляров, семантической сегментации, классификации, оценки позы и ориентированного обнаружения объектов — и все это с поддержкой обучения, валидации, логического вывода и экспорта.

Варианты только архитектуры

yolo26-p2.yaml и yolo26-p6.yaml добавляют детектирующую голову P2 (для мелких объектов) или P6 (для больших входных данных) и поставляются только в виде архитектур YAML. Веса yolo26*-p2.pt или yolo26*-p6.pt для определенных масштабов не выпускаются. Создай экземпляр масштабированной конфигурации из YAML (например, YOLO("yolo26n-p6.yaml")) и обучай или дообучай её по мере необходимости.


Метрики производительности

Производительность

Смотри документацию по обнаружению для получения примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.

Модельразмер
(пиксели)
mAPval
50-95
mAPval
50-95(e2e)
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Значения Params и FLOPs указаны для объединенной модели после вызова model.fuse(), который объединяет слои Conv и BatchNorm и удаляет вспомогательную «один-ко-многим» голову детекции. Предобученные чекпоинты сохраняют полную архитектуру обучения и могут показывать более высокие значения.


Примеры использования

В этом разделе представлены простые примеры обучения и инференса YOLO26. Полную документацию по этим и другим режимам смотри на страницах Predict, Train, Val и Export.

Обрати внимание, что приведенный ниже пример относится к моделям YOLO26 Detect для обнаружения объектов. Дополнительные поддерживаемые задачи смотри в документации по Segment, семантической сегментации, классификации, OBB и оценке позы.

Пример

Предобученные в PyTorch модели *.pt, а также конфигурационные файлы *.yaml можно передать в класс YOLO() для создания экземпляра модели в Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")
Архитектура с двумя головами

YOLO26 оснащена архитектурой с двумя головами, что обеспечивает гибкость для различных сценариев развертывания:

  • Голова «один-к-одному» (по умолчанию): Выдает предсказания end-to-end без NMS, возвращая (N, 300, 6) с максимумом 300 обнаружений на изображение. Эта голова оптимизирована для быстрого инференса и упрощенного развертывания.
  • Голова «один-ко-многим»: Генерирует традиционные выходы YOLO, требующие постобработки NMS, возвращая (N, nc + 4, 8400), где nc — количество классов. Эта голова обычно обеспечивает немного более высокую точность ценой дополнительных вычислений.

Ты можешь переключаться между головами во время экспорта, предсказания или валидации:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

Выбор зависит от требований твоего развертывания: используй голову «один-к-одному» для максимальной скорости и простоты, или голову «один-ко-многим», когда точность является главным приоритетом.

YOLOE-26: Сегментация экземпляров с открытым словарем

YOLOE-26 интегрирует высокопроизводительную архитектуру YOLO26 с возможностями открытого словаря серии YOLOE. Она обеспечивает обнаружение и сегментацию в реальном времени для любого класса объектов с использованием текстовых подсказок, визуальных подсказок или режима без подсказок для zero-shot инференса, эффективно устраняя ограничения обучения на фиксированных категориях.

Используя NMS-free, end-to-end дизайн YOLO26, YOLOE-26 обеспечивает быстрый инференс в условиях открытого мира. Это делает ее мощным решением для edge-приложений в динамических средах, где интересующие объекты представляют собой широкий и постоянно меняющийся словарь.

Производительность

Смотри документацию YOLOE для примеров использования этих моделей, обученных на наборах данных Objects365v1, GQA и Flickr30k.

Модельразмер
(пиксели)
Тип подсказкиmAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfпараметры
(М)
FLOPs
(Б)
YOLOE-26n-seg640Текст/Визуальный23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640Текст/Визуальный29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640Текст/Визуальный35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640Текст/Визуальный36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640Текст/Визуальный39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

Пример использования

YOLOE-26 поддерживает как текстовые, так и визуальные промпты. Использовать их очень просто — достаточно передать их через метод predict, как показано ниже:

Пример

Текстовые промпты позволяют указать классы, которые ты хочешь детектировать, с помощью описаний. В следующем коде показано, как ты можешь использовать YOLOE-26 для обнаружения людей и автобусов на изображении:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

Чтобы глубоко изучить методы промптинга, обучение с нуля и полные примеры использования, посети документацию YOLOE.

Цитирование и благодарности

Публикация Ultralytics YOLO26

Ultralytics не публиковала официальную исследовательскую работу по YOLO26 из-за быстрого развития этих моделей. Вместо этого мы фокусируемся на предоставлении передовых моделей и их простоте использования. Актуальную информацию об обновлениях функций, архитектурах и использовании YOLO ты можешь найти в нашем репозитории GitHub и документации.

Если ты используешь YOLO26 или другое ПО Ultralytics в своей работе, пожалуйста, сошлися на него следующим образом:

Цитата
@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI в процессе получения. YOLO26 доступна по лицензиям AGPL-3.0 и Enterprise.


Часто задаваемые вопросы (FAQ)

Каковы основные улучшения в YOLO26 по сравнению с YOLO11?

  • Удаление DFL: упрощает экспорт и расширяет совместимость с Edge-устройствами
  • Конечный инференс без NMS: исключает NMS для более быстрой и простой развертки
  • ProgLoss + STAL: повышает точность, особенно на мелких объектах
  • Оптимизатор MuSGD: объединяет SGD и Muon (вдохновлено Kimi K2 от Moonshot) для более стабильного и эффективного обучения
  • Инференс на CPU до 43% быстрее: значительный прирост производительности для устройств только с CPU

Какие задачи поддерживает YOLO26?

YOLO26 — это унифицированное семейство моделей, обеспечивающее комплексную поддержку нескольких задач компьютерного зрения:

Каждый размер модели (n, s, m, l, x) поддерживает все задачи, а также версии с открытым словарем через YOLOE-26.

Почему YOLO26 оптимизирована для развертывания на Edge-устройствах?

YOLO26 обеспечивает передовую производительность на Edge-устройствах благодаря:

  • Инференс на CPU до 43% быстрее
  • Уменьшенный размер модели и объем занимаемой памяти
  • Упрощенная архитектура для совместимости (без DFL, без NMS)
  • Гибкие форматы экспорта, включая TensorRT, ONNX, CoreML, TFLite и OpenVINO

Как мне начать работу с YOLO26?

Модели YOLO26 были выпущены 14 января 2026 года и доступны для скачивания. Установи или обнови пакет ultralytics и загрузи модель:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

Ознакомься с разделом Usage Examples для получения инструкций по обучению, валидации и экспорту.

Комментарии