Meet YOLO26: next-gen vision AI.

Link to this sectionЭкспорт в Intel OpenVINO#

OpenVINO Intel AI inference toolkit

В этом руководстве мы рассматриваем экспорт моделей YOLO26 в формат OpenVINO, который может обеспечить до 3-кратного ускорения на CPU, а также ускорить инференс YOLO на оборудовании Intel GPU и NPU.

OpenVINO, сокращение от Open Visual Inference & Neural Network Optimization toolkit, представляет собой комплексный инструментарий для оптимизации и развертывания моделей инференса ИИ. Несмотря на то, что название содержит слово Visual, OpenVINO также поддерживает множество других задач, включая обработку языка, аудио, временных рядов и т. д.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this sectionПримеры использования#

Формат OpenVINO поддерживает режимы Export, Predict и Validate. Экспортируй свою модель, а затем загрузи ее для выполнения инференса или проверки точности на CPU, интегрированном/дискретном GPU или NPU от Intel.

Экспорт
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
Предсказание
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
Валидация
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionАргументы экспорта#

АргументТипПо умолчаниюОписание
formatstr'openvino'Целевой формат для экспортированной модели, определяющий совместимость с различными средами развертывания.
imgszint или tuple640Желаемый размер изображения для входных данных модели. Может быть целым числом для квадратных изображений или кортежем (height, width) для конкретных размеров.
halfboolFalseВключает квантование FP16 (половинная точность), уменьшая размер модели и потенциально ускоряя вывод на поддерживаемом оборудовании.
int8boolFalseАктивирует квантование INT8, дополнительно сжимая модель и ускоряя вывод с минимальной потерей точности, в первую очередь для периферийных устройств.
dynamicboolFalseПозволяет использовать динамические размеры входных данных, повышая гибкость при обработке изображений с различными размерами.
nmsboolFalseДобавляет подавление немаксимумов (NMS), что необходимо для точной и эффективной постобработки обнаружений.
batchint1Задает размер пакета (batch) для вывода экспортированной модели или максимальное количество изображений, которые модель будет обрабатывать одновременно в режиме predict.
datastr'coco8.yaml'Путь к файлу конфигурации датасета (по умолчанию: coco8.yaml), что важно для квантования.
fractionfloat1.0Указывает часть датасета, которую нужно использовать для калибровки квантования INT8. Позволяет выполнять калибровку на подмножестве полного датасета, что полезно для экспериментов или при ограниченных ресурсах. Если не указано при включенном INT8, будет использован весь датасет.

Для получения дополнительной информации о процессе экспорта посети страницу документации Ultralytics по экспорту.

Предупреждение

OpenVINO™ совместим с большинством процессоров Intel®, но для обеспечения оптимальной производительности:

  1. Проверь поддержку OpenVINO™ Проверь, официально ли поддерживается твой чип Intel® в OpenVINO™, используя список совместимости Intel.

  2. Определи свой ускоритель Выясни, включает ли твой процессор встроенный NPU (Neural Processing Unit) или GPU (интегрированный GPU), обратившись к руководству по оборудованию Intel.

  3. Установи последние драйверы Если твой чип поддерживает NPU или GPU, но OpenVINO™ их не обнаруживает, возможно, потребуется установить или обновить соответствующие драйверы. Следуй инструкциям по установке драйверов, чтобы обеспечить полное ускорение.

Выполнив эти три шага, ты обеспечишь оптимальную работу OpenVINO™ на своем оборудовании Intel®.

Link to this sectionПреимущества OpenVINO#

  1. Производительность: OpenVINO обеспечивает высокопроизводительный инференс, используя мощность CPU, интегрированных и дискретных GPU, а также FPGA от Intel.
  2. Поддержка гетерогенного выполнения: OpenVINO предоставляет API для написания кода один раз и развертывания на любом поддерживаемом оборудовании Intel (CPU, GPU, FPGA, VPU и т. д.).
  3. Оптимизатор моделей: OpenVINO предоставляет оптимизатор моделей, который импортирует, конвертирует и оптимизирует модели из популярных фреймворков глубокого обучения, таких как PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle и Caffe.
  4. Простота использования: Инструментарий поставляется с большой коллекцией учебных блокнотов (включая оптимизацию YOLO26), обучающих различным аспектам работы с инструментарием.

Link to this sectionСтруктура экспорта OpenVINO#

Когда ты экспортируешь модель в формат OpenVINO, создается директория, содержащая следующее:

  1. XML-файл: Описывает топологию сети.
  2. BIN-файл: Содержит бинарные данные весов и смещений.
  3. Файл маппинга: Содержит сопоставление тензоров вывода оригинальной модели с именами тензоров OpenVINO.

Ты можешь использовать эти файлы для запуска инференса с помощью движка OpenVINO Inference Engine.

Link to this sectionИспользование экспорта OpenVINO при развертывании#

Как только твоя модель успешно экспортирована в формат OpenVINO, у тебя есть два основных варианта запуска инференса:

  1. Используй пакет ultralytics, который предоставляет высокоуровневый API и является оберткой для OpenVINO Runtime.

  2. Используй нативный пакет openvino для более продвинутого или кастомизированного контроля над поведением инференса.

Link to this sectionИнференс с Ultralytics#

Пакет ultralytics позволяет тебе легко запускать инференс, используя экспортированную модель OpenVINO через метод predict. Ты также можешь указать целевое устройство (например, intel:gpu, intel:npu, intel:cpu), используя аргумент device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Этот подход идеально подходит для быстрого прототипирования или развертывания, когда тебе не нужен полный контроль над конвейером инференса.

Link to this sectionИнференс с OpenVINO Runtime#

OpenVINO Runtime предоставляет унифицированный API для инференса на всем поддерживаемом оборудовании Intel. Он также предлагает продвинутые возможности, такие как балансировка нагрузки между оборудованием Intel и асинхронное выполнение. Дополнительную информацию о запуске инференса см. в блокнотах YOLO26.

Помни, что тебе понадобятся XML и BIN файлы, а также любые специфичные для приложения настройки, такие как размер входных данных, коэффициент масштабирования для нормализации и т. д., чтобы правильно настроить и использовать модель с Runtime.

В своем приложении для развертывания ты обычно выполняешь следующие шаги:

  1. Инициализируй OpenVINO, создав core = Core().
  2. Загрузи модель, используя метод core.read_model().
  3. Скомпилируй модель, используя функцию core.compile_model().
  4. Подготовь входные данные (изображение, текст, аудио и т. д.).
  5. Запусти инференс, используя compiled_model(input_data).

Более подробные шаги и фрагменты кода см. в документации OpenVINO или руководстве по API.

Link to this sectionБенчмарки OpenVINO YOLO26#

Команда Ultralytics провела тестирование YOLO26 по различным форматам моделей и точности, оценивая скорость и точность на разных устройствах Intel, совместимых с OpenVINO.

Примечание
  • Приведенные ниже результаты тестирования предназначены для справки и могут варьироваться в зависимости от точной конфигурации оборудования и программного обеспечения системы, а также от текущей нагрузки на систему во время запуска бенчмарков.

  • Все бенчмарки были запущены с использованием Python-пакета openvino версии 2026.2.0.

  • Модели YOLO26 на NPU поддерживаются только на системах Intel® Core™ Ultra™ с процессорами серии 2xxV, серии 3xx и выше.

Link to this sectionIntel® Core™ Ultra#

Серия Intel® Core™ Ultra™ представляет собой новый стандарт высокопроизводительных вычислений, разработанный для удовлетворения растущих потребностей современных пользователей — от геймеров и создателей контента до профессионалов, использующих ИИ. Эта линейка нового поколения — больше, чем просто традиционная серия CPU; она объединяет мощные ядра процессора, интегрированные высокопроизводительные графические возможности GPU и выделенный нейронный процессор (NPU) в одном чипе, предлагая единое решение для разнообразных и интенсивных вычислительных задач.

В основе архитектуры Intel® Core Ultra™ лежит гибридный дизайн, который обеспечивает исключительную производительность при выполнении традиционных задач обработки, рабочих нагрузок с ускорением на GPU и операций на основе ИИ. Включение NPU улучшает инференс ИИ на устройстве, обеспечивая более быстрое и эффективное машинное обучение и обработку данных для широкого спектра приложений.

Семейство Core Ultra™ включает различные модели, адаптированные под разные потребности в производительности, с вариантами от энергоэффективных конструкций до высокопроизводительных моделей, отмеченных обозначением "H" — идеальный выбор для ноутбуков и компактных форм-факторов, требующих серьезной вычислительной мощности. Во всей линейке пользователи получают преимущества от синергии интеграции CPU, GPU и NPU, что обеспечивает замечательную эффективность, отзывчивость и многозадачность.

Являясь частью постоянных инноваций Intel, серия Core Ultra™ устанавливает новый стандарт для вычислений будущего. Благодаря наличию множества моделей и новым анонсам впереди, эта серия подчеркивает приверженность Intel созданию передовых решений для следующего поколения интеллектуальных устройств с поддержкой ИИ.

Бенчмарки ниже запущены на Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V и Intel® Core™ Ultra™ 7 155H при точности FP32, FP16 и INT8.

Link to this sectionIntel® Core™ Ultra™ X7 358H#

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты бенчмарков
МодельФорматPrecisionСтатусРазмер (МБ)метрики/mAP50-95(B)Время вывода (мс/из)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты бенчмарков
МодельФорматPrecisionСтатусРазмер (МБ)метрики/mAP50-95(B)Время вывода (мс/из)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты бенчмарков
МодельФорматPrecisionСтатусРазмер (МБ)метрики/mAP50-95(B)Время вывода (мс/из)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

Link to this sectionВоспроизведи наши результаты#

Чтобы воспроизвести приведенные выше бенчмарки Ultralytics для всех форматов экспорта, выполни этот код:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Обрати внимание, что результаты бенчмаркинга могут варьироваться в зависимости от точной конфигурации аппаратного и программного обеспечения системы, а также от текущей нагрузки на систему во время проведения тестов. Для получения максимально достоверных результатов используй набор данных с большим количеством изображений, например data='coco.yaml' (5000 изображений в валидационной выборке).

Link to this sectionЗаключение#

Результаты бенчмаркинга наглядно демонстрируют преимущества экспорта модели YOLO26 в формат OpenVINO. Для различных моделей и аппаратных платформ формат OpenVINO неизменно превосходит другие форматы по скорости вывода, сохраняя при этом сопоставимую точность.

Эти тесты подчеркивают эффективность OpenVINO как инструмента для развертывания моделей глубокого обучения. Преобразуя модели в формат OpenVINO, ты можешь добиться значительного повышения производительности, что упрощает их развертывание в реальных задачах.

Более подробную информацию и инструкции по использованию OpenVINO можно найти в официальной документации OpenVINO.

Link to this sectionFAQ#

Link to this sectionКак экспортировать модели YOLO26 в формат OpenVINO?#

Экспорт моделей YOLO26 в формат OpenVINO может значительно увеличить скорость на CPU и обеспечить ускорение на GPU и NPU при использовании аппаратного обеспечения Intel. Для экспорта ты можешь использовать Python или CLI, как показано ниже:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Дополнительную информацию см. в документации по форматам экспорта.

Link to this sectionКаковы преимущества использования OpenVINO с моделями YOLO26?#

Использование инструментария Intel OpenVINO с моделями YOLO26 дает несколько преимуществ:

  1. Производительность: Ускорение вывода на CPU до 3 раз и использование Intel GPU и NPU для оптимизации работы.
  2. Оптимизатор моделей: Конвертируй, оптимизируй и запускай модели из популярных фреймворков, таких как PyTorch, TensorFlow и ONNX.
  3. Простота использования: Доступна обширная коллекция обучающих ноутбуков, которые помогут тебе начать работу, включая ноутбуки для YOLO26.
  4. Гетерогенное выполнение: Развертывай модели на различном оборудовании Intel с помощью единого API.

Для детального сравнения производительности посети наш раздел бенчмарков.

Link to this sectionКак запустить вывод с помощью модели YOLO26, экспортированной в OpenVINO?#

После экспорта модели YOLO26n в формат OpenVINO ты можешь запустить вывод с помощью Python или CLI:

Пример
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Подробности смотри в нашей документации по режиму предсказания (predict).

Link to this sectionПочему стоит выбрать Ultralytics YOLO26 вместо других моделей для экспорта в OpenVINO?#

Ultralytics YOLO26 оптимизирована для обнаружения объектов в реальном времени с высокой точностью и скоростью. В частности, в сочетании с OpenVINO модель YOLO26 обеспечивает:

  • Ускорение до 3 раз на CPU Intel
  • Бесшовное развертывание на GPU и NPU Intel
  • Стабильную и сопоставимую точность для различных форматов экспорта

Для углубленного анализа производительности ознакомься с нашими подробными бенчмарками YOLO26 на различном оборудовании.

Link to this sectionМогу ли я проводить бенчмаркинг моделей YOLO26 в разных форматах, таких как PyTorch, ONNX и OpenVINO?#

Да, ты можешь проводить бенчмаркинг моделей YOLO26 в различных форматах, включая PyTorch, TorchScript, ONNX и OpenVINO. Используй следующий фрагмент кода для запуска бенчмарков на выбранном наборе данных:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Для получения подробных результатов бенчмаркинга обратись к нашему разделу бенчмарков и документации по форматам экспорта.

Комментарии