Экспорт в Intel OpenVINO

OpenVINO Intel AI inference toolkit

В этом руководстве мы расскажем об экспорте моделей YOLO26 в формат OpenVINO, который может обеспечить ускорение CPU до 3 раз, а также ускорить инференс YOLO на оборудовании Intel GPU и NPU.

OpenVINO, сокращение от Open Visual Inference & Neural Network Optimization toolkit, — это комплексный набор инструментов для оптимизации и развертывания моделей ИИ-инференса. Несмотря на то, что в названии есть слово Visual, OpenVINO также поддерживает множество дополнительных задач, включая язык, аудио, временные ряды и т. д.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Примеры использования

Экспортируй модель YOLO26n в формат OpenVINO и запусти инференс с экспортированной моделью.

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

# Run inference with specified device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")

Аргументы экспорта

АргументТипПо умолчаниюОписание
formatstr'openvino'Целевой формат для экспортированной модели, определяющий совместимость с различными средами развертывания.
imgszint или tuple640Желаемый размер изображения для ввода модели. Может быть целым числом для квадратных изображений или кортежем (height, width) для конкретных размеров.
halfboolFalseВключает квантование FP16 (половинной точности), уменьшая размер модели и потенциально ускоряя инференс на поддерживаемом оборудовании.
int8boolFalseАктивирует квантование INT8, дополнительно сжимая модель и ускоряя инференс с минимальной потерей accuracy, в основном для периферийных устройств.
dynamicboolFalseРазрешает динамические размеры входных данных, повышая гибкость при обработке изображений разных размеров.
nmsboolFalseДобавляет Non-Maximum Suppression (NMS), необходимый для точной и эффективной постобработки обнаружений.
batchint1Указывает размер батча для инференса экспортированной модели или максимальное количество изображений, которые модель будет обрабатывать одновременно в режиме predict.
datastr'coco8.yaml'Путь к файлу конфигурации dataset (по умолчанию: coco8.yaml), необходимый для квантования.
fractionfloat1.0Указывает долю набора данных для калибровки квантования INT8. Позволяет проводить калибровку на подмножестве полного набора данных, что полезно для экспериментов или при ограниченных ресурсах. Если параметр не указан при включенном INT8, будет использоваться весь набор данных.

Чтобы узнать больше о процессе экспорта, посети страницу документации Ultralytics по экспорту.

Предупреждение

OpenVINO™ совместим с большинством процессоров Intel®, но для обеспечения оптимальной производительности:

  1. Проверь поддержку OpenVINO™ Убедись, что твой чип Intel® официально поддерживается OpenVINO™, используя список совместимости Intel.

  2. Определи свой ускоритель Выясни, включает ли твой процессор встроенный NPU (нейронный процессор) или GPU (встроенный графический процессор), обратившись к руководству по оборудованию Intel.

  3. Установи последние драйверы Если твой чип поддерживает NPU или GPU, но OpenVINO™ его не обнаруживает, возможно, потребуется установить или обновить соответствующие драйверы. Следуй инструкциям по установке драйверов для включения полного ускорения.

Выполнив эти три шага, ты обеспечишь оптимальную работу OpenVINO™ на своем оборудовании Intel®.

Преимущества OpenVINO

  1. Производительность: OpenVINO обеспечивает высокопроизводительный инференс за счет использования мощности процессоров Intel, встроенных и дискретных графических процессоров и FPGA.
  2. Поддержка гетерогенного выполнения: OpenVINO предоставляет API, позволяющий написать код один раз и развертывать его на любом поддерживаемом оборудовании Intel (CPU, GPU, FPGA, VPU и т. д.).
  3. Оптимизатор моделей: OpenVINO предоставляет оптимизатор моделей, который импортирует, преобразует и оптимизирует модели из популярных фреймворков deep learning, таких как PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle и Caffe.
  4. Простота использования: В комплект поставки входит более 80 обучающих ноутбуков (включая оптимизацию YOLO26), обучающих различным аспектам работы с набором инструментов.

Структура экспорта OpenVINO

Когда ты экспортируешь модель в формат OpenVINO, создается каталог, содержащий следующее:

  1. Файл XML: описывает топологию сети.
  2. Файл BIN: содержит бинарные данные весов и смещений.
  3. Файл сопоставления: хранит сопоставление тензоров вывода исходной модели с именами тензоров OpenVINO.

Ты можешь использовать эти файлы для запуска инференса с помощью движка OpenVINO Inference Engine.

Использование экспорта OpenVINO при развертывании

Как только твоя модель успешно экспортирована в формат OpenVINO, у тебя есть два основных варианта запуска инференса:

  1. Использовать пакет ultralytics, который предоставляет высокоуровневый API и оборачивает среду выполнения OpenVINO Runtime.

  2. Использовать собственный пакет openvino для более расширенного или настраиваемого управления поведением инференса.

Инференс с помощью Ultralytics

Пакет ultralytics позволяет легко запускать инференс с использованием экспортированной модели OpenVINO с помощью метода predict. Ты также можешь указать целевое устройство (например, intel:gpu, intel:npu, intel:cpu), используя аргумент device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Этот подход идеально подходит для быстрого прототипирования или развертывания, когда тебе не требуется полный контроль над конвейером инференса.

Инференс с использованием OpenVINO Runtime

OpenVINO Runtime предоставляет унифицированный API для инференса на всем поддерживаемом оборудовании Intel. Он также предлагает расширенные возможности, такие как балансировка нагрузки между оборудованием Intel и асинхронное выполнение. Дополнительную информацию о запуске инференса см. в ноутбуках YOLO26.

Помни, что тебе понадобятся файлы XML и BIN, а также любые специфические для приложения настройки, такие как размер входных данных, коэффициент масштабирования для нормализации и т. д., чтобы правильно настроить и использовать модель с Runtime.

В своем приложении для развертывания ты обычно выполняешь следующие шаги:

  1. Инициализируй OpenVINO, создав core = Core().
  2. Загрузи модель, используя метод core.read_model().
  3. Скомпилируй модель, используя функцию core.compile_model().
  4. Подготовь входные данные (изображение, текст, аудио и т. д.).
  5. Запусти инференс с помощью compiled_model(input_data).

Для получения более подробных шагов и фрагментов кода обратись к документации OpenVINO или учебнику по API.

Бенчмарки OpenVINO YOLO26

Команда Ultralytics протестировала YOLO26 для различных форматов моделей и точности, оценивая скорость и точность на различных устройствах Intel, совместимых с OpenVINO.

Примечание
  • Результаты бенчмаркинга ниже приведены для справки и могут варьироваться в зависимости от точной конфигурации оборудования и программного обеспечения системы, а также текущей нагрузки на систему во время проведения тестов.

  • Все тесты были проведены с использованием версии пакета openvino для Python 2026.2.0.dev20260501. Мы обновим бенчмарки на стабильную сборку после выхода версии 2026.2.0.

  • Модели YOLO26 на NPU поддерживаются только в системах Intel® Core™ Ultra™ с процессорами серии 2xxV, серии 3xx и выше.

Intel® Core™ Ultra

Серия Intel® Core™ Ultra™ представляет собой новый стандарт в высокопроизводительных вычислениях, разработанный для удовлетворения растущих потребностей современных пользователей — от геймеров и создателей контента до профессионалов, использующих ИИ. Эта линейка нового поколения — нечто большее, чем традиционная серия процессоров; она объединяет мощные процессорные ядра, встроенные высокопроизводительные графические возможности GPU и выделенный нейронный процессор (NPU) в одном чипе, предлагая унифицированное решение для разнообразных и интенсивных вычислительных задач.

В основе архитектуры Intel® Core Ultra™ лежит гибридный дизайн, обеспечивающий исключительную производительность при выполнении традиционных задач обработки данных, задач с ускорением GPU и операций на базе ИИ. Включение NPU расширяет возможности инференса ИИ на устройстве, обеспечивая более быстрое и эффективное машинное обучение и обработку данных в широком спектре приложений.

Семейство Core Ultra™ включает различные модели, адаптированные под разные потребности в производительности, с вариантами от энергоэффективных дизайнов до мощных моделей с маркировкой "H" — идеально подходящих для ноутбуков и компактных форм-факторов, требующих серьезной вычислительной мощности. Во всей линейке пользователи выигрывают от синергии интеграции CPU, GPU и NPU, обеспечивая замечательную эффективность, отзывчивость и многозадачность.

Являясь частью постоянных инноваций Intel, серия Core Ultra™ устанавливает новый стандарт для будущих вычислений. Благодаря наличию множества моделей и новым разработкам на горизонте, эта серия подчеркивает стремление Intel поставлять передовые решения для следующего поколения интеллектуальных устройств с поддержкой ИИ.

Бенчмарки ниже запущены на Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V и Intel® Core™ Ultra™ 7 155H при точности FP32, FP16 и INT8.

Intel® Core™ Ultra™ X7 358H

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты тестирования
МодельФорматТочностьСтатусРазмер (МБ)metrics/mAP50-95(B)Время инференса (мс/изобр)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Intel® Core™ Ultra™ 7 258V

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты тестирования
МодельФорматТочностьСтатусРазмер (МБ)metrics/mAP50-95(B)Время инференса (мс/изобр)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Intel® Core™ Ultra™ 7 155H

Бенчмарки
Intel Core Ultra GPU benchmarks
Подробные результаты тестирования
МодельФорматТочностьСтатусРазмер (МБ)metrics/mAP50-95(B)Время инференса (мс/изобр)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

Воспроизведение наших результатов

Чтобы воспроизвести приведенные выше бенчмарки Ultralytics для всех форматов экспорта, запусти этот код:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Обрати внимание, что результаты бенчмаркинга могут варьироваться в зависимости от точной конфигурации оборудования и программного обеспечения системы, а также от текущей нагрузки на систему во время запуска бенчмарков. Для получения наиболее надежных результатов используй набор данных с большим количеством изображений, например, data='coco.yaml' (5000 изображений для валидации).

Заключение

Результаты бенчмаркинга наглядно демонстрируют преимущества экспорта модели YOLO26 в формат OpenVINO. Для различных моделей и аппаратных платформ формат OpenVINO неизменно превосходит другие форматы по скорости инференса, сохраняя при этом сопоставимую точность.

Бенчмарки подчеркивают эффективность OpenVINO как инструмента для развертывания моделей глубокого обучения. Преобразуя модели в формат OpenVINO, разработчики могут добиться значительного повышения производительности, что упрощает развертывание этих моделей в реальных приложениях.

Для получения более подробной информации и инструкций по использованию OpenVINO обратись к официальной документации OpenVINO.

FAQ

Как экспортировать модели YOLO26 в формат OpenVINO?

Экспорт моделей YOLO26 в формат OpenVINO может значительно увеличить скорость работы на CPU и обеспечить ускорение на GPU и NPU при использовании оборудования Intel. Для экспорта ты можешь использовать Python или CLI, как показано ниже:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Для получения дополнительной информации обратись к документации по форматам экспорта.

В чем преимущества использования OpenVINO с моделями YOLO26?

Использование инструментария OpenVINO от Intel с моделями YOLO26 дает несколько преимуществ:

  1. Производительность: Достигай ускорения инференса на CPU до 3 раз и задействуй GPU и NPU Intel для ускорения.
  2. Оптимизатор моделей: Конвертируй, оптимизируй и запускай модели из популярных фреймворков, таких как PyTorch, TensorFlow и ONNX.
  3. Простота использования: Доступно более 80 обучающих блокнотов, которые помогут тебе начать работу, включая блокноты для YOLO26.
  4. Гетерогенное выполнение: Развертывай модели на различном оборудовании Intel с помощью унифицированного API.

Для детального сравнения производительности посети наш раздел бенчмарков.

Как запустить инференс с помощью модели YOLO26, экспортированной в OpenVINO?

После экспорта модели YOLO26n в формат OpenVINO ты можешь запустить инференс, используя Python или CLI:

Пример
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Для получения более подробной информации обратись к нашей документации по режиму предсказания.

Почему стоит выбрать Ultralytics YOLO26 вместо других моделей для экспорта в OpenVINO?

Ultralytics YOLO26 оптимизирована для обнаружения объектов в реальном времени с высокой точностью и скоростью. В частности, при использовании с OpenVINO модель YOLO26 обеспечивает:

  • Ускорение до 3 раз на процессорах Intel
  • Бесшовное развертывание на GPU и NPU Intel
  • Стабильная и сопоставимая точность для различных форматов экспорта

Для глубокого анализа производительности ознакомься с нашими подробными бенчмарками YOLO26 на различном оборудовании.

Могу ли я проводить бенчмаркинг моделей YOLO26 в различных форматах, таких как PyTorch, ONNX и OpenVINO?

Да, ты можешь проводить бенчмаркинг моделей YOLO26 в различных форматах, включая PyTorch, TorchScript, ONNX и OpenVINO. Используй следующий фрагмент кода для запуска бенчмарков на выбранном наборе данных:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Для получения подробных результатов бенчмарков обратись к нашему разделу бенчмарков и документации по форматам экспорта.

Комментарии