Meet YOLO26: next-gen vision AI.

Link to this sectionIntel OpenVINO 导出#

OpenVINO Intel AI inference toolkit

在本指南中,我们将介绍如何将 YOLO26 模型导出为 OpenVINO 格式,该格式可提供高达 3 倍的 CPU 加速,并能提升 YOLO 在 Intel GPUNPU 硬件上的推理速度。

OpenVINO 是 Open Visual Inference & Neural Network Optimization toolkit(开放视觉推理和神经网络优化工具包)的缩写,是一个用于优化和部署 AI 推理模型的综合工具包。尽管名称中包含“视觉”,但 OpenVINO 同样支持各种其他任务,包括语言、音频、时间序列等。



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this section使用示例#

OpenVINO 格式支持 ExportPredictValidate 模式。导出模型后,你可以加载已导出的模型,在 Intel CPU、集成/独立 GPU 或 NPU 上运行推理或验证其准确性。

导出
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
预测
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
验证
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this section导出参数#

参数类型默认值描述
formatstr'openvino'导出模型的目标格式,定义了与各种部署环境的兼容性。
imgszinttuple640模型输入的期望图像尺寸。可以是一个用于正方形图像的整数,或者是一个用于特定尺寸的元组 (height, width)
quantizeintstrNone量化精度:16 (FP16) 或 8 (INT8/PTQ;需要校准 data/fraction);32/未设置则为 FP32。该参数替代了已弃用的 half/int8 标志。
dynamicboolFalse允许动态输入尺寸,增强处理不同图像尺寸时的灵活性。
nmsboolFalse添加非极大值抑制 (NMS),这是准确高效的检测后处理所必需的。
batchint1指定导出模型的推理批次大小,或导出模型在 predict 模式下并发处理的最大图像数量。
datastr'coco8.yaml'指向 dataset 配置文件的路径(默认值:coco8.yaml),这对量化至关重要。
fractionfloat1.0指定用于 INT8 量化校准的数据集比例。允许在完整数据集的一个子集上进行校准,这对实验或资源受限时非常有用。如果启用 INT8 但未指定,将使用完整数据集。

有关导出过程的更多详细信息,请访问 Ultralytics 导出文档页面

警告

OpenVINO™ 与大多数 Intel® 处理器兼容,但为了确保最佳性能,请执行以下操作:

  1. 验证 OpenVINO™ 支持 使用 Intel 的兼容性列表 检查你的 Intel® 芯片是否已获得 OpenVINO™ 的正式支持。

  2. 识别你的加速器 参考 Intel 的硬件指南 来确定你的处理器是否包含集成 NPU(神经处理单元)或 GPU(集成 GPU)。

  3. 安装最新驱动程序 如果你的芯片支持 NPU 或 GPU 但 OpenVINO™ 未检测到,你可能需要安装或更新相关的驱动程序。请按照 驱动安装说明 来启用全面加速。

通过执行这三个步骤,你可以确保 OpenVINO™ 在你的 Intel® 硬件上运行达到最佳状态。

Link to this sectionOpenVINO 的优势#

  1. 性能:OpenVINO 通过利用 Intel CPU、集成和独立 GPU 以及 FPGA 的性能,提供高性能推理。
  2. 支持异构执行:OpenVINO 提供了一个 API,只需编写一次代码,即可在任何受支持的 Intel 硬件(CPU、GPU、FPGA、VPU 等)上进行部署。
  3. Model Optimizer:OpenVINO 提供了一个 Model Optimizer,用于导入、转换和优化来自主流 deep learning 框架的模型,例如 PyTorch、TensorFlow、TFLite、Keras、ONNX、PaddlePaddle 和 Caffe。
  4. 易用性:该工具包附带大量 教程笔记本(包括 YOLO26 优化),用于教授该工具包的不同方面。

Link to this sectionOpenVINO 导出结构#

当你将模型导出为 OpenVINO 格式时,会生成一个包含以下内容的目录:

  1. XML 文件:描述网络拓扑结构。
  2. BIN 文件:包含权重和偏差的二进制数据。
  3. 映射文件:保存原始模型输出张量到 OpenVINO 张量名称的映射。

你可以使用这些文件通过 OpenVINO Inference Engine 运行推理。

Link to this section在部署中使用 OpenVINO 导出#

模型成功导出为 OpenVINO 格式后,你有两种主要方式运行推理:

  1. 使用 ultralytics 包,它提供了一个高级 API 并封装了 OpenVINO Runtime。

  2. 使用原生的 openvino 包,以便对推理行为进行更高级或更自定义的控制。

Link to this section使用 Ultralytics 进行推理#

ultralytics 包允许你通过 predict 方法轻松地使用导出的 OpenVINO 模型运行推理。你还可以使用 device 参数指定目标设备(例如 intel:gpuintel:npuintel:cpu)。

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

此方法非常适合快速原型设计或不需要完全控制推理流水线的部署场景。

Link to this section使用 OpenVINO Runtime 进行推理#

OpenVINO Runtime 为所有受支持的 Intel 硬件提供统一的推理 API。它还提供负载均衡和异步执行等高级功能。有关运行推理的更多信息,请参考 YOLO26 笔记本

请记住,你需要 XML 和 BIN 文件,以及任何特定于应用程序的设置(如输入大小、归一化缩放因子等),才能正确配置并使用 Runtime 运行模型。

在你的部署应用程序中,通常需要执行以下步骤:

  1. 通过创建 core = Core() 初始化 OpenVINO。
  2. 使用 core.read_model() 方法加载模型。
  3. 使用 core.compile_model() 函数编译模型。
  4. 准备输入数据(图像、文本、音频等)。
  5. 使用 compiled_model(input_data) 运行推理。

有关更详细的步骤和代码片段,请参考 OpenVINO 文档API 教程

Link to this sectionOpenVINO YOLO26 基准测试#

Ultralytics 团队对 YOLO26 在各种模型格式和 精度 下进行了基准测试,评估了其在不同兼容 OpenVINO 的 Intel 设备上的速度和准确性。

注意
  • 以下基准测试结果仅供参考,可能会根据系统的确切硬件和软件配置以及运行基准测试时的系统当前负载而有所不同。

  • 所有基准测试均使用 openvino Python 包版本 2026.2.0 运行。

  • NPU 上的 YOLO26 模型仅在配备 2xxV 系列和 3xx 系列及以上版本的 Intel® Core™ Ultra™ 系统上受支持。

Link to this sectionIntel® Core™ Ultra#

Intel® Core™ Ultra™ 系列代表了高性能计算的新标杆,旨在满足现代用户不断变化的需求——从游戏玩家和创作者,到利用 AI 的专业人士。这一下一代产品阵容不仅仅是一个传统的 CPU 系列;它在一个芯片中集成了强大的 CPU 内核、高性能 GPU 能力以及专用神经处理单元 (NPU),为各种密集型计算工作负载提供了一个统一的解决方案。

Intel® Core Ultra™ 架构的核心是混合设计,可在传统处理任务、GPU 加速工作负载和 AI 驱动操作中实现出色的性能。NPU 的加入增强了端侧 AI 推理能力,使更广泛的应用程序能够实现更快、更高效的机器学习和数据处理。

Core Ultra™ 系列包括各种针对不同性能需求量身定制的模型,选项从节能设计到标有“H”的高功率变体不等——非常适合需要强大计算能力的笔记本电脑和紧凑型设备。在整个产品线中,用户受益于 CPU、GPU 和 NPU 集成的协同效应,提供卓越的效率、响应能力和多任务处理能力。

作为 Intel 持续创新的一部分,Core Ultra™ 系列为面向未来的计算树立了新标准。随着多款型号的推出以及更多产品的问世,该系列彰显了 Intel 致力于为下一代智能、AI 增强设备提供尖端解决方案的承诺。

以下基准测试在 Intel® Core™ Ultra™ X7 358H、Intel® Core™ Ultra™ 7 258V 和 Intel® Core™ Ultra™ 7 155H 上运行,精度分别为 FP32、FP16 和 INT8。

Link to this sectionIntel® Core™ Ultra™ X7 358H#

基准测试
Intel Core Ultra GPU benchmarks
详细基准测试结果
模型格式精确率状态大小 (MB)指标/mAP50-95(B)推理时间 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

基准测试
Intel Core Ultra GPU benchmarks
详细基准测试结果
模型格式精确率状态大小 (MB)指标/mAP50-95(B)推理时间 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

基准测试
Intel Core Ultra GPU benchmarks
详细基准测试结果
模型格式精确率状态大小 (MB)指标/mAP50-95(B)推理时间 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

Link to this section重现我们的结果#

若要复现上述关于所有导出 格式 的 Ultralytics 基准测试,请运行此代码:

示例
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

请注意,基准测试结果可能会根据系统的具体硬件和软件配置,以及运行基准测试时系统的当前负载而有所不同。为获得最可靠的结果,请使用包含大量图像的数据集,例如 data='coco.yaml'(5000 张验证集图像)。

Link to this section结论#

基准测试结果清楚地展示了将 YOLO26 模型导出为 OpenVINO 格式的优势。在不同的模型和硬件平台上,OpenVINO 格式在推理速度方面始终优于其他格式,同时保持了相当的准确性。

这些基准测试强调了 OpenVINO 作为深度学习模型部署工具的有效性。通过将模型转换为 OpenVINO 格式,开发者可以实现显著的性能提升,从而更轻松地将这些模型部署到实际应用中。

有关使用 OpenVINO 的更详细信息和说明,请参阅 官方 OpenVINO 文档

Link to this section常见问题解答#

Link to this section如何将 YOLO26 模型导出为 OpenVINO 格式?#

将 YOLO26 模型导出为 OpenVINO 格式可以显著提高 CPU 速度,并在 Intel 硬件上启用 GPU 和 NPU 加速。你可以使用 Python 或 CLI 进行导出,如下所示:

示例
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

更多信息,请参阅 导出格式文档

Link to this section将 OpenVINO 与 YOLO26 模型结合使用有哪些好处?#

将 Intel 的 OpenVINO 工具套件与 YOLO26 模型结合使用具有多项优势:

  1. 性能:在 CPU 推理上实现高达 3 倍的速度提升,并利用 Intel GPU 和 NPU 进行加速。
  2. 模型优化器:转换、优化并执行来自 PyTorch、TensorFlow 和 ONNX 等流行框架的模型。
  3. 易用性:提供大量教程笔记本以帮助用户上手,包括针对 YOLO26 的教程。
  4. 异构执行:使用统一的 API 在各种 Intel 硬件上部署模型。

有关详细的性能对比,请访问我们的 基准测试部分

Link to this section如何使用已导出为 OpenVINO 的 YOLO26 模型运行推理?#

将 YOLO26n 模型导出为 OpenVINO 格式后,你可以使用 Python 或 CLI 运行推理:

示例
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

有关更多详细信息,请参阅我们的 预测模式文档

Link to this section为什么我应该选择 Ultralytics YOLO26 而不是其他模型进行 OpenVINO 导出?#

Ultralytics YOLO26 针对实时目标检测进行了优化,具有高准确性和速度。特别是与 OpenVINO 结合时,YOLO26 提供:

  • 在 Intel CPU 上实现高达 3 倍的速度提升
  • 在 Intel GPU 和 NPU 上无缝部署
  • 在各种导出格式中保持一致且相当的准确性

有关深入的性能分析,请查看我们在不同硬件上详细的 YOLO26 基准测试

Link to this section我可以在 PyTorch、ONNX 和 OpenVINO 等不同格式上对 YOLO26 模型进行基准测试吗?#

可以,你可以在各种格式(包括 PyTorch、TorchScript、ONNX 和 OpenVINO)上对 YOLO26 模型进行基准测试。使用以下代码片段在选定的数据集上运行基准测试:

示例
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

有关详细的基准测试结果,请参阅我们的 基准测试部分导出格式 文档。

评论