Link to this sectionIntel OpenVINO 导出#
在本指南中,我们将介绍如何将 YOLO26 模型导出为 OpenVINO 格式,该格式可提供高达 3 倍的 CPU 加速,并能提升 YOLO 在 Intel GPU 和 NPU 硬件上的推理速度。
OpenVINO 是 Open Visual Inference & Neural Network Optimization toolkit(开放式视觉推理和神经网络优化工具包)的缩写,是一个用于优化和部署 AI 推理模型的综合工具包。尽管名称中包含“视觉”,但 OpenVINO 也支持各种其他任务,包括语言、音频、时间序列等。
Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀
Link to this section使用示例#
OpenVINO 格式支持 Export、Predict 和 Validate 模式。你可以导出你的模型,然后加载导出的模型,在 Intel CPU、集成/独立 GPU 或 NPU 上运行推理或验证其精度。
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to OpenVINO format
model.export(format="openvino") # creates 'yolo26n_openvino_model/'from ultralytics import YOLO
# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")from ultralytics import YOLO
# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")
# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")Link to this section导出参数#
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
format | str | 'openvino' | 导出模型的目标格式,定义了与各种部署环境的兼容性。 |
imgsz | int 或 tuple | 640 | 模型输入的所需图像尺寸。可以是一个用于正方形图像的整数,或者是一个用于特定尺寸的元组 (height, width)。 |
half | bool | False | 启用 FP16(半精度)量化,可减小模型大小并可能在受支持的硬件上加快推理速度。 |
int8 | bool | False | 激活 INT8 量化,进一步压缩模型并以极小的 accuracy 损失加快推理速度,主要用于边缘设备。 |
dynamic | bool | False | 允许动态输入尺寸,增强了处理不同图像尺寸的灵活性。 |
nms | bool | False | 添加非极大值抑制(NMS),这对实现准确且高效的检测后处理至关重要。 |
batch | int | 1 | 指定导出模型的批量推理大小,或导出模型在 predict 模式下并发处理的最大图像数量。 |
data | str | 'coco8.yaml' | 指向 dataset 配置文件的路径(默认为 coco8.yaml),对于量化至关重要。 |
fraction | float | 1.0 | 指定用于 INT8 量化校准的数据集比例。允许在完整数据集的子集上进行校准,这对于实验或资源受限时非常有用。如果在启用 INT8 时未指定此参数,则将使用完整数据集。 |
有关导出过程的更多详细信息,请访问 Ultralytics 关于导出的文档页面。
OpenVINO™ 与大多数 Intel® 处理器兼容,但为了确保最佳性能,请注意以下几点:
-
验证 OpenVINO™ 支持 使用 Intel 兼容性列表 查看你的 Intel® 芯片是否得到 OpenVINO™ 的正式支持。
-
确定你的加速器 通过咨询 Intel 硬件指南,确定你的处理器是否包含集成 NPU(神经处理单元)或 GPU(集成 GPU)。
-
安装最新驱动程序 如果你的芯片支持 NPU 或 GPU 但 OpenVINO™ 未检测到它,你可能需要安装或更新相关驱动程序。请按照 驱动安装说明 以启用全面加速。
遵循这三个步骤,你就可以确保 OpenVINO™ 在你的 Intel® 硬件上实现最佳运行。
Link to this sectionOpenVINO 的优势#
- 性能:OpenVINO 通过利用 Intel CPU、集成和独立 GPU 以及 FPGA 的强大功能,提供高性能推理。
- 支持异构执行:OpenVINO 提供了一个 API,可以让你一次编写并在任何受支持的 Intel 硬件(CPU、GPU、FPGA、VPU 等)上进行部署。
- 模型优化器:OpenVINO 提供了一个模型优化器,可以导入、转换和优化来自流行 deep learning 框架的模型,例如 PyTorch、TensorFlow、TensorFlow Lite、Keras、ONNX、PaddlePaddle 和 Caffe。
- 易用性:该工具包附带了大量的 教程笔记本(包括 YOLO26 优化),教授工具包的不同方面。
Link to this sectionOpenVINO 导出结构#
当你将模型导出为 OpenVINO 格式时,会生成一个包含以下内容的目录:
- XML 文件:描述网络拓扑结构。
- BIN 文件:包含权重和偏置的二进制数据。
- 映射文件:保存原始模型输出张量到 OpenVINO 张量名称的映射。
你可以使用这些文件通过 OpenVINO Inference Engine(推理引擎)运行推理。
Link to this section在部署中使用 OpenVINO 导出#
一旦你的模型成功导出为 OpenVINO 格式,你有两种主要的运行推理选项:
-
使用
ultralytics软件包,它提供了高级 API 并封装了 OpenVINO Runtime。 -
使用原生的
openvino软件包,以便对推理行为进行更高级或自定义的控制。
Link to this section使用 Ultralytics 进行推理#
ultralytics 软件包允许你通过 predict 方法轻松使用导出的 OpenVINO 模型运行推理。你还可以使用 device 参数指定目标设备(例如 intel:gpu、intel:npu、intel:cpu)。
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/") # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu") # specify the device you want to run inference on这种方法非常适合快速原型设计或当你不需要完全控制推理流水线时的部署场景。
Link to this section使用 OpenVINO Runtime 进行推理#
OpenVINO Runtime 为所有受支持的 Intel 硬件上的推理提供了一个统一的 API。它还提供高级功能,如跨 Intel 硬件的负载均衡和异步执行。有关运行推理的更多信息,请参阅 YOLO26 笔记本。
请记住,你需要 XML 和 BIN 文件,以及任何特定于应用程序的设置(如输入尺寸、归一化比例因子等),才能正确设置并使用 Runtime 运行模型。
在你的部署应用程序中,通常需要执行以下步骤:
- 通过创建
core = Core()初始化 OpenVINO。 - 使用
core.read_model()方法加载模型。 - 使用
core.compile_model()函数编译模型。 - 准备输入(图像、文本、音频等)。
- 使用
compiled_model(input_data)运行推理。
有关更详细的步骤和代码片段,请参考 OpenVINO 文档 或 API 教程。
Link to this sectionOpenVINO YOLO26 基准测试#
Ultralytics 团队对 YOLO26 进行了跨各种模型格式和 precision 的基准测试,评估了其在不同 OpenVINO 兼容 Intel 设备上的速度和精度。
-
下方的基准测试结果仅供参考,可能会根据系统的确切硬件和软件配置,以及运行基准测试时系统的当前工作负载而有所不同。
-
所有基准测试均使用
openvinoPython 软件包版本 2026.2.0.dev20260501 运行。我们将在 2026.2.0 版本发布后更新基准测试。 -
NPU 上的 YOLO26 模型仅在配备 2xxV 系列和 3xx 系列及以上的 Intel® Core™ Ultra™ 系统上得到支持。
Link to this sectionIntel® Core™ Ultra#
Intel® Core™ Ultra™ 系列代表了高性能计算的新标杆,旨在满足现代用户的不断变化的需求——从游戏玩家和创作者到利用 AI 的专业人士。这一下一代产品阵容不仅仅是一个传统的 CPU 系列;它在单芯片中结合了强大的 CPU 内核、集成的高性能 GPU 功能和专用的神经处理单元 (NPU),为多样化和密集型的计算工作负载提供了一个统一的解决方案。
Intel® Core Ultra™ 架构的核心是一个混合设计,能够跨传统处理任务、GPU 加速工作负载和 AI 驱动的操作实现卓越的性能。NPU 的加入增强了端侧 AI 推理能力,使得在广泛的应用中实现更快速、更高效的机器学习和数据处理成为可能。
Core Ultra™ 家族包含针对不同性能需求量身定制的各种型号,从节能设计到以“H”标志的高功率变体——非常适合需要强大计算能力的笔记本电脑和紧凑型设备。在整个产品线中,用户受益于 CPU、GPU 和 NPU 集成的协同效应,实现了显著的效率、响应速度和多任务处理能力。
作为 Intel 持续创新的一部分,Core Ultra™ 系列为面向未来的计算设立了新标准。随着多款型号的推出以及更多产品的预告,该系列强调了 Intel 致力于为下一代智能、AI 增强型设备提供前沿解决方案的承诺。
以下基准测试在 Intel® Core™ Ultra™ X7 358H、Intel® Core™ Ultra™ 7 258V 和 Intel® Core™ Ultra™ 7 155H 上运行,精度分别为 FP32、FP16 和 INT8。
Link to this sectionIntel® Core™ Ultra™ X7 358H#
详细基准测试结果
| 模型 | 格式 | 精度 | 状态 | 大小 (MB) | 指标/mAP50-95(B) | 推理时间 (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 25.18 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4763 | 2.67 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4763 | 2.64 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 2.73 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 50.09 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5615 | 3.57 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5615 | 3.55 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 3.09 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 135.1 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6168 | 5.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 5.85 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 4.14 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 169.75 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6206 | 8.14 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6206 | 8.18 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 4.67 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 407.56 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6569 | 13.11 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6569 | 13.15 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 9.24 |
Link to this sectionIntel® Core™ Ultra™ 7 258V#
详细基准测试结果
| 模型 | 格式 | 精度 | 状态 | 大小 (MB) | 指标/mAP50-95(B) | 推理时间 (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 31.43 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4762 | 3.57 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4762 | 3.53 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 3.65 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 60.4 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 5.02 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 5.01 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 4.31 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 173.31 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6191 | 9.48 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 9.6 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 6.03 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6173 | 224.52 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.3725 | 11.88 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6201 | 12.0 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 8.47 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 595.72 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6567 | 20.26 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6454 | 20.25 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 14.77 |
Link to this sectionIntel® Core™ Ultra™ 7 155H#
详细基准测试结果
| 模型 | 格式 | 精度 | 状态 | 大小 (MB) | 指标/mAP50-95(B) | 推理时间 (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 38.77 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4774 | 9.87 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4774 | 9.84 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4705 | 5.86 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 69.54 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 17.29 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 17.06 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.5452 | 10.33 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 192.22 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6187 | 34.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6187 | 34.75 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.6073 | 15.99 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 245.62 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6202 | 43.7 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6202 | 44.65 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.6048 | 20.31 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 513.06 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6544 | 80.19 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6544 | 79.83 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6393 | 35.16 |
Link to this section复现我们的结果#
要复现上述 Ultralytics 在所有导出 formats 上的基准测试,请运行此代码:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")请注意,基准测试结果可能会因系统的确切硬件和软件配置,以及运行基准测试时系统的当前负载而有所不同。为了获得最可靠的结果,请使用包含大量图像的数据集,即 data='coco.yaml' (5000 张验证集图像)。
Link to this section结论#
基准测试结果清楚地证明了将 YOLO26 模型导出为 OpenVINO 格式的优势。在不同的模型和硬件平台上,OpenVINO 格式在保持相当精度的同时,在推理速度方面始终优于其他格式。
这些基准测试强调了 OpenVINO 作为深度学习模型部署工具的有效性。通过将模型转换为 OpenVINO 格式,开发者可以实现显著的性能提升,从而更容易将这些模型部署到实际应用中。
有关使用 OpenVINO 的更多详细信息和说明,请参考 官方 OpenVINO 文档。
Link to this section常见问题解答#
Link to this section如何将 YOLO26 模型导出为 OpenVINO 格式?#
将 YOLO26 模型导出为 OpenVINO 格式可以显著提升 CPU 速度,并启用 Intel 硬件上的 GPU 和 NPU 加速。如需导出,你可以使用 Python 或 CLI,如下所示:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model
model.export(format="openvino") # creates 'yolo26n_openvino_model/'有关更多信息,请参考 导出格式文档。
Link to this section将 OpenVINO 与 YOLO26 模型结合使用有什么好处?#
将 Intel 的 OpenVINO 工具套件与 YOLO26 模型结合使用具有以下几项优势:
- 性能:在 CPU 推理上实现高达 3 倍的速度提升,并利用 Intel GPU 和 NPU 进行加速。
- 模型优化器:转换、优化并运行来自 PyTorch、TensorFlow 和 ONNX 等流行框架的模型。
- 易用性:提供大量教程笔记本以帮助用户入门,其中包括针对 YOLO26 的教程。
- 异构执行:使用统一的 API 在各种 Intel 硬件上部署模型。
有关详细的性能对比,请访问我们的 基准测试部分。
Link to this section如何使用导出到 OpenVINO 的 YOLO26 模型运行推理?#
在将 YOLO26n 模型导出为 OpenVINO 格式后,你可以使用 Python 或 CLI 运行推理:
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")
# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")有关详细信息,请参阅我们的 预测模式文档。
Link to this section为什么我应该选择 Ultralytics YOLO26 而不是其他模型进行 OpenVINO 导出?#
Ultralytics YOLO26 针对实时目标检测进行了优化,具有高精度和高速度。特别是在与 OpenVINO 结合使用时,YOLO26 提供:
- 在 Intel CPU 上获得高达 3 倍的速度提升
- 在 Intel GPU 和 NPU 上无缝部署
- 在各种导出格式中保持一致且相当的精度
有关深入的性能分析,请查看我们在不同硬件上详细的 YOLO26 基准测试。
Link to this section我可以对不同格式(如 PyTorch、ONNX 和 OpenVINO)的 YOLO26 模型进行基准测试吗?#
可以,你可以对包括 PyTorch、TorchScript、ONNX 和 OpenVINO 在内的各种格式的 YOLO26 模型进行基准测试。使用以下代码片段在你选择的数据集上运行基准测试:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")