Intel OpenVINO エクスポート

OpenVINO Intel AI inference toolkit

このガイドでは、YOLO26モデルをOpenVINO形式にエクスポートする方法について説明します。この形式を使用することで、CPUで最大3倍の高速化が期待できるほか、Intel GPUおよびNPUハードウェア上でのYOLO推論を加速できます。

OpenVINO(Open Visual Inference & Neural Network Optimization toolkitの略)は、AI推論モデルの最適化とデプロイのための包括的なツールキットです。名前にVisualが含まれていますが、OpenVINOは言語、音声、時系列データなど、その他の多様なタスクもサポートしています。



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

使用例

YOLO26nモデルをOpenVINO形式にエクスポートし、エクスポートされたモデルで推論を実行します。

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

# Run inference with specified device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")

エクスポート引数

引数デフォルト説明
formatstr'openvino'エクスポートするモデルのターゲット形式。様々なデプロイ環境との互換性を定義します。
imgszint または tuple640モデル入力の希望画像サイズ。正方形画像の場合は整数、特定の寸法の場合はタプル (height, width) を指定します。
halfboolFalseFP16(半精度)量子化を有効にします。モデルサイズを削減し、サポートされているハードウェアでは推論を高速化できる可能性があります。
int8boolFalseINT8量子化を有効にします。モデルをさらに圧縮し、精度への影響を最小限に抑えつつ、主にエッジデバイスでの推論を高速化します。
dynamicboolFalse動的入力サイズを許可し、様々な画像サイズを扱う際の柔軟性を高めます。
nmsboolFalseNon-Maximum Suppression (NMS) を追加します。これは正確で効率的な検出後処理に不可欠です。
batchint1エクスポートされたモデルのバッチ推論サイズ、または predict モードでモデルが同時に処理する画像の最大数を指定します。
datastr'coco8.yaml'データセット構成ファイルへのパス(デフォルト: coco8.yaml)。量子化に不可欠です。
fractionfloat1.0INT8量子化のキャリブレーションに使用するデータセットの割合を指定します。データセット全体の一部でキャリブレーションできるため、実験時やリソースが限られている場合に便利です。INT8を有効にしてこの指定を行わない場合、データセット全体が使用されます。

エクスポートプロセスの詳細については、Ultralyticsのエクスポートに関するドキュメントページを参照してください。

警告

OpenVINO™はほとんどのIntel®プロセッサと互換性がありますが、最適なパフォーマンスを確保するには以下の手順に従ってください:

  1. OpenVINO™のサポートを確認する お使いのIntel®チップがOpenVINO™によって公式にサポートされているかどうかを、Intelの互換性リストを使用して確認してください。

  2. アクセラレータを特定する お使いのプロセッサに統合NPU(Neural Processing Unit)またはGPU(統合GPU)が搭載されているかどうかを、Intelのハードウェアガイドで確認してください。

  3. 最新のドライバをインストールする お使いのチップがNPUやGPUをサポートしているにもかかわらずOpenVINO™がそれを検出しない場合は、関連するドライバのインストールや更新が必要になることがあります。完全な高速化を有効にするために、ドライバのインストール手順に従ってください。

これら3つのステップに従うことで、Intel®ハードウェア上でOpenVINO™を最適に実行できるようになります。

OpenVINOの利点

  1. パフォーマンス: OpenVINOは、Intel CPU、統合およびディスクリートGPU、FPGAの能力を活用することで、高性能な推論を実現します。
  2. ヘテロジニアス実行のサポート: OpenVINOは、一度コードを書けば、サポートされているIntelハードウェア(CPU、GPU、FPGA、VPUなど)すべてにデプロイできるAPIを提供します。
  3. Model Optimizer: OpenVINO provides a Model Optimizer that imports, converts, and optimizes models from popular deep learning frameworks such as PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle, and Caffe.
  4. 使いやすさ: ツールキットには、ツールキットの様々な側面を学ぶための80以上のチュートリアルノートブックYOLO26の最適化を含む)が用意されています。

OpenVINOエクスポート構造

モデルをOpenVINO形式にエクスポートすると、以下の内容を含むディレクトリが生成されます:

  1. XMLファイル: ネットワークトポロジを記述します。
  2. BINファイル: 重みとバイアスのバイナリデータを含みます。
  3. マッピングファイル: 元のモデルの出力テンソルとOpenVINOテンソル名のマッピングを保持します。

これらのファイルを使用して、OpenVINO Inference Engineで推論を実行できます。

デプロイメントでのOpenVINOエクスポートの使用

モデルをOpenVINO形式に正常にエクスポートした後、推論を実行するための主なオプションが2つあります:

  1. ultralytics パッケージを使用する。これは高レベルAPIを提供し、OpenVINO Runtimeをラップしています。

  2. ネイティブの openvino パッケージを使用する。推論動作をより高度に、または詳細に制御したい場合に適しています。

Ultralyticsによる推論

ultralyticsパッケージを使用すると、predictメソッドを通じてエクスポートされたOpenVINOモデルで簡単に推論を実行できます。また、device引数を使用してターゲットデバイス(例: intel:gpuintel:npuintel:cpu)を指定することもできます。

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

このアプローチは、推論パイプラインを完全に制御する必要がない場合の迅速なプロトタイピングやデプロイメントに最適です。

OpenVINO Runtimeによる推論

OpenVINO Runtimeは、サポートされているすべてのIntelハードウェア間で共通の推論APIを提供します。また、Intelハードウェア間の負荷分散や非同期実行といった高度な機能も備えています。推論の実行に関する詳細情報は、YOLO26ノートブックを参照してください。

XMLおよびBINファイルに加え、入力サイズや正規化用のスケール係数などのアプリケーション固有の設定が必要になることを覚えておいてください。これらはRuntimeでモデルを正しくセットアップし使用するために必要です。

デプロイメントアプリケーションでは、通常以下の手順を実行します:

  1. core = Core() を作成してOpenVINOを初期化します。
  2. core.read_model() メソッドを使用してモデルをロードします。
  3. core.compile_model() 関数を使用してモデルをコンパイルします。
  4. 入力を準備します(画像、テキスト、音声など)。
  5. compiled_model(input_data) を使用して推論を実行します。

詳細な手順やコードスニペットについては、OpenVINOドキュメントまたはAPIチュートリアルを参照してください。

OpenVINO YOLO26 ベンチマーク

Ultralyticsチームは、様々なモデル形式と精度でYOLO26をベンチマークし、OpenVINOと互換性のある様々なIntelデバイスで速度と精度を評価しました。

注意
  • 以下のベンチマーク結果は参考用であり、システムの正確なハードウェアおよびソフトウェア構成、ならびにベンチマーク実行時のシステムの現在のワークロードによって異なる場合があります。

  • すべてのベンチマークは openvino Pythonパッケージバージョン 2026.2.0.dev20260501 で実行されました。バージョン2026.2.0がリリースされ次第、安定版ビルドでベンチマークを更新します。

  • NPU上のYOLO26モデルは、2xxVシリーズおよび3xxシリーズ以降のIntel® Core™ Ultra™システムでのみサポートされています。

Intel® Core™ Ultra

Intel® Core™ Ultra™シリーズは、ゲーマーやクリエイターからAIを活用するプロフェッショナルまで、現代のユーザーの進化するニーズに応えるべく設計された、ハイパフォーマンスコンピューティングの新たなベンチマークです。この次世代ラインナップは、従来のCPUシリーズを超えた存在です。強力なCPUコア、統合された高性能GPU機能、および専用のNeural Processing Unit(NPU)を1つのチップに集約し、多様で集中的なコンピューティングワークロードに対して統合的なソリューションを提供します。

Intel® Core Ultra™アーキテクチャの中心にあるのは、従来の処理タスク、GPU加速ワークロード、AI駆動型操作全体で卓越したパフォーマンスを実現するハイブリッド設計です。NPUの搭載はオンデバイスAI推論を強化し、幅広いアプリケーションでより高速で効率的な機械学習とデータ処理を可能にします。

Core Ultra™ファミリには、異なるパフォーマンスニーズに合わせて調整された様々なモデルが含まれています。省電力設計から、「H」指定が付いたハイパワーバリアントまで、深刻なコンピューティングパワーを必要とするノートPCやコンパクトなフォームファクタに最適な選択肢を提供します。ラインナップ全体を通じて、ユーザーはCPU、GPU、NPU統合の相乗効果から恩恵を受け、優れた効率性、応答性、マルチタスク能力を得ることができます。

Intelの絶え間ないイノベーションの一環として、Core Ultra™シリーズは将来を見据えたコンピューティングの新たな標準を打ち立てます。複数のモデルが利用可能であり、今後もさらに増える予定のこのシリーズは、インテリジェントでAIが強化された次世代デバイスに向けた最先端ソリューションを提供するというIntelのコミットメントを強調しています。

以下のベンチマークは、Intel® Core™ Ultra™ X7 358H、Intel® Core™ Ultra™ 7 258V、およびIntel® Core™ Ultra™ 7 155H上で、FP32、FP16、およびINT8精度で実行されたものです。

Intel® Core™ Ultra™ X7 358H

ベンチマーク
Intel Core Ultra GPU benchmarks
詳細ベンチマーク結果
モデル形式精度ステータスサイズ (MB)metrics/mAP50-95(B)推論時間 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Intel® Core™ Ultra™ 7 258V

ベンチマーク
Intel Core Ultra GPU benchmarks
詳細ベンチマーク結果
モデル形式精度ステータスサイズ (MB)metrics/mAP50-95(B)推論時間 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Intel® Core™ Ultra™ 7 155H

ベンチマーク
Intel Core Ultra GPU benchmarks
詳細ベンチマーク結果
モデル形式精度ステータスサイズ (MB)metrics/mAP50-95(B)推論時間 (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

結果を再現する

上記のUltralyticsベンチマークをすべてのエクスポートフォーマットで再現するには、このコードを実行してください。

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

ベンチマーク結果は、システムの正確なハードウェアおよびソフトウェア構成、ならびにベンチマーク実行時のシステムの現在の負荷によって異なる場合があることに注意してください。最も信頼性の高い結果を得るには、data='coco.yaml'(5000枚の検証画像)のように多数の画像を含むデータセットを使用してください。

結論

ベンチマーク結果は、YOLO26モデルをOpenVINOフォーマットにエクスポートする利点を明確に示しています。さまざまなモデルやハードウェアプラットフォーム全体で、OpenVINOフォーマットは、精度を維持しながら推論速度の面で他のフォーマットを一貫して上回っています。

これらのベンチマークは、ディープラーニングモデルをデプロイするためのツールとしてのOpenVINOの有効性を強調しています。モデルをOpenVINOフォーマットに変換することで、開発者はパフォーマンスを大幅に向上させることができ、実世界のアプリケーションへのモデルデプロイが容易になります。

OpenVINOの使用に関する詳細情報や手順については、公式OpenVINOドキュメントを参照してください。

FAQ

YOLO26モデルをOpenVINOフォーマットにエクスポートするにはどうすればよいですか?

YOLO26モデルをOpenVINOフォーマットにエクスポートすると、CPU速度が大幅に向上し、IntelハードウェアでのGPUおよびNPUアクセラレーションが可能になります。エクスポートには、以下に示すようにPythonまたはCLIのいずれかを使用できます。

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

詳細については、エクスポートフォーマットのドキュメントを参照してください。

YOLO26モデルでOpenVINOを使用する利点は何ですか?

IntelのOpenVINOツールキットをYOLO26モデルで使用すると、いくつかの利点があります。

  1. パフォーマンス: CPU推論で最大3倍の高速化を実現し、Intel GPUおよびNPUを活用して高速化できます。
  2. モデルオプティマイザー: PyTorch、TensorFlow、ONNXなどの一般的なフレームワークからのモデルを変換、最適化、実行できます。
  3. 使いやすさ: 80以上のチュートリアルノートブックが用意されており、YOLO26を含むユーザーの導入をサポートします。
  4. ヘテロジニアス実行: 統合されたAPIを使用して、さまざまなIntelハードウェアにモデルをデプロイできます。

詳細なパフォーマンス比較については、ベンチマークセクションをご覧ください。

OpenVINOにエクスポートされたYOLO26モデルを使用して推論を実行するにはどうすればよいですか?

YOLO26nモデルをOpenVINOフォーマットにエクスポートした後、PythonまたはCLIを使用して推論を実行できます。

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

詳細については、予測モードのドキュメントを参照してください。

OpenVINOエクスポートに他のモデルではなくUltralytics YOLO26を選択すべき理由は何ですか?

Ultralytics YOLO26は、リアルタイムの物体検出において高い精度と速度を実現するように最適化されています。特にOpenVINOと組み合わせることで、YOLO26は以下を提供します。

  • Intel CPUでの最大3倍の高速化
  • Intel GPUおよびNPUへのシームレスなデプロイ
  • さまざまなエクスポートフォーマット間での一貫した同等の精度

詳細なパフォーマンス分析については、異なるハードウェアでの詳細なYOLO26ベンチマークを確認してください。

PyTorch、ONNX、OpenVINOなどの異なるフォーマットでYOLO26モデルのベンチマークを実行できますか?

はい、PyTorch、TorchScript、ONNX、OpenVINOを含むさまざまなフォーマットでYOLO26モデルのベンチマークを実行できます。以下のコードスニペットを使用して、選択したデータセットでベンチマークを実行してください。

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

詳細なベンチマーク結果については、ベンチマークセクションおよびエクスポートフォーマットのドキュメントを参照してください。

コメント