Link to this sectionYOLO26デプロイオプションの比較分析#
YOLO26は20種類以上のデプロイオプションをサポートしており、それぞれが異なるランタイム、ハードウェアターゲット、プラットフォームに合わせて調整されています。PyTorchやONNXから、TensorRT、OpenVINO、CoreML、そして専用のEdge-NPUフォーマットまで対応しています。適切なオプションを選択することで、推論速度、ハードウェア制約、および統合の容易さのバランスを調整できます。このガイドではすべてのオプションを比較しているため、アプリケーションに最適なものを選択し、その後モデルデプロイのベストプラクティスに進んで確実にデプロイを行ってください。
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
デプロイはコンピュータビジョンプロジェクトのワークフローにおける、学習済みモデルが実際に稼働を開始する段階です。そのため、エクスポート先のフォーマットが速度、コスト、およびポータビリティに直接的な影響を与えます。
Link to this sectionYOLO26モデルに最適なデプロイオプションを選択する方法#
YOLO26モデルをデプロイする際、適切なエクスポートフォーマットを選択することは非常に重要です。Ultralytics YOLO26エクスポートドキュメントで概説されているように、model.export()関数は学習済みモデルを多様な環境やパフォーマンス要件に適したさまざまなフォーマットに変換します。
理想的なフォーマットは、モデルの意図する運用コンテキストとハードウェアに依存します。
手動エクスポートを行わない管理型デプロイの場合、Ultralytics Platformは、世界43のリージョンで自動スケーリングを行う、すぐに利用可能な推論エンドポイントを提供しています。
Link to this sectionYOLO26のデプロイオプション#
各フォーマットの概要と、それを使用すべき場面については以下の通りです。エクスポートの完全な手順についてはエクスポートドキュメントを参照し、比較基準については比較表へ進んでください。
- PyTorch (
.pt): 標準的なトレーニングおよび推論フォーマットであり、最大限の柔軟性とCUDA GPUアクセラレーションを提供します。研究やプロトタイピングに最適で、エクスポート手順は不要です。 - TorchScript (
torchscript): Python不要のC++ランタイム用にモデルをシリアライズします。Pythonが利用できない本番システムに適しています。 - ONNX (
onnx): ONNX Runtimeを通じて幅広いクロスプラットフォームおよびハードウェアサポートを提供する、フレームワークにとらわれない相互運用フォーマットです。 - OpenVINO (
openvino): Intel CPU、統合GPU、NPUでの推論を最適化するためのIntelのツールキットであり、IoTやエッジコンピューティングで一般的に使用されます。 - TensorRT (
engine): FP16およびINT8最適化により最高レベルのGPU推論を実現する、NVIDIAの高性能ランタイムです。 - CoreML (
coreml): Apple Neural Engineを使用する、iOS、macOS、watchOS、およびtvOS向けのAppleのオンデバイスフォーマットです。 - TF SavedModel (
saved_model): TensorFlow Servingを使用したスケーラブルなサーバーサイドサービングのための、TensorFlowの標準フォーマットです。 - TF GraphDef (
pb): 固定された計算グラフを必要とする環境向けの、フリーズされた静的グラフTensorFlowフォーマットです。 - TF Lite (
tflite): モバイルおよび組み込みハードウェアでのオンデバイス推論のための軽量TensorFlowランタイムです。 - TF Edge TPU (
edgetpu): Google Coral Edge TPUアクセラレータ向けにTF Liteモデルをコンパイルします。 - TF.js (
tfjs): WebGLを通じて高速化され、バックエンドなしでブラウザ内で直接モデルを実行します。 - PaddlePaddle (
paddle): 中国で普及しているBaiduのディープラーニングフレームワークであり、幅広いハードウェアサポートを備えています。 - MNN (
mnn): モバイルおよび組み込みのARMおよびx86-64システム向けに最適化された、軽量で高性能な推論エンジンです。 - NCNN (
ncnn): モバイルARMデバイス用に調整された、高性能かつ軽量な推論フレームワークです。 - Sony IMX500 (
imx): Raspberry Pi AI Cameraなど、チップ上での処理機能を備えたSonyのインテリジェントビジョンセンサーIMX500向けのエクスポートです。 - Rockchip RKNN (
rknn): FP16およびINT8量子化を使用して、組み込みボード上のRockchip NPUをターゲットにします。 - ExecuTorch (
executorch): XNNPACKを介してモバイル(iOSおよびAndroid)および組み込みシステムを実現する、PyTorchのネイティブなオンデバイスランタイムです。 - Axelera AI (
axelera): 高スループットのエッジ推論のために、PCIeまたはM.2経由でAxeleraのMetis AIPU(最大856 TOPS)向けにコンパイルします。 - DEEPX (
deepx): 組み込みエッジ推論のために、INT8量子化を用いてDEEPX NPUハードウェアをターゲットにします。 - Qualcomm QNN (
qnn): Qualcomm AIスタックを通じて、Snapdragon Hexagon NPU、Adreno GPU、およびCPU上でのオンデバイス推論を行います。
別のエッジターゲットとして、HailoインテグレーションはYOLO検出モデルをHailo HEFにコンパイルします。これは直接のmodel.export()ターゲットではありません。検出モデルをまずONNXにエクスポートし、その後、Hailo-8、Hailo-8L、Hailo-15アクセラレータ向けの外部Hailo Dataflow Compilerを使用してHEFにコンパイルします。
Link to this sectionデプロイオプションの比較#
以下の表は、通常選択の基準となる項目に基づいた、YOLO26モデルのデプロイオプションの要約です。各フォーマットの詳細については、エクスポートフォーマットドキュメントを参照してください。
| デプロイメントオプション | パフォーマンスベンチマーク | 互換性と統合 | コミュニティサポートとエコシステム | ユースケース | メンテナンスとアップデート | セキュリティの考慮事項 | ハードウェアアクセラレーション |
|---|---|---|---|---|---|---|---|
| PyTorch | 優れた柔軟性; 生のパフォーマンスとトレードオフになる可能性があります | Python ライブラリとの優れた互換性 | 豊富なリソースとコミュニティ | 研究およびプロトタイプ | 定期的な活発な開発 | デプロイメント環境に依存 | GPU アクセラレーションのための CUDA サポート |
| TorchScript | PyTorch よりも本番環境に適している | PyTorch から C++ へのスムーズな移行 | 専門的ですが PyTorch よりも限定的 | Python がボトルネックとなる業界 | PyTorch との一貫したアップデート | Python 全体を含まないことによるセキュリティの向上 | PyTorch から CUDA サポートを継承 |
| ONNX | ランタイムによって異なる | 異なるフレームワーク間で高い互換性 | 多くの組織にサポートされた幅広いエコシステム | ML フレームワーク間での柔軟性 | 新しい演算に対する定期的なアップデート | 安全な変換とデプロイメントの実践を確保 | さまざまなハードウェア最適化 |
| OpenVINO | Intel ハードウェア向けに最適化 | Intel エコシステム内で最適 | コンピュータビジョン分野で堅実 | Intel ハードウェアを使用した IoT およびエッジ | Intel ハードウェア向けの定期的なアップデート | 機密性の高いアプリケーション向けの堅牢な機能 | Intel ハードウェア向けに調整 |
| TensorRT | NVIDIA GPU で最高レベル | NVIDIA ハードウェアに最適 | NVIDIA を通じた強力なネットワーク | リアルタイムのビデオおよび画像推論 | 新しい GPU に対する頻繁なアップデート | セキュリティを重視 | NVIDIA GPU 向けに設計 |
| CoreML | オンデバイスの Apple ハードウェアに最適化 | Apple エコシステム専用 | 強力な Apple と開発者のサポート | Apple 製品でのオンデバイス ML | Apple の定期的なアップデート | プライバシーとセキュリティに重点を置く | Apple Neural Engine および GPU |
| TF SavedModel | サーバー環境でスケーラブル | TensorFlow エコシステム内での幅広い互換性 | TensorFlow の人気による大規模なサポート | 大規模なモデルの提供 | Google とコミュニティによる定期的なアップデート | エンタープライズ向けの堅牢な機能 | さまざまなハードウェアアクセラレーション |
| TF GraphDef | 静的計算グラフに対して安定 | TensorFlow インフラストラクチャとうまく統合 | 静的グラフを最適化するためのリソース | 静的グラフを必要とするシナリオ | TensorFlowコアに合わせたアップデート | 確立されたTensorFlowセキュリティプラクティス | TensorFlowアクセラレーションオプション |
| TF Lite | モバイル/組み込み環境での速度と効率性 | 幅広いデバイスサポート | 堅牢なコミュニティ、Googleのサポート | フットプリントを最小限に抑えたモバイルアプリケーション | モバイル向けの最新機能 | エンドユーザーデバイス上でのセキュアな環境 | GPUやDSPなど |
| TF Edge TPU | GoogleのEdge TPUハードウェア向けに最適化 | Edge TPUデバイス専用 | Googleおよびサードパーティのリソースと共に成長 | リアルタイム処理を必要とするIoTデバイス | 新しいEdge TPUハードウェア向けの改善 | Googleの堅牢なIoTセキュリティ | Google Coral向けにカスタム設計 |
| TF.js | ブラウザ内での妥当なパフォーマンス | ウェブ技術で高いパフォーマンスを実現 | WebおよびNode.js開発者のサポート | インタラクティブなWebアプリケーション | TensorFlowチームおよびコミュニティによる貢献 | Webプラットフォームセキュリティモデル | WebGLやその他のAPIによる拡張 |
| PaddlePaddle | 競争力があり、使いやすくスケーラブル | Baiduエコシステム、幅広いアプリケーションサポート | 特に中国で急成長中 | 中国市場と言語処理 | 中国のAIアプリケーションに注力 | データプライバシーとセキュリティを重視 | BaiduのKunlunチップを含む |
| MNN | モバイルデバイス向けの高性能 | モバイルおよび組み込みARMシステムとX86-64 CPU | モバイル/組み込みMLコミュニティ | モバイルシステムの効率性 | モバイルデバイス上での高性能なメンテナンス | オンデバイスセキュリティの利点 | ARM CPUおよびGPUの最適化 |
| NCNN | モバイルARMベースデバイス向けに最適化 | モバイルおよび組み込みARMシステム | ニッチだが活発なモバイル/組み込みMLコミュニティ | AndroidおよびARMシステムの効率性 | ARMにおける高性能な保守 | オンデバイスセキュリティの利点 | ARM CPUおよびGPUの最適化 |
| Sony IMX500 | 超低消費電力でのセンサー内推論 | Sony IMX500センサー、Raspberry Pi AI Camera | Sony AITRIOSエコシステム | カメラ内エッジAI | Sony SDKおよびMCTツールチェーンのアップデート | データはセンサー内に留まる | Sony IMX500チップ内アクセラレータ |
| Rockchip RKNN | Rockchip NPU向けに最適化 | Rockchip SoCボード(例:RK3588) | Rockchip開発者コミュニティ | 組み込みSBCおよびエッジデバイス | Rockchip RKNN-Toolkitのアップデート | オンデバイスでのローカル推論 | Rockchip NPU |
| ExecuTorch | 効率的なオンデバイスPyTorchランタイム | iOS、Android、XNNPACK経由の組み込み | PyTorchプロジェクトによる支援 | モバイルおよび組み込みアプリ | PyTorchと並行してメンテナンス | デバイス内での推論によりデータをローカルに保持 | XNNPACKおよびモバイルCPU/GPUバックエンド |
| Axelera AI | 非常に高いスループット(最大856 TOPS) | PCIeまたはM.2経由のMetis AIPU | Axelera Voyager SDK | 高スループットのエッジ推論 | Axelera SDKのアップデート | オンプレミスでのエッジ推論 | Axelera Metis AIPU |
| DEEPX | INT8最適化されたNPU推論 | DEEPX NPUハードウェア | DEEPX開発者ツール (dx_com, dx_engine) | 組み込みエッジ推論 | DEEPX SDKおよびランタイムのアップデート | オンデバイスでのローカル推論 | DEEPX NPU |
| Qualcomm QNN | 高速なオンデバイスSnapdragon推論 | Snapdragon Hexagon NPU、Adreno GPU、CPU | Qualcomm AI Hubエコシステム | モバイルおよびエッジSnapdragonデバイス | Qualcomm AIスタック (QAIRT) のアップデート | デバイス内での推論によりデータをローカルに保持 | Snapdragon Hexagon NPU |
この比較は、全体的な概要を提供するものです。デプロイにあたっては、プロジェクトの具体的な要件や制約を各オプションと照らし合わせ、選択したフォーマットのリンク先統合ガイドを参照してください。
Link to this section結論#
YOLO26の幅広いエクスポートフォーマットにより、クラウドGPUサーバーからセンサー内エッジカメラまで、ほぼあらゆる環境に合わせてモデルを調整できます。フォーマットを選択したら、最適化、トラブルシューティング、セキュリティのためにモデルデプロイのベストプラクティスに従い、問題が発生した場合はUltralyticsコミュニティを頼ってください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionさまざまなハードウェアプラットフォームにおけるYOLO26のデプロイメントオプションにはどのようなものがありますか?#
Ultralytics YOLO26は、特定の環境やハードウェアプラットフォーム向けに設計されたさまざまなデプロイメントフォーマットをサポートしています。主要なフォーマットは以下の通りです:
- PyTorch: 研究やプロトタイピング向け。優れたPython統合を提供します。
- TorchScript: Pythonが使用できない本番環境向け。
- ONNX: クロスプラットフォームの互換性とハードウェアアクセラレーション向け。
- OpenVINO: Intelハードウェアでのパフォーマンス最適化向け。
- TensorRT: NVIDIA GPUでの高速推論向け。
各フォーマットには独自の利点があります。詳細な手順については、エクスポートプロセスのドキュメントを参照してください。
Link to this sectionIntel CPU上でYOLO26モデルの推論速度を向上させるにはどうすればよいですか?#
Intel CPUでの推論速度を向上させるには、IntelのOpenVINOツールキットを使用してYOLO26モデルをデプロイできます。OpenVINOは、Intelハードウェアを効率的に活用するようにモデルを最適化し、大幅なパフォーマンス向上を実現します。
model.export()関数を使用して、YOLO26モデルをOpenVINOフォーマットに変換してください。- Intel OpenVINOエクスポートのドキュメントにある詳細なセットアップガイドに従ってください。
さらなる洞察については、当社のブログ投稿をご覧ください。
Link to this sectionYOLO26モデルをモバイルデバイスにデプロイできますか?#
はい、YOLO26モデルは、AndroidおよびiOSプラットフォームの両方でTensorFlow Lite (TF Lite)を使用してモバイルデバイスにデプロイできます。TF Liteはモバイルおよび組み込みデバイス向けに設計されており、効率的なオンデバイス推論を提供します。
# Export command for TFLite format
model.export(format="tflite")モバイルへのモデルデプロイメントの詳細については、TF Lite統合ガイドを参照してください。
Link to this sectionYOLO26モデルのデプロイメントフォーマットを選択する際、どのような要素を考慮すべきですか?#
YOLO26のデプロイメントフォーマットを選択する際は、以下の要素を考慮してください:
- パフォーマンス: TensorRTのようなフォーマットはNVIDIA GPUで非常に高速ですが、OpenVINOはIntelハードウェアに最適化されています。
- 互換性: ONNXは、異なるプラットフォーム間で幅広い互換性を提供します。
- 統合の容易さ: CoreMLやTF Liteのようなフォーマットは、それぞれiOSやAndroidなどの特定のエコシステムに合わせて調整されています。
- コミュニティサポート: PyTorchやTensorFlowのようなフォーマットは、広範なコミュニティリソースとサポートを備えています。
比較分析については、エクスポートフォーマットのドキュメントを参照してください。
Link to this sectionWebアプリケーションにYOLO26モデルをデプロイするにはどうすればよいですか?#
WebアプリケーションにYOLO26モデルをデプロイするには、TensorFlow.js (TF.js)を使用できます。これにより、ブラウザ内で直接機械学習モデルを実行できます。このアプローチにより、バックエンドインフラストラクチャが不要になり、リアルタイムのパフォーマンスが提供されます。
- YOLO26モデルをTF.jsフォーマットにエクスポートします。
- エクスポートされたモデルをWebアプリケーションに統合します。
手順については、TensorFlow.js統合ガイドを参照してください。