Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26デプロイオプションの比較分析#

YOLO26は20種類以上のデプロイオプションをサポートしており、それぞれが異なるランタイム、ハードウェアターゲット、プラットフォームに合わせて調整されています。PyTorchやONNXから、TensorRTOpenVINOCoreML、そして専用のEdge-NPUフォーマットまで対応しています。適切なオプションを選択することで、推論速度、ハードウェア制約、および統合の容易さのバランスを調整できます。このガイドではすべてのオプションを比較しているため、アプリケーションに最適なものを選択し、その後モデルデプロイのベストプラクティスに進んで確実にデプロイを行ってください。



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

デプロイはコンピュータビジョンプロジェクトのワークフローにおける、学習済みモデルが実際に稼働を開始する段階です。そのため、エクスポート先のフォーマットが速度、コスト、およびポータビリティに直接的な影響を与えます。

Link to this sectionYOLO26モデルに最適なデプロイオプションを選択する方法#

YOLO26モデルをデプロイする際、適切なエクスポートフォーマットを選択することは非常に重要です。Ultralytics YOLO26エクスポートドキュメントで概説されているように、model.export()関数は学習済みモデルを多様な環境やパフォーマンス要件に適したさまざまなフォーマットに変換します。

理想的なフォーマットは、モデルの意図する運用コンテキストとハードウェアに依存します。

手動エクスポートをスキップする

手動エクスポートを行わない管理型デプロイの場合、Ultralytics Platformは、世界43のリージョンで自動スケーリングを行う、すぐに利用可能な推論エンドポイントを提供しています。

Link to this sectionYOLO26のデプロイオプション#

各フォーマットの概要と、それを使用すべき場面については以下の通りです。エクスポートの完全な手順についてはエクスポートドキュメントを参照し、比較基準については比較表へ進んでください。

  • PyTorch (.pt): 標準的なトレーニングおよび推論フォーマットであり、最大限の柔軟性とCUDA GPUアクセラレーションを提供します。研究やプロトタイピングに最適で、エクスポート手順は不要です。
  • TorchScript (torchscript): Python不要のC++ランタイム用にモデルをシリアライズします。Pythonが利用できない本番システムに適しています。
  • ONNX (onnx): ONNX Runtimeを通じて幅広いクロスプラットフォームおよびハードウェアサポートを提供する、フレームワークにとらわれない相互運用フォーマットです。
  • OpenVINO (openvino): Intel CPU、統合GPU、NPUでの推論を最適化するためのIntelのツールキットであり、IoTやエッジコンピューティングで一般的に使用されます。
  • TensorRT (engine): FP16およびINT8最適化により最高レベルのGPU推論を実現する、NVIDIAの高性能ランタイムです。
  • CoreML (coreml): Apple Neural Engineを使用する、iOS、macOS、watchOS、およびtvOS向けのAppleのオンデバイスフォーマットです。
  • TF SavedModel (saved_model): TensorFlow Servingを使用したスケーラブルなサーバーサイドサービングのための、TensorFlowの標準フォーマットです。
  • TF GraphDef (pb): 固定された計算グラフを必要とする環境向けの、フリーズされた静的グラフTensorFlowフォーマットです。
  • TF Lite (tflite): モバイルおよび組み込みハードウェアでのオンデバイス推論のための軽量TensorFlowランタイムです。
  • TF Edge TPU (edgetpu): Google Coral Edge TPUアクセラレータ向けにTF Liteモデルをコンパイルします。
  • TF.js (tfjs): WebGLを通じて高速化され、バックエンドなしでブラウザ内で直接モデルを実行します。
  • PaddlePaddle (paddle): 中国で普及しているBaiduのディープラーニングフレームワークであり、幅広いハードウェアサポートを備えています。
  • MNN (mnn): モバイルおよび組み込みのARMおよびx86-64システム向けに最適化された、軽量で高性能な推論エンジンです。
  • NCNN (ncnn): モバイルARMデバイス用に調整された、高性能かつ軽量な推論フレームワークです。
  • Sony IMX500 (imx): Raspberry Pi AI Cameraなど、チップ上での処理機能を備えたSonyのインテリジェントビジョンセンサーIMX500向けのエクスポートです。
  • Rockchip RKNN (rknn): FP16およびINT8量子化を使用して、組み込みボード上のRockchip NPUをターゲットにします。
  • ExecuTorch (executorch): XNNPACKを介してモバイル(iOSおよびAndroid)および組み込みシステムを実現する、PyTorchのネイティブなオンデバイスランタイムです。
  • Axelera AI (axelera): 高スループットのエッジ推論のために、PCIeまたはM.2経由でAxeleraのMetis AIPU(最大856 TOPS)向けにコンパイルします。
  • DEEPX (deepx): 組み込みエッジ推論のために、INT8量子化を用いてDEEPX NPUハードウェアをターゲットにします。
  • Qualcomm QNN (qnn): Qualcomm AIスタックを通じて、Snapdragon Hexagon NPU、Adreno GPU、およびCPU上でのオンデバイス推論を行います。

別のエッジターゲットとして、HailoインテグレーションはYOLO検出モデルをHailo HEFにコンパイルします。これは直接のmodel.export()ターゲットではありません。検出モデルをまずONNXにエクスポートし、その後、Hailo-8、Hailo-8L、Hailo-15アクセラレータ向けの外部Hailo Dataflow Compilerを使用してHEFにコンパイルします。

Link to this sectionデプロイオプションの比較#

以下の表は、通常選択の基準となる項目に基づいた、YOLO26モデルのデプロイオプションの要約です。各フォーマットの詳細については、エクスポートフォーマットドキュメントを参照してください。

デプロイメントオプションパフォーマンスベンチマーク互換性と統合コミュニティサポートとエコシステムユースケースメンテナンスとアップデートセキュリティの考慮事項ハードウェアアクセラレーション
PyTorch優れた柔軟性; 生のパフォーマンスとトレードオフになる可能性がありますPython ライブラリとの優れた互換性豊富なリソースとコミュニティ研究およびプロトタイプ定期的な活発な開発デプロイメント環境に依存GPU アクセラレーションのための CUDA サポート
TorchScriptPyTorch よりも本番環境に適しているPyTorch から C++ へのスムーズな移行専門的ですが PyTorch よりも限定的Python がボトルネックとなる業界PyTorch との一貫したアップデートPython 全体を含まないことによるセキュリティの向上PyTorch から CUDA サポートを継承
ONNXランタイムによって異なる異なるフレームワーク間で高い互換性多くの組織にサポートされた幅広いエコシステムML フレームワーク間での柔軟性新しい演算に対する定期的なアップデート安全な変換とデプロイメントの実践を確保さまざまなハードウェア最適化
OpenVINOIntel ハードウェア向けに最適化Intel エコシステム内で最適コンピュータビジョン分野で堅実Intel ハードウェアを使用した IoT およびエッジIntel ハードウェア向けの定期的なアップデート機密性の高いアプリケーション向けの堅牢な機能Intel ハードウェア向けに調整
TensorRTNVIDIA GPU で最高レベルNVIDIA ハードウェアに最適NVIDIA を通じた強力なネットワークリアルタイムのビデオおよび画像推論新しい GPU に対する頻繁なアップデートセキュリティを重視NVIDIA GPU 向けに設計
CoreMLオンデバイスの Apple ハードウェアに最適化Apple エコシステム専用強力な Apple と開発者のサポートApple 製品でのオンデバイス MLApple の定期的なアップデートプライバシーとセキュリティに重点を置くApple Neural Engine および GPU
TF SavedModelサーバー環境でスケーラブルTensorFlow エコシステム内での幅広い互換性TensorFlow の人気による大規模なサポート大規模なモデルの提供Google とコミュニティによる定期的なアップデートエンタープライズ向けの堅牢な機能さまざまなハードウェアアクセラレーション
TF GraphDef静的計算グラフに対して安定TensorFlow インフラストラクチャとうまく統合静的グラフを最適化するためのリソース静的グラフを必要とするシナリオTensorFlowコアに合わせたアップデート確立されたTensorFlowセキュリティプラクティスTensorFlowアクセラレーションオプション
TF Liteモバイル/組み込み環境での速度と効率性幅広いデバイスサポート堅牢なコミュニティ、Googleのサポートフットプリントを最小限に抑えたモバイルアプリケーションモバイル向けの最新機能エンドユーザーデバイス上でのセキュアな環境GPUやDSPなど
TF Edge TPUGoogleのEdge TPUハードウェア向けに最適化Edge TPUデバイス専用Googleおよびサードパーティのリソースと共に成長リアルタイム処理を必要とするIoTデバイス新しいEdge TPUハードウェア向けの改善Googleの堅牢なIoTセキュリティGoogle Coral向けにカスタム設計
TF.jsブラウザ内での妥当なパフォーマンスウェブ技術で高いパフォーマンスを実現WebおよびNode.js開発者のサポートインタラクティブなWebアプリケーションTensorFlowチームおよびコミュニティによる貢献WebプラットフォームセキュリティモデルWebGLやその他のAPIによる拡張
PaddlePaddle競争力があり、使いやすくスケーラブルBaiduエコシステム、幅広いアプリケーションサポート特に中国で急成長中中国市場と言語処理中国のAIアプリケーションに注力データプライバシーとセキュリティを重視BaiduのKunlunチップを含む
MNNモバイルデバイス向けの高性能モバイルおよび組み込みARMシステムとX86-64 CPUモバイル/組み込みMLコミュニティモバイルシステムの効率性モバイルデバイス上での高性能なメンテナンスオンデバイスセキュリティの利点ARM CPUおよびGPUの最適化
NCNNモバイルARMベースデバイス向けに最適化モバイルおよび組み込みARMシステムニッチだが活発なモバイル/組み込みMLコミュニティAndroidおよびARMシステムの効率性ARMにおける高性能な保守オンデバイスセキュリティの利点ARM CPUおよびGPUの最適化
Sony IMX500超低消費電力でのセンサー内推論Sony IMX500センサー、Raspberry Pi AI CameraSony AITRIOSエコシステムカメラ内エッジAISony SDKおよびMCTツールチェーンのアップデートデータはセンサー内に留まるSony IMX500チップ内アクセラレータ
Rockchip RKNNRockchip NPU向けに最適化Rockchip SoCボード(例:RK3588)Rockchip開発者コミュニティ組み込みSBCおよびエッジデバイスRockchip RKNN-Toolkitのアップデートオンデバイスでのローカル推論Rockchip NPU
ExecuTorch効率的なオンデバイスPyTorchランタイムiOS、Android、XNNPACK経由の組み込みPyTorchプロジェクトによる支援モバイルおよび組み込みアプリPyTorchと並行してメンテナンスデバイス内での推論によりデータをローカルに保持XNNPACKおよびモバイルCPU/GPUバックエンド
Axelera AI非常に高いスループット(最大856 TOPS)PCIeまたはM.2経由のMetis AIPUAxelera Voyager SDK高スループットのエッジ推論Axelera SDKのアップデートオンプレミスでのエッジ推論Axelera Metis AIPU
DEEPXINT8最適化されたNPU推論DEEPX NPUハードウェアDEEPX開発者ツール (dx_com, dx_engine)組み込みエッジ推論DEEPX SDKおよびランタイムのアップデートオンデバイスでのローカル推論DEEPX NPU
Qualcomm QNN高速なオンデバイスSnapdragon推論Snapdragon Hexagon NPU、Adreno GPU、CPUQualcomm AI HubエコシステムモバイルおよびエッジSnapdragonデバイスQualcomm AIスタック (QAIRT) のアップデートデバイス内での推論によりデータをローカルに保持Snapdragon Hexagon NPU

この比較は、全体的な概要を提供するものです。デプロイにあたっては、プロジェクトの具体的な要件や制約を各オプションと照らし合わせ、選択したフォーマットのリンク先統合ガイドを参照してください。

Link to this section結論#

YOLO26の幅広いエクスポートフォーマットにより、クラウドGPUサーバーからセンサー内エッジカメラまで、ほぼあらゆる環境に合わせてモデルを調整できます。フォーマットを選択したら、最適化、トラブルシューティング、セキュリティのためにモデルデプロイのベストプラクティスに従い、問題が発生した場合はUltralyticsコミュニティを頼ってください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionさまざまなハードウェアプラットフォームにおけるYOLO26のデプロイメントオプションにはどのようなものがありますか?#

Ultralytics YOLO26は、特定の環境やハードウェアプラットフォーム向けに設計されたさまざまなデプロイメントフォーマットをサポートしています。主要なフォーマットは以下の通りです:

  • PyTorch: 研究やプロトタイピング向け。優れたPython統合を提供します。
  • TorchScript: Pythonが使用できない本番環境向け。
  • ONNX: クロスプラットフォームの互換性とハードウェアアクセラレーション向け。
  • OpenVINO: Intelハードウェアでのパフォーマンス最適化向け。
  • TensorRT: NVIDIA GPUでの高速推論向け。

各フォーマットには独自の利点があります。詳細な手順については、エクスポートプロセスのドキュメントを参照してください。

Link to this sectionIntel CPU上でYOLO26モデルの推論速度を向上させるにはどうすればよいですか?#

Intel CPUでの推論速度を向上させるには、IntelのOpenVINOツールキットを使用してYOLO26モデルをデプロイできます。OpenVINOは、Intelハードウェアを効率的に活用するようにモデルを最適化し、大幅なパフォーマンス向上を実現します。

  1. model.export()関数を使用して、YOLO26モデルをOpenVINOフォーマットに変換してください。
  2. Intel OpenVINOエクスポートのドキュメントにある詳細なセットアップガイドに従ってください。

さらなる洞察については、当社のブログ投稿をご覧ください。

Link to this sectionYOLO26モデルをモバイルデバイスにデプロイできますか?#

はい、YOLO26モデルは、AndroidおよびiOSプラットフォームの両方でTensorFlow Lite (TF Lite)を使用してモバイルデバイスにデプロイできます。TF Liteはモバイルおよび組み込みデバイス向けに設計されており、効率的なオンデバイス推論を提供します。

# Export command for TFLite format
model.export(format="tflite")

モバイルへのモデルデプロイメントの詳細については、TF Lite統合ガイドを参照してください。

Link to this sectionYOLO26モデルのデプロイメントフォーマットを選択する際、どのような要素を考慮すべきですか?#

YOLO26のデプロイメントフォーマットを選択する際は、以下の要素を考慮してください:

  • パフォーマンス: TensorRTのようなフォーマットはNVIDIA GPUで非常に高速ですが、OpenVINOはIntelハードウェアに最適化されています。
  • 互換性: ONNXは、異なるプラットフォーム間で幅広い互換性を提供します。
  • 統合の容易さ: CoreMLやTF Liteのようなフォーマットは、それぞれiOSやAndroidなどの特定のエコシステムに合わせて調整されています。
  • コミュニティサポート: PyTorchやTensorFlowのようなフォーマットは、広範なコミュニティリソースとサポートを備えています。

比較分析については、エクスポートフォーマットのドキュメントを参照してください。

Link to this sectionWebアプリケーションにYOLO26モデルをデプロイするにはどうすればよいですか?#

WebアプリケーションにYOLO26モデルをデプロイするには、TensorFlow.js (TF.js)を使用できます。これにより、ブラウザ内で直接機械学習モデルを実行できます。このアプローチにより、バックエンドインフラストラクチャが不要になり、リアルタイムのパフォーマンスが提供されます。

  1. YOLO26モデルをTF.jsフォーマットにエクスポートします。
  2. エクスポートされたモデルをWebアプリケーションに統合します。

手順については、TensorFlow.js統合ガイドを参照してください。

コメント