Link to this sectionクイックスタートガイド: NVIDIA DGX Spark と Ultralytics YOLO26#
この包括的なガイドでは、NVIDIAのコンパクトなデスクトップAIスーパーコンピュータであるNVIDIA DGX Spark上でUltralytics YOLO26をデプロイするための詳細な手順を説明します。さらに、この強力なシステム上でのYOLO26の性能を実証するためのベンチマークも紹介します。
本ガイドは、UbuntuベースのDGX OSを実行するNVIDIA DGX Spark Founders Editionでテスト済みです。最新のDGX OSリリースでも動作するはずです。
Link to this sectionNVIDIA DGX Sparkとは何ですか?#
NVIDIA DGX Sparkは、NVIDIA GB10 Grace Blackwell Superchipを搭載したコンパクトなデスクトップAIスーパーコンピュータです。FP4精度で最大1ペタFLOPSのAIコンピューティング性能を実現し、デスクトップフォームファクタで強力なAI機能を必要とする開発者、研究者、データサイエンティストにとって理想的です。
Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference
Link to this section主要仕様#
| 仕様 | 詳細 |
|---|---|
| AIパフォーマンス | 最大1 PFLOP (FP4) |
| GPU | NVIDIA Blackwellアーキテクチャ、第5世代Tensorコア、第4世代RTコア |
| CPU | 20コアArmプロセッサ (10 Cortex-X925 + 10 Cortex-A725) |
| メモリ | 128 GB LPDDR5x ユニファイドシステムメモリ、256-bitインターフェース、4266 MHz、273 GB/s帯域幅 |
| ストレージ | 1 TBまたは4 TB NVMe M.2 (自己暗号化機能付き) |
| ネットワーク | 1x RJ-45 (10 GbE)、ConnectX-7 Smart NIC、Wi-Fi 7、Bluetooth 5.4 |
| 接続性 | 4x USB Type-C、1x HDMI 2.1a、HDMIマルチチャンネルオーディオ |
| ビデオ処理 | 1x NVENC、1x NVDEC |
Link to this sectionDGX OS#
NVIDIA DGX OSは、DGXシステム上でAI、機械学習、解析アプリケーションを実行するための、安定したテスト済みのサポートされたOS基盤を提供するカスタマイズされたLinuxディストリビューションです。これには以下が含まれます:
- AIワークロード向けに最適化された堅牢なLinux基盤
- NVIDIAハードウェア向けに事前設定されたドライバとシステム設定
- セキュリティアップデートとシステムメンテナンス機能
- 広範なNVIDIAソフトウェアエコシステムとの互換性
DGX OSは定期的なリリーススケジュールに従っており、通常は年2回(2月と8月頃)アップデートが提供され、メジャーリリースの間にセキュリティパッチが追加提供されます。
Link to this sectionDGX Dashboard#
DGX Sparkには、以下を提供する組み込みのDGX Dashboardが付属しています:
- リアルタイムシステム監視: システムの現在の運用メトリクスの概要
- システムアップデート: ダッシュボードから直接アップデートを適用する機能
- システム設定: デバイス名の変更やその他の構成
- 統合されたJupyterLab: 開発用ローカルJupyter Notebookへのアクセス
Link to this sectionダッシュボードへのアクセス#
Ubuntuデスクトップの左下隅にある「Show Apps」ボタンをクリックし、「DGX Dashboard」を選択してブラウザで開きます。
ダッシュボードには、起動時に自動的に仮想環境を作成し、推奨パッケージをインストールする統合JupyterLabインスタンスが含まれています。各ユーザーアカウントには、JupyterLabアクセス用の専用ポートが割り当てられます。
Link to this sectionDockerによるクイックスタート#
NVIDIA DGX Spark上でUltralytics YOLO26を使い始める最も速い方法は、ビルド済みDockerイメージを実行することです。Jetson AGX Thor (JetPack 7.0) をサポートする同じDockerイメージが、DGX OSを搭載したDGX Sparkでも動作します。
t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t完了後、「Use TensorRT on NVIDIA DGX Spark section」に進んでください。
Link to this sectionネイティブインストールから開始#
Dockerを使用しないネイティブインストールの場合は、以下の手順に従ってください。
Link to this sectionUltralyticsパッケージのインストール#
ここでは、PyTorchモデルを他の異なるフォーマットにエクスポートできるように、オプションの依存関係を含めてDGX SparkにUltralyticsパッケージをインストールします。TensorRTはDGX Sparkの性能を最大限に引き出すため、主にNVIDIA TensorRTエクスポートに焦点を当てます。
-
パッケージリストの更新、pipのインストール、最新版へのアップグレード
sudo apt update sudo apt install python3-pip -y pip install -U pip -
オプションの依存関係を含めて
ultralyticspipパッケージをインストールpip install ultralytics[export] -
デバイスの再起動
sudo reboot
Link to this sectionPyTorchとTorchvisionのインストール#
上記のultralyticsインストールにより、TorchとTorchvisionがインストールされます。ただし、pip経由でインストールされたこれらのパッケージは、CUDA 13を搭載したDGX SparkのARM64アーキテクチャに対して完全に最適化されていない可能性があります。そのため、CUDA 13互換バージョンのインストールを推奨します:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130When running PyTorch 2.9.1 on NVIDIA DGX Spark, you may encounter the following UserWarning when initializing CUDA (e.g. running yolo checks, yolo predict, etc.):
UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)この警告は無視しても問題ありません。恒久的に対処するには、PyTorch PR #164590 で修正が提出されており、これはPyTorch 2.10リリースに含まれる予定です。
Link to this sectiononnxruntime-gpu のインストール#
PyPIでホストされている onnxruntime-gpu パッケージには、ARM64システム用の aarch64 バイナリが含まれていません。そのため、このパッケージを手動でインストールする必要があります。このパッケージは一部のエクスポートに必要です。
Here we will download and install onnxruntime-gpu 1.24.0 with Python3.12 support.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlLink to this sectionNVIDIA DGX Spark上でTensorRTを使用する#
Ultralyticsでサポートされているすべてのモデルエクスポートフォーマットの中で、TensorRTはNVIDIA DGX Spark上で最高の推論性能を発揮するため、デプロイメントにおいて最も推奨されます。設定手順と高度な使用方法については、専用のTensorRT統合ガイドを参照してください。
Link to this sectionモデルをTensorRTに変換して推論を実行#
PyTorchフォーマットのYOLO26nモデルをTensorRTに変換し、エクスポートされたモデルで推論を実行します。
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")モデルをさまざまなモデルフォーマットにエクスポートする際に追加の引数にアクセスするには、エクスポートページをご覧ください。
Link to this sectionNVIDIA DGX Spark YOLO11ベンチマーク#
YOLO11ベンチマークは、Ultralyticsチームによって、PyTorch、TorchScript、ONNX、OpenVINO、TensorRT、TF SavedModel、TF GraphDef、TF Lite、MNN、NCNN、ExecuTorchなど、複数のモデルフォーマットの速度と精度を測定して実行されました。ベンチマークは、デフォルトの入力画像サイズ640で、FP32精度のNVIDIA DGX Spark上で実行されました。
Link to this section詳細比較表#
以下の表は、5つの異なるモデル(YOLO11n、YOLO11s、YOLO11m、YOLO11l、YOLO11x)の複数のフォーマットにおけるベンチマーク結果を示しており、各組み合わせのステータス、サイズ、mAP50-95(B)メトリック、および推論時間を示しています。
| 形式 | ステータス | ディスク上のサイズ(MB) | mAP50-95(B) | 推論時間 (ms/im) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.4 | 0.5071 | 2.67 |
| TorchScript | ✅ | 10.5 | 0.5083 | 2.62 |
| ONNX | ✅ | 10.2 | 0.5074 | 5.92 |
| OpenVINO | ✅ | 10.4 | 0.5058 | 14.95 |
| TensorRT (FP32) | ✅ | 12.8 | 0.5085 | 1.95 |
| TensorRT (FP16) | ✅ | 7.0 | 0.5068 | 1.01 |
| TensorRT (INT8) | ✅ | 18.6 | 0.4880 | 1.62 |
| TF SavedModel | ✅ | 25.7 | 0.5076 | 36.39 |
| TF GraphDef | ✅ | 10.3 | 0.5076 | 41.06 |
| TF Lite | ✅ | 10.3 | 0.5075 | 64.36 |
| MNN | ✅ | 10.1 | 0.5075 | 12.14 |
| NCNN | ✅ | 10.2 | 0.5041 | 12.31 |
| ExecuTorch | ✅ | 10.2 | 0.5075 | 27.61 |
Ultralytics 8.3.249でベンチマークを実施
Link to this section結果の再現#
上記のUltralyticsベンチマークをすべてのエクスポート形式で再現するには、以下のコードを実行してください。
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)ベンチマーク結果は、システムの正確なハードウェアおよびソフトウェア構成や、実行時の負荷状況によって異なる場合があります。最も信頼性の高い結果を得るには、data='coco.yaml'(5000枚の検証画像)のような大規模なデータセットを使用してください。
Link to this sectionNVIDIA DGX Sparkのベストプラクティス#
NVIDIA DGX Sparkを使用する際は、YOLO26を最大限のパフォーマンスで実行するために、いくつかのベストプラクティスに従うことを推奨します。
-
システムパフォーマンスの監視
NVIDIAの監視ツールを使用して、GPUおよびCPUの使用率を追跡してください。
nvidia-smi -
メモリ使用量の最適化
128GBのユニファイドメモリを搭載したDGX Sparkは、大規模なバッチサイズやモデルを処理できます。スループットを向上させるために、バッチサイズの増加を検討してください。
from ultralytics import YOLO model = YOLO("yolo26n.engine") results = model.predict(source="path/to/images", batch=16) -
TensorRTとFP16またはINT8の使用
最高のパフォーマンスを得るには、FP16またはINT8精度でモデルをエクスポートしてください。
yolo export model=yolo26n.pt format=engine half=True # FP16 yolo export model=yolo26n.pt format=engine int8=True # INT8
Link to this sectionシステムアップデート (Founders Edition)#
DGX Spark Founders Editionを常に最新の状態に保つことは、パフォーマンスとセキュリティの観点から非常に重要です。NVIDIAは、システムOS、ドライバ、およびファームウェアを更新するための2つの主要な方法を提供しています。
Link to this sectionDGX Dashboardの使用(推奨)#
DGX Dashboardは、互換性を確保しながらシステムアップデートを実行するための推奨される方法です。これを使用すると、以下のことが可能です。
- 利用可能なシステムアップデートの確認
- セキュリティパッチおよびシステムアップデートのインストール
- NVIDIAドライバおよびファームウェア更新の管理
Link to this section手動によるシステムアップデート#
上級ユーザー向けに、ターミナル経由で手動でアップデートを実行することも可能です。
sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo rebootアップデートを実行する前に、システムが安定した電源に接続されていること、および重要なデータをバックアップ済みであることを確認してください。
Link to this section次のステップ#
さらなる学習やサポートについては、Ultralytics YOLO26 Docsを参照してください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionNVIDIA DGX SparkにUltralytics YOLO26をデプロイするにはどうすればよいですか?#
NVIDIA DGX SparkへのUltralytics YOLO26のデプロイは簡単です。迅速なセットアップにはビルド済みのDockerイメージを使用するか、必要なパッケージを手動でインストールしてください。各アプローチの詳細な手順は、「Quick Start with Docker」および「Start with Native Installation」のセクションで確認できます。
Link to this sectionDGX Spark上のYOLO26ではどのようなパフォーマンスが期待できますか?#
YOLO26モデルは、GB10 Grace Blackwell Superchipのおかげで、DGX Spark上で優れたパフォーマンスを発揮します。TensorRT形式は最高の推論パフォーマンスを提供します。さまざまなモデルサイズや形式にわたる具体的なベンチマーク結果については、「Detailed Comparison Table」セクションを確認してください。
Link to this sectionDGX SparkでYOLO26にTensorRTを使用する理由は何ですか?#
TensorRTは、最適なパフォーマンスが得られるため、DGX Spark上でYOLO26モデルをデプロイする際に強く推奨されます。Blackwell GPUの機能を活用することで推論を高速化し、効率と速度を最大限に高めます。詳細については、「Use TensorRT on NVIDIA DGX Spark」セクションを参照してください。
Link to this sectionYOLO26において、DGX SparkとJetsonデバイスはどのように異なりますか?#
DGX Sparkは最大1 PFLOPのAIパフォーマンスと128GBのユニファイドメモリを提供します。これに対し、Jetson AGX Thorは2070 TFLOPSと128GBのメモリを備えています。DGX Sparkはデスクトップ型のAIスーパーコンピュータとして設計されており、一方でJetsonデバイスはエッジデプロイメント向けに最適化された組み込みシステムです。
Link to this sectionDGX SparkとJetson AGX Thorで同じDockerイメージを使用できますか?#
はい。ultralytics/ultralytics:latest-nvidia-arm64 Dockerイメージは、NVIDIA DGX Spark(DGX OS搭載)とJetson AGX Thor(JetPack 7.0搭載)の両方をサポートしています。どちらもCUDA 13と類似のソフトウェアスタックを備えたARM64アーキテクチャを採用しているためです。