Link to this sectionGuide de démarrage rapide : NVIDIA DGX Spark avec Ultralytics YOLO26#
Ce guide complet fournit une procédure détaillée pour déployer Ultralytics YOLO26 sur NVIDIA DGX Spark, le superordinateur IA de bureau compact de NVIDIA. Il présente également des benchmarks de performance pour démontrer les capacités de YOLO26 sur ce système puissant.
Ce guide a été testé avec l'édition NVIDIA DGX Spark Founders exécutant le DGX OS basé sur Ubuntu. Il est censé fonctionner avec les dernières versions de DGX OS.
Link to this sectionQu'est-ce que NVIDIA DGX Spark ?#
NVIDIA DGX Spark est un superordinateur IA de bureau compact propulsé par la superpuce NVIDIA GB10 Grace Blackwell. Il offre jusqu'à 1 petaFLOP de performance de calcul IA avec une précision FP4, ce qui le rend idéal pour les développeurs, chercheurs et scientifiques des données qui ont besoin de capacités IA puissantes dans un format de bureau.
Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference
Link to this sectionSpécifications clés#
| Spécification | Détails |
|---|---|
| Performance IA | Jusqu'à 1 PFLOP (FP4) |
| GPU | Architecture NVIDIA Blackwell avec Tensor Cores de 5e génération, RT Cores de 4e génération |
| CPU | Processeur Arm 20 cœurs (10 Cortex-X925 + 10 Cortex-A725) |
| Mémoire | 128 Go de mémoire système unifiée LPDDR5x, interface 256 bits, 4266 MHz, bande passante 273 Go/s |
| Stockage | 1 To ou 4 To NVMe M.2 avec auto-chiffrement |
| Réseau | 1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4 |
| Connectivité | 4x USB Type-C, 1x HDMI 2.1a, audio multicanal HDMI |
| Traitement vidéo | 1x NVENC, 1x NVDEC |
Link to this sectionDGX OS#
NVIDIA DGX OS est une distribution Linux personnalisée qui fournit une base de système d'exploitation stable, testée et prise en charge pour exécuter des applications d'IA, d'apprentissage automatique et d'analyse sur les systèmes DGX. Il inclut :
- Une base Linux robuste optimisée pour les charges de travail IA
- Des pilotes et paramètres système préconfigurés pour le matériel NVIDIA
- Des mises à jour de sécurité et des capacités de maintenance système
- Une compatibilité avec l'écosystème logiciel NVIDIA plus large
DGX OS suit un calendrier de publication régulier avec des mises à jour généralement fournies deux fois par an (autour de février et août), avec des correctifs de sécurité supplémentaires fournis entre les versions majeures.
Link to this sectionTableau de bord DGX#
DGX Spark est livré avec un DGX Dashboard intégré qui fournit :
- Surveillance système en temps réel : Aperçu des métriques opérationnelles actuelles du système
- Mises à jour système : Capacité d'appliquer les mises à jour directement depuis le tableau de bord
- Paramètres système : Modifier le nom de l'appareil et d'autres configurations
- JupyterLab intégré : Accéder aux notebooks Jupyter locaux pour le développement
Link to this sectionAccéder au tableau de bord#
Clique sur le bouton "Show Apps" dans le coin inférieur gauche du bureau Ubuntu, puis sélectionne "DGX Dashboard" pour l'ouvrir dans ton navigateur.
Le tableau de bord inclut une instance JupyterLab intégrée qui crée automatiquement un environnement virtuel et installe les paquets recommandés lors du démarrage. Chaque compte utilisateur se voit attribuer un port dédié pour l'accès à JupyterLab.
Link to this sectionDémarrage rapide avec Docker#
Le moyen le plus rapide de commencer avec Ultralytics YOLO26 sur NVIDIA DGX Spark est d'exécuter des images Docker pré-construites. La même image Docker qui prend en charge Jetson AGX Thor (JetPack 7.0) fonctionne sur DGX Spark avec DGX OS.
t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $tUne fois cela fait, passe à la section Utiliser TensorRT sur NVIDIA DGX Spark.
Link to this sectionDémarrer avec une installation native#
Pour une installation native sans Docker, suis ces étapes.
Link to this sectionInstaller le paquet Ultralytics#
Ici, nous allons installer le paquet Ultralytics sur DGX Spark avec les dépendances optionnelles afin de pouvoir exporter les modèles PyTorch vers d'autres formats différents. Nous nous concentrerons principalement sur les exports NVIDIA TensorRT car TensorRT garantira d'obtenir la performance maximale du DGX Spark.
-
Mettre à jour la liste des paquets, installer pip et passer à la dernière version
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Installer le paquet pip
ultralyticsavec les dépendances optionnellespip install ultralytics[export] -
Redémarrer l'appareil
sudo reboot
Link to this sectionInstaller PyTorch et Torchvision#
L'installation d'ultralytics ci-dessus installera Torch et Torchvision. Cependant, ces paquets installés via pip peuvent ne pas être entièrement optimisés pour l'architecture ARM64 du DGX Spark avec CUDA 13. Par conséquent, nous recommandons d'installer les versions compatibles CUDA 13 :
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130Lors de l'exécution de PyTorch 2.9.1 sur NVIDIA DGX Spark, tu peux rencontrer le UserWarning suivant lors de l'initialisation de CUDA (par exemple en exécutant yolo checks, yolo predict, etc.) :
UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)Cet avertissement peut être ignoré en toute sécurité. Pour résoudre cela de manière permanente, un correctif a été soumis dans la PR PyTorch #164590 qui sera inclus dans la version PyTorch 2.10.
Link to this sectionInstaller onnxruntime-gpu#
Le paquet onnxruntime-gpu hébergé sur PyPI ne possède pas de binaires aarch64 pour les systèmes ARM64. Nous devons donc installer ce paquet manuellement. Ce paquet est nécessaire pour certains des exports.
Ici, nous allons télécharger et installer onnxruntime-gpu 1.24.0 avec le support de Python3.12.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlLink to this sectionUtiliser TensorRT sur NVIDIA DGX Spark#
Parmi tous les formats d'exportation de modèles pris en charge par Ultralytics, TensorRT offre la performance d'inférence la plus élevée sur NVIDIA DGX Spark, ce qui en fait notre recommandation principale pour les déploiements. Pour les instructions de configuration et l'utilisation avancée, consulte notre guide d'intégration TensorRT dédié.
Link to this sectionConvertir le modèle en TensorRT et exécuter l'inférence#
Le modèle YOLO26n au format PyTorch est converti en TensorRT pour exécuter l'inférence avec le modèle exporté.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")Visite la page d'exportation pour accéder à des arguments supplémentaires lors de l'exportation de modèles vers différents formats de modèles
Link to this sectionBenchmarks NVIDIA DGX Spark YOLO11#
Les benchmarks YOLO11 ont été exécutés par l'équipe Ultralytics sur plusieurs formats de modèles mesurant la vitesse et la précision : PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Les benchmarks ont été exécutés sur NVIDIA DGX Spark à une précision FP32 avec une taille d'image d'entrée par défaut de 640.
Link to this sectionTableau de comparaison détaillé#
Le tableau ci-dessous représente les résultats des benchmarks pour cinq modèles différents (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) à travers plusieurs formats, nous donnant le statut, la taille, la métrique mAP50-95(B) et le temps d'inférence pour chaque combinaison.
| Format | Statut | Taille sur le disque (Mo) | mAP50-95(B) | Temps d'inférence (ms/im) |
|---|---|---|---|---|
| PyTorch | ✅ | 5,4 | 0.5071 | 2.67 |
| TorchScript | ✅ | 10.5 | 0.5083 | 2.62 |
| ONNX | ✅ | 10.2 | 0.5074 | 5.92 |
| OpenVINO | ✅ | 10.4 | 0.5058 | 14.95 |
| TensorRT (FP32) | ✅ | 12.8 | 0.5085 | 1.95 |
| TensorRT (FP16) | ✅ | 7.0 | 0.5068 | 1.01 |
| TensorRT (INT8) | ✅ | 18.6 | 0.4880 | 1.62 |
| TF SavedModel | ✅ | 25.7 | 0.5076 | 36.39 |
| TF GraphDef | ✅ | 10.3 | 0.5076 | 41.06 |
| TF Lite | ✅ | 10.3 | 0.5075 | 64.36 |
| MNN | ✅ | 10.1 | 0.5075 | 12.14 |
| NCNN | ✅ | 10.2 | 0.5041 | 12.31 |
| ExecuTorch | ✅ | 10.2 | 0.5075 | 27.61 |
Benchmarké avec Ultralytics 8.3.249
Link to this sectionReproduis nos résultats#
Pour reproduire les benchmarks Ultralytics ci-dessus sur tous les formats d'exportation, exécute ce code :
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)Note que les résultats des benchmarks peuvent varier en fonction de la configuration matérielle et logicielle exacte d'un système, ainsi que de la charge de travail actuelle du système au moment de l'exécution des benchmarks. Pour des résultats plus fiables, utilise un jeu de données avec un grand nombre d'images, par exemple data='coco.yaml' (5000 images de validation).
Link to this sectionMeilleures pratiques pour NVIDIA DGX Spark#
Lorsque tu utilises NVIDIA DGX Spark, il y a quelques meilleures pratiques à suivre pour obtenir des performances maximales avec YOLO26.
-
Surveille les performances du système
Utilise les outils de surveillance de NVIDIA pour suivre l'utilisation du GPU et du CPU :
nvidia-smi -
Optimise l'utilisation de la mémoire
Avec 128 Go de mémoire unifiée, DGX Spark peut gérer des tailles de lot et des modèles importants. Envisage d'augmenter la taille du lot pour améliorer le débit :
from ultralytics import YOLO model = YOLO("yolo26n.engine") results = model.predict(source="path/to/images", batch=16) -
Utilise TensorRT avec FP16 ou INT8
Pour de meilleures performances, exporte tes modèles avec une précision FP16 ou INT8 :
yolo export model=yolo26n.pt format=engine half=True # FP16 yolo export model=yolo26n.pt format=engine int8=True # INT8
Link to this sectionMises à jour du système (Founders Edition)#
Garder ton système DGX Spark Founders Edition à jour est crucial pour les performances et la sécurité. NVIDIA propose deux méthodes principales pour mettre à jour l'OS du système, les pilotes et le micrologiciel.
Link to this sectionUtiliser le DGX Dashboard (Recommandé)#
Le DGX Dashboard est le moyen recommandé pour effectuer des mises à jour système en garantissant la compatibilité. Il te permet de :
- Voir les mises à jour système disponibles
- Installer des correctifs de sécurité et des mises à jour système
- Gérer les mises à jour des pilotes et du micrologiciel NVIDIA
Link to this sectionMises à jour manuelles du système#
Pour les utilisateurs avancés, les mises à jour peuvent être effectuées manuellement via le terminal :
sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo rebootAssure-toi que ton système est connecté à une source d'alimentation stable et que tu as sauvegardé tes données critiques avant d'effectuer les mises à jour.
Link to this sectionÉtapes suivantes#
Pour en savoir plus et obtenir de l'aide, consulte la documentation Ultralytics YOLO26.
Link to this sectionFAQ#
Link to this sectionComment déployer Ultralytics YOLO26 sur NVIDIA DGX Spark ?#
Déployer Ultralytics YOLO26 sur NVIDIA DGX Spark est simple. Tu peux utiliser l'image Docker pré-construite pour une configuration rapide ou installer manuellement les paquets requis. Les étapes détaillées pour chaque approche se trouvent dans les sections Démarrage rapide avec Docker et Démarrer avec une installation native.
Link to this sectionQuelles performances puis-je attendre de YOLO26 sur NVIDIA DGX Spark ?#
Les modèles YOLO26 offrent d'excellentes performances sur DGX Spark grâce à la superpuce GB10 Grace Blackwell. Le format TensorRT fournit les meilleures performances d'inférence. Vérifie la section Tableau comparatif détaillé pour des résultats de benchmark spécifiques selon les différentes tailles et formats de modèles.
Link to this sectionPourquoi devrais-je utiliser TensorRT pour YOLO26 sur DGX Spark ?#
TensorRT est fortement recommandé pour déployer les modèles YOLO26 sur DGX Spark en raison de ses performances optimales. Il accélère l'inférence en exploitant les capacités du GPU Blackwell, garantissant une efficacité et une vitesse maximales. Apprends-en davantage dans la section Utiliser TensorRT sur NVIDIA DGX Spark.
Link to this sectionComment DGX Spark se compare-t-il aux appareils Jetson pour YOLO26 ?#
DGX Spark offre jusqu'à 1 PFLOP de performance IA et 128 Go de mémoire unifiée, par rapport aux 2070 TFLOPS et 128 Go de mémoire du Jetson AGX Thor. DGX Spark est conçu comme un superordinateur IA de bureau, tandis que les appareils Jetson sont des systèmes embarqués optimisés pour le déploiement en périphérie (edge).
Link to this sectionPuis-je utiliser la même image Docker pour DGX Spark et Jetson AGX Thor ?#
Oui ! L'image Docker ultralytics/ultralytics:latest-nvidia-arm64 prend en charge à la fois NVIDIA DGX Spark (avec DGX OS) et Jetson AGX Thor (avec JetPack 7.0), car tous deux utilisent l'architecture ARM64 avec CUDA 13 et des piles logicielles similaires.