Meet YOLO26: next-gen vision AI.

Link to this sectionGuide de démarrage rapide : NVIDIA DGX Spark avec Ultralytics YOLO26#

Ce guide complet fournit une procédure détaillée pour déployer Ultralytics YOLO26 sur NVIDIA DGX Spark, le superordinateur IA de bureau compact de NVIDIA. Il présente également des benchmarks de performance pour démontrer les capacités de YOLO26 sur ce système puissant.

NVIDIA DGX Spark AI workstation overview

Remarque

Ce guide a été testé avec l'édition NVIDIA DGX Spark Founders exécutant le DGX OS basé sur Ubuntu. Il est censé fonctionner avec les dernières versions de DGX OS.

Link to this sectionQu'est-ce que NVIDIA DGX Spark ?#

NVIDIA DGX Spark est un superordinateur IA de bureau compact propulsé par la superpuce NVIDIA GB10 Grace Blackwell. Il offre jusqu'à 1 petaFLOP de performance de calcul IA avec une précision FP4, ce qui le rend idéal pour les développeurs, chercheurs et scientifiques des données qui ont besoin de capacités IA puissantes dans un format de bureau.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Link to this sectionSpécifications clés#

SpécificationDétails
Performance IAJusqu'à 1 PFLOP (FP4)
GPUArchitecture NVIDIA Blackwell avec Tensor Cores de 5e génération, RT Cores de 4e génération
CPUProcesseur Arm 20 cœurs (10 Cortex-X925 + 10 Cortex-A725)
Mémoire128 Go de mémoire système unifiée LPDDR5x, interface 256 bits, 4266 MHz, bande passante 273 Go/s
Stockage1 To ou 4 To NVMe M.2 avec auto-chiffrement
Réseau1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4
Connectivité4x USB Type-C, 1x HDMI 2.1a, audio multicanal HDMI
Traitement vidéo1x NVENC, 1x NVDEC

Link to this sectionDGX OS#

NVIDIA DGX OS est une distribution Linux personnalisée qui fournit une base de système d'exploitation stable, testée et prise en charge pour exécuter des applications d'IA, d'apprentissage automatique et d'analyse sur les systèmes DGX. Il inclut :

  • Une base Linux robuste optimisée pour les charges de travail IA
  • Des pilotes et paramètres système préconfigurés pour le matériel NVIDIA
  • Des mises à jour de sécurité et des capacités de maintenance système
  • Une compatibilité avec l'écosystème logiciel NVIDIA plus large

DGX OS suit un calendrier de publication régulier avec des mises à jour généralement fournies deux fois par an (autour de février et août), avec des correctifs de sécurité supplémentaires fournis entre les versions majeures.

Link to this sectionTableau de bord DGX#

DGX Spark est livré avec un DGX Dashboard intégré qui fournit :

  • Surveillance système en temps réel : Aperçu des métriques opérationnelles actuelles du système
  • Mises à jour système : Capacité d'appliquer les mises à jour directement depuis le tableau de bord
  • Paramètres système : Modifier le nom de l'appareil et d'autres configurations
  • JupyterLab intégré : Accéder aux notebooks Jupyter locaux pour le développement

NVIDIA DGX management dashboard interface

Link to this sectionAccéder au tableau de bord#

Clique sur le bouton "Show Apps" dans le coin inférieur gauche du bureau Ubuntu, puis sélectionne "DGX Dashboard" pour l'ouvrir dans ton navigateur.

JupyterLab intégré

Le tableau de bord inclut une instance JupyterLab intégrée qui crée automatiquement un environnement virtuel et installe les paquets recommandés lors du démarrage. Chaque compte utilisateur se voit attribuer un port dédié pour l'accès à JupyterLab.

Link to this sectionDémarrage rapide avec Docker#

Le moyen le plus rapide de commencer avec Ultralytics YOLO26 sur NVIDIA DGX Spark est d'exécuter des images Docker pré-construites. La même image Docker qui prend en charge Jetson AGX Thor (JetPack 7.0) fonctionne sur DGX Spark avec DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

Une fois cela fait, passe à la section Utiliser TensorRT sur NVIDIA DGX Spark.

Link to this sectionDémarrer avec une installation native#

Pour une installation native sans Docker, suis ces étapes.

Link to this sectionInstaller le paquet Ultralytics#

Ici, nous allons installer le paquet Ultralytics sur DGX Spark avec les dépendances optionnelles afin de pouvoir exporter les modèles PyTorch vers d'autres formats différents. Nous nous concentrerons principalement sur les exports NVIDIA TensorRT car TensorRT garantira d'obtenir la performance maximale du DGX Spark.

  1. Mettre à jour la liste des paquets, installer pip et passer à la dernière version

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. Installer le paquet pip ultralytics avec les dépendances optionnelles

    pip install ultralytics[export]
  3. Redémarrer l'appareil

    sudo reboot

Link to this sectionInstaller PyTorch et Torchvision#

L'installation d'ultralytics ci-dessus installera Torch et Torchvision. Cependant, ces paquets installés via pip peuvent ne pas être entièrement optimisés pour l'architecture ARM64 du DGX Spark avec CUDA 13. Par conséquent, nous recommandons d'installer les versions compatibles CUDA 13 :

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
Info

Lors de l'exécution de PyTorch 2.9.1 sur NVIDIA DGX Spark, tu peux rencontrer le UserWarning suivant lors de l'initialisation de CUDA (par exemple en exécutant yolo checks, yolo predict, etc.) :

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Cet avertissement peut être ignoré en toute sécurité. Pour résoudre cela de manière permanente, un correctif a été soumis dans la PR PyTorch #164590 qui sera inclus dans la version PyTorch 2.10.

Link to this sectionInstaller onnxruntime-gpu#

Le paquet onnxruntime-gpu hébergé sur PyPI ne possède pas de binaires aarch64 pour les systèmes ARM64. Nous devons donc installer ce paquet manuellement. Ce paquet est nécessaire pour certains des exports.

Ici, nous allons télécharger et installer onnxruntime-gpu 1.24.0 avec le support de Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Link to this sectionUtiliser TensorRT sur NVIDIA DGX Spark#

Parmi tous les formats d'exportation de modèles pris en charge par Ultralytics, TensorRT offre la performance d'inférence la plus élevée sur NVIDIA DGX Spark, ce qui en fait notre recommandation principale pour les déploiements. Pour les instructions de configuration et l'utilisation avancée, consulte notre guide d'intégration TensorRT dédié.

Link to this sectionConvertir le modèle en TensorRT et exécuter l'inférence#

Le modèle YOLO26n au format PyTorch est converti en TensorRT pour exécuter l'inférence avec le modèle exporté.

Exemple
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Remarque

Visite la page d'exportation pour accéder à des arguments supplémentaires lors de l'exportation de modèles vers différents formats de modèles

Link to this sectionBenchmarks NVIDIA DGX Spark YOLO11#

Les benchmarks YOLO11 ont été exécutés par l'équipe Ultralytics sur plusieurs formats de modèles mesurant la vitesse et la précision : PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Les benchmarks ont été exécutés sur NVIDIA DGX Spark à une précision FP32 avec une taille d'image d'entrée par défaut de 640.

Link to this sectionTableau de comparaison détaillé#

Le tableau ci-dessous représente les résultats des benchmarks pour cinq modèles différents (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) à travers plusieurs formats, nous donnant le statut, la taille, la métrique mAP50-95(B) et le temps d'inférence pour chaque combinaison.

Performance
FormatStatutTaille sur le disque (Mo)mAP50-95(B)Temps d'inférence (ms/im)
PyTorch5,40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

Benchmarké avec Ultralytics 8.3.249

Link to this sectionReproduis nos résultats#

Pour reproduire les benchmarks Ultralytics ci-dessus sur tous les formats d'exportation, exécute ce code :

Exemple
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Note que les résultats des benchmarks peuvent varier en fonction de la configuration matérielle et logicielle exacte d'un système, ainsi que de la charge de travail actuelle du système au moment de l'exécution des benchmarks. Pour des résultats plus fiables, utilise un jeu de données avec un grand nombre d'images, par exemple data='coco.yaml' (5000 images de validation).

Link to this sectionMeilleures pratiques pour NVIDIA DGX Spark#

Lorsque tu utilises NVIDIA DGX Spark, il y a quelques meilleures pratiques à suivre pour obtenir des performances maximales avec YOLO26.

  1. Surveille les performances du système

    Utilise les outils de surveillance de NVIDIA pour suivre l'utilisation du GPU et du CPU :

    nvidia-smi
  2. Optimise l'utilisation de la mémoire

    Avec 128 Go de mémoire unifiée, DGX Spark peut gérer des tailles de lot et des modèles importants. Envisage d'augmenter la taille du lot pour améliorer le débit :

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. Utilise TensorRT avec FP16 ou INT8

    Pour de meilleures performances, exporte tes modèles avec une précision FP16 ou INT8 :

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Link to this sectionMises à jour du système (Founders Edition)#

Garder ton système DGX Spark Founders Edition à jour est crucial pour les performances et la sécurité. NVIDIA propose deux méthodes principales pour mettre à jour l'OS du système, les pilotes et le micrologiciel.

Link to this sectionUtiliser le DGX Dashboard (Recommandé)#

Le DGX Dashboard est le moyen recommandé pour effectuer des mises à jour système en garantissant la compatibilité. Il te permet de :

  • Voir les mises à jour système disponibles
  • Installer des correctifs de sécurité et des mises à jour système
  • Gérer les mises à jour des pilotes et du micrologiciel NVIDIA

Link to this sectionMises à jour manuelles du système#

Pour les utilisateurs avancés, les mises à jour peuvent être effectuées manuellement via le terminal :

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
Avertissement

Assure-toi que ton système est connecté à une source d'alimentation stable et que tu as sauvegardé tes données critiques avant d'effectuer les mises à jour.

Link to this sectionÉtapes suivantes#

Pour en savoir plus et obtenir de l'aide, consulte la documentation Ultralytics YOLO26.

Link to this sectionFAQ#

Link to this sectionComment déployer Ultralytics YOLO26 sur NVIDIA DGX Spark ?#

Déployer Ultralytics YOLO26 sur NVIDIA DGX Spark est simple. Tu peux utiliser l'image Docker pré-construite pour une configuration rapide ou installer manuellement les paquets requis. Les étapes détaillées pour chaque approche se trouvent dans les sections Démarrage rapide avec Docker et Démarrer avec une installation native.

Link to this sectionQuelles performances puis-je attendre de YOLO26 sur NVIDIA DGX Spark ?#

Les modèles YOLO26 offrent d'excellentes performances sur DGX Spark grâce à la superpuce GB10 Grace Blackwell. Le format TensorRT fournit les meilleures performances d'inférence. Vérifie la section Tableau comparatif détaillé pour des résultats de benchmark spécifiques selon les différentes tailles et formats de modèles.

Link to this sectionPourquoi devrais-je utiliser TensorRT pour YOLO26 sur DGX Spark ?#

TensorRT est fortement recommandé pour déployer les modèles YOLO26 sur DGX Spark en raison de ses performances optimales. Il accélère l'inférence en exploitant les capacités du GPU Blackwell, garantissant une efficacité et une vitesse maximales. Apprends-en davantage dans la section Utiliser TensorRT sur NVIDIA DGX Spark.

Link to this sectionComment DGX Spark se compare-t-il aux appareils Jetson pour YOLO26 ?#

DGX Spark offre jusqu'à 1 PFLOP de performance IA et 128 Go de mémoire unifiée, par rapport aux 2070 TFLOPS et 128 Go de mémoire du Jetson AGX Thor. DGX Spark est conçu comme un superordinateur IA de bureau, tandis que les appareils Jetson sont des systèmes embarqués optimisés pour le déploiement en périphérie (edge).

Link to this sectionPuis-je utiliser la même image Docker pour DGX Spark et Jetson AGX Thor ?#

Oui ! L'image Docker ultralytics/ultralytics:latest-nvidia-arm64 prend en charge à la fois NVIDIA DGX Spark (avec DGX OS) et Jetson AGX Thor (avec JetPack 7.0), car tous deux utilisent l'architecture ARM64 avec CUDA 13 et des piles logicielles similaires.

Commentaires