Ultralytics YOLO26 sur NVIDIA Jetson avec DeepStream SDK et TensorRT
Watch: How to use Ultralytics YOLO26 models with NVIDIA Deepstream on Jetson Orin NX 🚀
Ce guide complet fournit une procédure détaillée pour déployer Ultralytics YOLO26 sur des appareils NVIDIA Jetson en utilisant DeepStream SDK et TensorRT. Ici, nous utilisons TensorRT pour maximiser les performances d'inférence sur la plateforme Jetson.

Ce guide a été testé avec le NVIDIA Jetson Orin Nano Super Developer Kit exécutant la dernière version stable de JetPack JP6.1, le Seeed Studio reComputer J4012 basé sur NVIDIA Jetson Orin NX 16 Go exécutant la version JetPack JP5.1.3 et le Seeed Studio reComputer J1020 v2 basé sur NVIDIA Jetson Nano 4 Go exécutant la version JetPack JP4.6.4. Il est censé fonctionner sur toute la gamme matérielle NVIDIA Jetson, incluant les modèles récents et anciens.
Qu'est-ce que NVIDIA DeepStream ?
NVIDIA's DeepStream SDK est une boîte à outils complète d'analyse en streaming basée sur GStreamer pour le traitement multi-capteurs par IA, ainsi que pour la compréhension de la vidéo, de l'audio et de l'image. C'est l'outil idéal pour les développeurs en IA vision, les partenaires logiciels, les startups et les OEM concevant des applications et services d'IVA (Intelligent Video Analytics). Tu peux désormais créer des pipelines de traitement de flux intégrant des neural networks et d'autres tâches de traitement complexes comme le suivi, l'encodage/décodage vidéo et le rendu vidéo. Ces pipelines permettent une analyse en temps réel sur des données vidéo, images et capteurs. La prise en charge multi-plateforme de DeepStream te donne un moyen plus rapide et plus facile de développer des applications et services d'IA vision sur site, en périphérie et dans le cloud.
Prérequis
Avant de commencer à suivre ce guide :
- Visite notre documentation, Quick Start Guide: NVIDIA Jetson with Ultralytics YOLO26 pour configurer ton appareil NVIDIA Jetson avec Ultralytics YOLO26
- Installe le DeepStream SDK selon ta version de JetPack
- Pour JetPack 4.6.4, installe DeepStream 6.0.1
- Pour JetPack 5.1.3, installe DeepStream 6.3
- Pour JetPack 6.1, installe DeepStream 7.1
- Pour JetPack 7.1, installe DeepStream 9.0
Dans ce guide, nous avons utilisé la méthode du paquet Debian pour installer DeepStream SDK sur l'appareil Jetson. Tu peux aussi visiter le site DeepStream SDK on Jetson (Archived) pour accéder aux versions antérieures de DeepStream.
Configuration de DeepStream pour YOLO26
Ici, nous utilisons le dépôt GitHub marcoslucianops/DeepStream-Yolo qui inclut la prise en charge de NVIDIA DeepStream SDK pour les modèles YOLO. Nous remercions marcoslucianops pour ses contributions !
-
Installe Ultralytics avec les dépendances nécessaires
cd ~ pip install -U pip git clone https://github.com/ultralytics/ultralytics cd ultralytics pip install -e ".[export]" onnxslim -
Clone le dépôt DeepStream-Yolo
cd ~ git clone https://github.com/marcoslucianops/DeepStream-Yolo -
Copie le fichier
export_yolo26.pydu répertoireDeepStream-Yolo/utilsvers le dossierultralyticscp ~/DeepStream-Yolo/utils/export_yolo26.py ~/ultralytics cd ultralytics -
Télécharge le modèle de détection Ultralytics YOLO26 (.pt) de ton choix depuis les YOLO26 releases. Ici, nous utilisons yolo26s.pt.
wget https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26s.pt
Tu peux aussi utiliser un custom-trained YOLO26 model.
-
Convertis le modèle en ONNX
python3 export_yolo26.py -w yolo26s.pt
Pour DeepStream 5.1, supprime l'argument --dynamic et utilise opset 12 ou inférieur. Le opset par défaut est 17.
--opset 12Pour modifier la taille d'inférence (par défaut : 640)
-s SIZE
--size SIZE
-s HEIGHT WIDTH
--size HEIGHT WIDTHExemple pour 1280 :
-s 1280
or
-s 1280 1280Pour simplifier le modèle ONNX (DeepStream >= 6.0)
--simplifyPour utiliser une taille de lot dynamique (DeepStream >= 6.1)
--dynamicPour utiliser une taille de lot statique (exemple pour une taille de lot = 4)
--batch 4-
Copie le fichier de modèle
.onnxgénéré et le fichierlabels.txtdans le dossierDeepStream-Yolocp yolo26s.pt.onnx labels.txt ~/DeepStream-Yolo cd ~/DeepStream-Yolo -
Définit la version de CUDA selon la version de JetPack installée
Pour JetPack 4.6.4 :
export CUDA_VER=10.2Pour JetPack 5.1.3 :
export CUDA_VER=11.4Pour JetPack 6.1 :
export CUDA_VER=12.6 -
Compile la bibliothèque
make -C nvdsinfer_custom_impl_Yolo clean && make -C nvdsinfer_custom_impl_Yolo -
Modifie le fichier
config_infer_primary_yolo26.txtselon ton modèle (pour YOLO26s avec 80 classes)[property] ... onnx-file=yolo26s.pt.onnx ... num-detected-classes=80 ... -
Modifie le fichier
deepstream_app_config... [primary-gie] ... config-file=config_infer_primary_yolo26.txt -
Tu peux également changer la source vidéo dans le fichier
deepstream_app_config. Ici, un fichier vidéo par défaut est chargé... [source0] ... uri=file:///opt/nvidia/deepstream/deepstream/samples/streams/sample_1080p_h264.mp4
Exécute l'inférence
deepstream-app -c deepstream_app_config.txtIl faudra un certain temps pour générer le fichier moteur TensorRT avant de démarrer l'inférence. Sois donc patient.

Si tu veux convertir le modèle en précision FP16, règle simplement model-engine-file=model_b1_gpu0_fp16.engine et network-mode=2 dans config_infer_primary_yolo26.txt
Calibrage INT8
Si tu souhaites utiliser la précision INT8 pour l'inférence, tu dois suivre les étapes ci-dessous :
Actuellement, INT8 ne fonctionne pas avec TensorRT 10.x. Cette section du guide a été testée avec TensorRT 8.x, avec lequel cela devrait fonctionner.
-
Définit la variable d'environnement
OPENCVexport OPENCV=1 -
Compile la bibliothèque
make -C nvdsinfer_custom_impl_Yolo clean && make -C nvdsinfer_custom_impl_Yolo -
Pour le dataset COCO, télécharge le val2017, extrais-le et déplace-le vers le dossier
DeepStream-Yolo -
Crée un nouveau répertoire pour les images de calibrage
mkdir calibration -
Exécute ce qui suit pour sélectionner 1000 images aléatoires du dataset COCO afin d'effectuer le calibrage
for jpg in $(ls -1 val2017/*.jpg | sort -R | head -1000); do cp ${jpg} calibration/ done
NVIDIA recommande au moins 500 images pour obtenir une bonne accuracy. Dans cet exemple, 1000 images sont choisies pour obtenir une meilleure précision (plus d'images = plus de précision). Tu peux le régler via head -1000. Par exemple, pour 2000 images, utilise head -2000. Ce processus peut prendre beaucoup de temps.
-
Crée le fichier
calibration.txtavec toutes les images sélectionnéesrealpath calibration/*jpg > calibration.txt -
Définit les variables d'environnement
export INT8_CALIB_IMG_PATH=calibration.txt export INT8_CALIB_BATCH_SIZE=1
Des valeurs INT8_CALIB_BATCH_SIZE plus élevées entraîneront une plus grande précision et une vitesse de calibrage plus rapide. Règle-les en fonction de la mémoire de ton GPU.
-
Mets à jour le fichier
config_infer_primary_yolo26.txtDe
... model-engine-file=model_b1_gpu0_fp32.engine #int8-calib-file=calib.table ... network-mode=0 ...À
... model-engine-file=model_b1_gpu0_int8.engine int8-calib-file=calib.table ... network-mode=1 ...
Exécute l'inférence
deepstream-app -c deepstream_app_config.txtConfiguration MultiStream
Watch: How to Run Multi-Stream Inference with Ultralytics YOLO26 using NVIDIA DeepStream on Jetson Orin 🚀
Pour configurer plusieurs flux sous une seule application DeepStream, effectue les modifications suivantes dans le fichier deepstream_app_config.txt :
-
Modifie les lignes et les colonnes pour construire un affichage en grille selon le nombre de flux que tu souhaites avoir. Par exemple, pour 4 flux, nous pouvons ajouter 2 lignes et 2 colonnes.
[tiled-display] rows=2 columns=2 -
Définit
num-sources=4et ajoute les entréesuripour les quatre flux.[source0] enable=1 type=3 uri=path/to/video1.jpg uri=path/to/video2.jpg uri=path/to/video3.jpg uri=path/to/video4.jpg num-sources=4
Exécute l'inférence
deepstream-app -c deepstream_app_config.txt
Résultats des tests de performance
Les tests de performance suivants résument les performances des modèles YOLO26 à différents niveaux de précision TensorRT avec une taille d'entrée de 640x640 sur NVIDIA Jetson Orin NX 16 Go.
Tableau comparatif

Tableau de comparaison détaillé
| Format | Statut | Temps d'inférence (ms/im) |
|---|---|---|
| TensorRT (FP32) | ✅ | 8.64 |
| TensorRT (FP16) | ✅ | 5.27 |
| TensorRT (INT8) | ✅ | 4.54 |
Remerciements
Ce guide a été initialement créé par nos amis de Seeed Studio, Lakshantha et Elaine.
FAQ
Comment configurer Ultralytics YOLO26 sur un appareil NVIDIA Jetson ?
Pour configurer Ultralytics YOLO26 sur un appareil NVIDIA Jetson, tu dois d'abord installer le DeepStream SDK compatible avec ta version de JetPack. Suis le guide étape par étape dans notre Quick Start Guide pour configurer ton NVIDIA Jetson pour le déploiement de YOLO26.
Quel est l'avantage d'utiliser TensorRT avec YOLO26 sur NVIDIA Jetson ?
Utiliser TensorRT avec YOLO26 optimise le modèle pour l'inférence, réduisant considérablement la latence et améliorant le débit sur les appareils NVIDIA Jetson. TensorRT fournit une inférence deep learning haute performance et à faible latence grâce à la fusion de couches, au calibrage de précision et à l'auto-réglage du noyau. Cela conduit à une exécution plus rapide et plus efficace, particulièrement utile pour les applications en temps réel comme l'analyse vidéo et les machines autonomes.
Puis-je exécuter Ultralytics YOLO26 avec DeepStream SDK sur différents matériels NVIDIA Jetson ?
Oui, le guide pour déployer Ultralytics YOLO26 avec le DeepStream SDK et TensorRT est compatible avec toute la gamme NVIDIA Jetson. Cela inclut des appareils comme le Jetson Orin NX 16 Go avec JetPack 5.1.3 et le Jetson Nano 4 Go avec JetPack 4.6.4. Reporte-toi à la section DeepStream Configuration for YOLO26 pour des étapes détaillées.
Comment puis-je convertir un modèle YOLO26 en ONNX pour DeepStream ?
Pour convertir un modèle YOLO26 au format ONNX en vue d'un déploiement avec DeepStream, utilise le script utils/export_yolo26.py du dépôt DeepStream-Yolo.
Voici un exemple de commande :
python3 utils/export_yolo26.py -w yolo26s.pt --opset 12 --simplifyPour plus de détails sur la conversion de modèles, consulte notre model export section.
Quels sont les tests de performance pour YOLO sur NVIDIA Jetson Orin NX ?
Les performances des modèles YOLO26 sur NVIDIA Jetson Orin NX 16 Go varient en fonction des niveaux de précision TensorRT. Par exemple, les modèles YOLO26s atteignent :
- Précision FP32 : 14,6 ms/im, 68,5 FPS
- Précision FP16 : 7,94 ms/im, 126 FPS
- Précision INT8 : 5,95 ms/im, 168 FPS
Ces tests soulignent l'efficacité et les capacités de l'utilisation de modèles YOLO26 optimisés par TensorRT sur le matériel NVIDIA Jetson. Pour plus de détails, consulte notre section Benchmark Results.