Guida rapida: NVIDIA Jetson con Ultralytics YOLOv8

Q: How can I install PyTorch and Torchvision on NVIDIA Jetson?

Per installare PyTorch e Torchvision su NVIDIA Jetson, disinstalla innanzitutto tutte le versioni esistenti che possono essere state installate tramite pip. Quindi, installa manualmente le versioni di PyTorch e Torchvision compatibili con l'architettura ARM64 di Jetson. Le istruzioni dettagliate per questo processo sono riportate nella sezione Installare PyTorch e Torchvision.

Q: What are the best practices for maximizing performance on NVIDIA Jetson when using YOLOv8?

Per massimizzare le prestazioni di NVIDIA Jetson con YOLOv8, segui queste buone pratiche: Per i comandi e ulteriori dettagli, consulta la sezione "Migliori pratiche nell'utilizzo di NVIDIA Jetson".

Questa guida completa fornisce una guida dettagliata per l'implementazione di Ultralytics YOLOv8 sui dispositivi NVIDIA Jetson. Inoltre, mostra i benchmark delle prestazioni per dimostrare le capacità di YOLOv8 su questi piccoli e potenti dispositivi.

Guarda: Come configurare NVIDIA Jetson con Ultralytics YOLOv8

NVIDIA Ecosistema Jetson

Nota

Questa guida è stata testata sia con Seeed Studio reComputer J4012, basato su NVIDIA Jetson Orin NX 16GB con l'ultima versione stabile di JetPack JP5.1.3, sia con Seeed Studio reComputer J1020 v2, basato su NVIDIA Jetson Nano 4GB con la versione di JetPack JP4.6.1. Si prevede che funzionerà su tutta la gamma di hardware NVIDIA Jetson, compresi quelli più recenti e quelli legacy.

Cos'è NVIDIA Jetson?

NVIDIA Jetson è una serie di schede di calcolo embedded progettate per portare l'AI (intelligenza artificiale) accelerata sui dispositivi edge. Questi dispositivi compatti e potenti sono costruiti attorno all'architettura GPU di NVIDIA e sono in grado di eseguire complessi algoritmi di AI e modelli di deep learning direttamente sul dispositivo, senza dover ricorrere a risorse di cloud computing. Le schede Jetson sono spesso utilizzate nella robotica, nei veicoli autonomi, nell'automazione industriale e in altre applicazioni in cui l'inferenza dell'intelligenza artificiale deve essere eseguita localmente con bassa latenza ed elevata efficienza. Inoltre, queste schede sono basate sull'architettura ARM64 e consumano meno rispetto ai tradizionali dispositivi di calcolo GPU .

NVIDIA Confronto tra le serie Jetson

Jetson Orin è l'ultima iterazione della famiglia NVIDIA Jetson basata sull'architettura NVIDIA Ampere, che offre prestazioni AI drasticamente migliorate rispetto alle generazioni precedenti. La tabella seguente mette a confronto alcuni dei dispositivi Jetson presenti nell'ecosistema.

	Jetson AGX Orin 64GB	Jetson Orin NX 16GB	Jetson Orin Nano 8GB	Jetson AGX Xavier	Jetson Xavier NX	Jetson Nano
Prestazioni AI	275 TOPS	100 TOPS	40 TOP	32 TOPS	21 TOPS	472 GFLOPS
GPU	2048-core NVIDIA Architettura Ampere GPU con 64 Tensor core	1024 core NVIDIA Architettura ad Ampere GPU con 32 core Tensor	1024 core NVIDIA Architettura ad Ampere GPU con 32 core Tensor	512 core NVIDIA Architettura Volta GPU con 64 core Tensor	384 core NVIDIA Architettura Volta™ GPU con 48 Tensor core	128 core NVIDIA Architettura Maxwell GPU
GPU Frequenza massima	1,3 GHz	918 MHz	625 MHz	1377 MHz	1100 MHz	921MHz
CPU	12-core NVIDIA Arm® Cortex A78AE v8.2 64-bit CPU 3MB L2 + 6MB L3	8-core NVIDIA Arm® Cortex A78AE v8.2 64-bit CPU 2MB L2 + 4MB L3	6-core Arm® Cortex®-A78AE v8.2 64-bit CPU 1.5MB L2 + 4MB L3	8-core NVIDIA Carmel Arm®v8.2 64-bit CPU 8MB L2 + 4MB L3	6-core NVIDIA Carmel Arm®v8.2 64-bit CPU 6MB L2 + 4MB L3	Processore Quad-Core Arm® Cortex®-A57 MPCore
CPU Frequenza massima	2,2 GHz	2,0 GHz	1,5 GHz	2,2 GHz	1,9 GHz	1.43GHz
Memoria	64GB 256-bit LPDDR5 204.8GB/s	16GB 128-bit LPDDR5 102,4GB/s	8GB 128-bit LPDDR5 68 GB/s	32GB 256-bit LPDDR4x 136.5GB/s	8GB 128-bit LPDDR4x 59,7GB/s	4GB 64-bit LPDDR4 25.6GB/s"

Per una tabella comparativa più dettagliata, visita la sezione Specifiche tecniche della pagina ufficiale di NVIDIA Jetson.

Cos'è NVIDIA JetPack?

NVIDIA L' SDK JetPack che alimenta i moduli Jetson è la soluzione più completa e fornisce un ambiente di sviluppo completo per la creazione di applicazioni AI accelerate end-to-end e riduce i tempi di commercializzazione. JetPack include Jetson Linux con bootloader, kernel Linux, ambiente desktop Ubuntu e un set completo di librerie per l'accelerazione di GPU computing, multimedia, grafica e computer vision. Include anche esempi, documentazione e strumenti per sviluppatori sia per il computer host che per il kit di sviluppo e supporta SDK di livello superiore come DeepStream per l'analisi video in streaming, Isaac per la robotica e Riva per l'IA conversazionale.

Flash JetPack su NVIDIA Jetson

Il primo passo da compiere dopo aver messo le mani su un dispositivo NVIDIA Jetson è quello di flashare NVIDIA JetPack sul dispositivo. Esistono diversi modi per flashare i dispositivi NVIDIA Jetson.

Se possiedi un kit di sviluppo ufficiale NVIDIA , come il Jetson Orin Nano Developer Kit, puoi scaricare un'immagine e preparare una scheda SD con JetPack per avviare il dispositivo.
Se possiedi un altro kit di sviluppo NVIDIA , puoi flashare JetPack sul dispositivo utilizzando SDK Manager.
Se possiedi un dispositivo Seeed Studio reComputer J4012, puoi flashare JetPack sull'SSD incluso e se possiedi un dispositivo Seeed Studio reComputer J1020 v2, puoi flashare JetPack sull'eMMC/SSD.
Se possiedi un altro dispositivo di terze parti alimentato dal modulo NVIDIA Jetson, ti consigliamo di seguire il flashing da riga di comando.

Nota

Per i metodi 3 e 4, dopo aver flashato il sistema e avviato il dispositivo, inserisci "sudo apt update && sudo apt install nvidia-jetpack -y" sul terminale del dispositivo per installare tutti i restanti componenti di JetPack necessari.

Esegui su JetPack 5.x

Se possiedi un Jetson Xavier NX, AGX Xavier, AGX Orin, Orin Nano o Orin NX che supporta JetPack 5.x, puoi continuare a seguire questa guida. Se invece possiedi un dispositivo legacy come Jetson Nano, passa a Esegui su JetPack 4.x.

Configurazione Ultralytics

Esistono due modi per impostare il pacchetto Ultralytics su NVIDIA Jetson per realizzare il tuo prossimo progetto di Computer Vision. Puoi utilizzare uno di questi due metodi.

Iniziare con Docker
Iniziare senza Docker

Iniziare con Docker

Il modo più veloce per iniziare a utilizzare Ultralytics YOLOv8 su NVIDIA Jetson è quello di eseguire un'immagine docker precostituita per Jetson.

Esegui il comando seguente per estrarre il contenitore Docker ed eseguirlo su Jetson. Questo è basato sull'immagine docker l4t-pytorch che contiene PyTorch e Torchvision in un ambiente Python3.

t=ultralytics/ultralytics:latest-jetson-jetpack5 && sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia $t

Dopo aver fatto ciò, passa alla sezione Utilizzare TensorRT su NVIDIA Jetson.

Iniziare senza Docker

Installa il pacchetto Ultralytics

Qui installeremo il pacchetto Ultralytics su Jetson con le dipendenze opzionali in modo da poter esportare i modelli PyTorch in altri formati diversi. Ci concentreremo principalmente sulle esportazioni diNVIDIA TensorRT perché TensorRT ci permetterà di ottenere le massime prestazioni dai dispositivi Jetson.

Aggiornare l'elenco dei pacchetti, installare pip e passare all'ultimo aggiornamento
```
sudo apt update
sudo apt install python3-pip -y
pip install -U pip
```
Installa ultralytics pacchetto pip con dipendenze opzionali
```
pip install ultralytics[export]
```
Riavvia il dispositivo
```
sudo reboot
```

Installa PyTorch e Torchvision

L'installazione di ultralytics di cui sopra installerà Torch e Torchvision. Tuttavia, questi due pacchetti installati tramite pip non sono compatibili con la piattaforma Jetson, basata su architettura ARM64. Pertanto, dobbiamo installare manualmente PyTorch pip wheel e compilare/installare Torchvision dai sorgenti.

Disinstalla i siti PyTorch e Torchvision attualmente installati
```
pip uninstall torch torchvision
```

Installa PyTorch 2.1.0 come da JP5.1.3

sudo apt-get install -y libopenblas-base libopenmpi-dev
wget https://developer.download.nvidia.com/compute/redist/jp/v512/pytorch/torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl -O torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl
pip install torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl

Installa Torchvision v0.16.2 secondo PyTorch v2.1.0

sudo apt install -y libjpeg-dev zlib1g-dev
git clone https://github.com/pytorch/vision torchvision
cd torchvision
git checkout v0.16.2
python3 setup.py install --user

Visita la paginaPyTorch per Jetson per accedere a tutte le versioni di PyTorch per le diverse versioni di JetPack. Per un elenco più dettagliato della compatibilità di PyTorch e Torchvision, visita la paginaPyTorch e Torchvision.

Installa `onnxruntime-gpu`

Il onnxruntime-gpu il pacchetto ospitato su PyPI non ha aarch64 per Jetson. Quindi dobbiamo installare manualmente questo pacchetto. Questo pacchetto è necessario per alcune esportazioni.

Tutti diversi onnxruntime-gpu I pacchetti corrispondenti alle diverse versioni di JetPack e Python sono elencati qui. Tuttavia, qui scaricheremo e installeremo onnxruntime-gpu 1.17.0 con Python3.8 supporto per il JetPack che stiamo utilizzando per questa guida.

wget https://nvidia.box.com/shared/static/zostg6agm00fb6t5uisw51qi6kpcuwzd.whl -O onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
pip install onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl

Nota

onnxruntime-gpu riporterà automaticamente la versione di numpy all'ultima. Quindi è necessario reinstallare numpy su 1.23.5 per risolvere un problema eseguendo:

pip install numpy==1.23.5

Esegui su JetPack 4.x

Qui supportiamo l'esecuzione Ultralytics su hardware legacy come il Jetson Nano. Attualmente usiamo Docker per raggiungere questo obiettivo.

Esegui il comando seguente per estrarre il contenitore Docker ed eseguirlo su Jetson. Questo è basato sull'immagine docker l4t-cuda che contiene CUDA in un ambiente L4T.

t=ultralytics/ultralytics:latest-jetson-jetpack4 && sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia $t

Usa TensorRT su NVIDIA Jetson

Tra tutti i formati di esportazione dei modelli supportati da Ultralytics, TensorRT offre le migliori prestazioni di inferenza quando si lavora con dispositivi NVIDIA Jetson e il nostro consiglio è di utilizzare TensorRT con Jetson. Abbiamo anche un documento dettagliato su TensorRT qui.

Convertire il modello in TensorRT ed eseguire l'inferenza

Il modello YOLOv8n in formato PyTorch viene convertito in TensorRT per eseguire l'inferenza con il modello esportato.

Esempio

PythonCLI

from ultralytics import YOLO

# Load a YOLOv8n PyTorch model
model = YOLO("yolov8n.pt")

# Export the model
model.export(format="engine")  # creates 'yolov8n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolov8n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")

# Export a YOLOv8n PyTorch model to TensorRT format
yolo export model=yolov8n.pt format=engine  # creates 'yolov8n.engine'

# Run inference with the exported model
yolo predict model=yolov8n.engine source='https://ultralytics.com/images/bus.jpg'

Nota

Visita la pagina Esportazione per accedere ad argomenti aggiuntivi per l'esportazione di modelli in diversi formati.

NVIDIA Benchmark di Jetson Orin YOLOv8

YOLOv8 parametri di riferimento sono stati gestiti dal Ultralytics Team su 10 diversi formati di modelli che misurano velocità e precisione: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite PaddlePaddle, NCNN. I benchmark sono stati eseguiti su Seeed Studio reComputer J4012 alimentato dal dispositivo Jetson Orin NX da 16 GB con precisione FP32 con una dimensione predefinita dell'immagine di input di 640.

Tabella di confronto

Anche se tutti i modelli di esportazione funzionano con NVIDIA Jetson, abbiamo incluso solo PyTorch, TorchScript, TensorRT nella tabella di confronto qui sotto perché utilizzano GPU su Jetson e garantiscono i migliori risultati. Tutte le altre esportazioni utilizzano solo CPU e le prestazioni non sono così buone come le tre precedenti. Puoi trovare i benchmark di tutte le esportazioni nella sezione successiva a questo grafico.

Tabella comparativa dettagliata

La tabella seguente rappresenta i risultati dei benchmark per cinque diversi modelli (YOLOv8n, YOLOv8s, YOLOv8m, YOLOv8l, YOLOv8x) in dieci formati diversi (PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite PaddlePaddle, NCNN), fornendoci lo stato, le dimensioni, la metrica mAP50-95(B) e il tempo di inferenza per ogni combinazione.

Prestazioni

YOLOv8nYOLOv8sYOLOv8mYOLOv8lYOLOv8x

Formato	Stato	Dimensione su disco (MB)	mAP50-95(B)	Tempo di inferenza (ms/im)
PyTorch	✅	6.2	0.6381	14.3
TorchScript	✅	12.4	0.6117	13.3
ONNX	✅	12.2	0.6092	70.6
OpenVINO	✅	12.3	0.6092	104.2
TensorRT	✅	13.6	0.6117	8.9
TF SavedModel	✅	30.6	0.6092	141.74
TF GraphDef	✅	12.3	0.6092	199.93
TF Lite	✅	12.3	0.6092	349.18
PaddlePaddle	✅	24.4	0.6030	555
NCNN	✅	12.2	0.6092	32

Formato	Stato	Dimensione su disco (MB)	mAP50-95(B)	Tempo di inferenza (ms/im)
PyTorch	✅	21.5	0.6967	18
TorchScript	✅	43.0	0.7136	23.81
ONNX	✅	42.8	0.7136	185.55
OpenVINO	✅	42.9	0.7136	243.97
TensorRT	✅	44.0	0.7136	14.82
TF SavedModel	✅	107	0.7136	260.03
TF GraphDef	✅	42.8	0.7136	423.4
TF Lite	✅	42.8	0.7136	1046.64
PaddlePaddle	✅	85.5	0.7140	1464
NCNN	✅	42.7	0.7200	63

Formato	Stato	Dimensione su disco (MB)	mAP50-95(B)	Tempo di inferenza (ms/im)
PyTorch	✅	49.7	0.7370	36.4
TorchScript	✅	99.2	0.7285	53.58
ONNX	✅	99	0.7280	452.09
OpenVINO	✅	99.1	0.7280	544.36
TensorRT	✅	100.3	0.7285	33.21
TF SavedModel	✅	247.5	0.7280	543.65
TF GraphDef	✅	99	0.7280	906.63
TF Lite	✅	99	0.7280	2758.08
PaddlePaddle	✅	197.9	0.7280	3678
NCNN	✅	98.9	0.7260	135

Formato	Stato	Dimensione su disco (MB)	mAP50-95(B)	Tempo di inferenza (ms/im)
PyTorch	✅	83.7	0.7768	61.3
TorchScript	✅	167.2	0.7554	87.9
ONNX	✅	166.8	0.7551	852.29
OpenVINO	✅	167	0.7551	1012.6
TensorRT	✅	168.4	0.7554	51.23
TF SavedModel	✅	417.2	0.7551	990.45
TF GraphDef	✅	166.9	0.7551	1649.86
TF Lite	✅	166.9	0.7551	5652.37
PaddlePaddle	✅	333.6	0.7551	7114.67
NCNN	✅	166.8	0.7685	231.9

Formato	Stato	Dimensione su disco (MB)	mAP50-95(B)	Tempo di inferenza (ms/im)
PyTorch	✅	130.5	0.7759	93
TorchScript	✅	260.7	0.7472	135.1
ONNX	✅	260.4	0.7479	1296.13
OpenVINO	✅	260.6	0.7479	1502.15
TensorRT	✅	261.8	0.7469	84.53
TF SavedModel	✅	651.1	0.7479	1451.76
TF GraphDef	✅	260.5	0.7479	4029.36
TF Lite	✅	260.4	0.7479	8772.86
PaddlePaddle	✅	520.8	0.7479	10619.53
NCNN	✅	260.4	0.7646	376.38

Esplora altri benchmark effettuati da Seeed Studio su diverse versioni di hardware NVIDIA Jetson.

Riprodurre i nostri risultati

Per riprodurre i benchmark di Ultralytics su tutti i formati di esportazione, esegui questo codice:

Esempio

PythonCLI

from ultralytics import YOLO

# Load a YOLOv8n PyTorch model
model = YOLO("yolov8n.pt")

# Benchmark YOLOv8n speed and accuracy on the COCO8 dataset for all all export formats
results = model.benchmarks(data="coco8.yaml", imgsz=640)

# Benchmark YOLOv8n speed and accuracy on the COCO8 dataset for all all export formats
yolo benchmark model=yolov8n.pt data=coco8.yaml imgsz=640

Si noti che i risultati dei benchmark possono variare in base all'esatta configurazione hardware e software di un sistema, nonché al carico di lavoro corrente del sistema al momento dell'esecuzione dei benchmark. Per ottenere i risultati più affidabili, usa un set di dati con un gran numero di immagini, ad es. data='coco8.yaml' (4 val images), ordata='coco.yaml'` (5000 immagini val).

Migliori pratiche per l'utilizzo di NVIDIA Jetson

Quando si utilizza NVIDIA Jetson, ci sono un paio di buone pratiche da seguire per ottenere le massime prestazioni su NVIDIA Jetson che esegue YOLOv8.

Abilita la modalità MAX Power

Abilitando la modalità MAX Power su Jetson, tutti i core CPU, GPU saranno attivati.
```
sudo nvpmodel -m 0
```
Abilita gli orologi Jetson

Abilitando Jetson Clocks, tutti i core di CPU, GPU saranno clockati alla loro frequenza massima.
```
sudo jetson_clocks
```
Installa l'applicazione Jetson Stats

Possiamo utilizzare l'applicazione jetson stats per monitorare le temperature dei componenti del sistema e controllare altri dettagli del sistema, come ad esempio visualizzare CPU, GPU, l'utilizzo della RAM, cambiare le modalità di alimentazione, impostare i clock massimi, controllare le informazioni di JetPack.
```
sudo apt update
sudo pip install jetson-stats
sudo reboot
jtop
```

Statistiche Jetson

I prossimi passi

Congratulazioni per aver configurato con successo YOLOv8 sul tuo NVIDIA Jetson! Per ulteriori informazioni e supporto, visita la guida Ultralytics YOLOv8 Docs!

DOMANDE FREQUENTI

Come faccio a distribuire Ultralytics YOLOv8 sui dispositivi NVIDIA Jetson?

Distribuire Ultralytics YOLOv8 sui dispositivi NVIDIA Jetson è un processo semplice. Per prima cosa, flasha il tuo dispositivo Jetson con l'SDK NVIDIA JetPack. Quindi, utilizza un'immagine Docker precostituita per una rapida configurazione oppure installa manualmente i pacchetti necessari. I passaggi dettagliati per ciascun approccio sono riportati nelle sezioni Iniziare con Docker e Iniziare senza Docker.

Quali benchmark di prestazioni posso aspettarmi dai modelli YOLOv8 sui dispositivi NVIDIA Jetson?

YOLOv8 sono stati sottoposti a benchmark su vari dispositivi NVIDIA Jetson, mostrando miglioramenti significativi delle prestazioni. Ad esempio, il formato TensorRT offre le migliori prestazioni di inferenza. La tabella nella sezione Tabella di confronto dettagliata fornisce una visione completa delle metriche di prestazione come mAP50-95 e tempo di inferenza tra i diversi formati di modello.

Perché dovrei usare TensorRT per distribuire YOLOv8 su NVIDIA Jetson?

TensorRT è altamente raccomandato per l'implementazione di modelli YOLOv8 su NVIDIA Jetson grazie alle sue prestazioni ottimali. Accelera l'inferenza sfruttando le capacità di GPU Jetson, garantendo la massima efficienza e velocità. Per saperne di più su come convertire TensorRT ed eseguire l'inferenza, consulta la sezione Utilizzare TensorRT su NVIDIA Jetson.

Come posso installare PyTorch e Torchvision su NVIDIA Jetson?

Per installare PyTorch e Torchvision su NVIDIA Jetson, per prima cosa disinstalla tutte le versioni esistenti che possono essere state installate tramite pip. Quindi, installa manualmente le versioni di PyTorch e Torchvision compatibili con l'architettura ARM64 di Jetson. Le istruzioni dettagliate per questo processo sono riportate nella sezione Installare PyTorch e Torchvision.

Quali sono le migliori pratiche per massimizzare le prestazioni su NVIDIA Jetson quando si utilizza YOLOv8?

Per massimizzare le prestazioni su NVIDIA Jetson con YOLOv8, segui queste best practice:

Abilita la modalità MAX Power per utilizzare tutti i core di CPU e GPU .
Abilita i clock di Jetson per far funzionare tutti i core alla loro frequenza massima.
Installa l'applicazione Jetson Stats per monitorare le metriche del sistema.

Per i comandi e per ulteriori dettagli, consulta la sezione " Migliori pratiche per l'utilizzo di NVIDIA Jetson".

Creato 2024-04-02, Aggiornato 2024-07-05
Autori: glenn-jocher (9), RizwanMunawar (1), lakshanthad (3), Ahelsamahy (1), Burhan-Q (2)

Guida rapida: NVIDIA Jetson con Ultralytics YOLOv8

Cos'è NVIDIA Jetson?

NVIDIA Confronto tra le serie Jetson

Cos'è NVIDIA JetPack?

Flash JetPack su NVIDIA Jetson

Esegui su JetPack 5.x

Configurazione Ultralytics

Iniziare con Docker

Iniziare senza Docker

Installa il pacchetto Ultralytics

Installa PyTorch e Torchvision

Installa onnxruntime-gpu

Esegui su JetPack 4.x

Usa TensorRT su NVIDIA Jetson

Convertire il modello in TensorRT ed eseguire l'inferenza

NVIDIA Benchmark di Jetson Orin YOLOv8

Tabella di confronto

Tabella comparativa dettagliata

Riprodurre i nostri risultati

Migliori pratiche per l'utilizzo di NVIDIA Jetson

I prossimi passi

DOMANDE FREQUENTI

Come faccio a distribuire Ultralytics YOLOv8 sui dispositivi NVIDIA Jetson?

Quali benchmark di prestazioni posso aspettarmi dai modelli YOLOv8 sui dispositivi NVIDIA Jetson?

Perché dovrei usare TensorRT per distribuire YOLOv8 su NVIDIA Jetson?

Come posso installare PyTorch e Torchvision su NVIDIA Jetson?

Quali sono le migliori pratiche per massimizzare le prestazioni su NVIDIA Jetson quando si utilizza YOLOv8?

Commenti

Installa `onnxruntime-gpu`