Guía de inicio rápido: NVIDIA Jetson con Ultralytics YOLO11
Esta completa guía ofrece un recorrido detallado para implantar Ultralytics YOLO11 en los dispositivos NVIDIA Jetson. Además, presenta pruebas de rendimiento para demostrar las capacidades de YOLO11 en estos pequeños y potentes dispositivos.
New product support
We have updated this guide with the latest NVIDIA Jetson Orin Nano Super Developer Kit which delivers up to 67 TOPS of AI performance — a 1.7X improvement over its predecessor — to seamlessly run the most popular AI models.
Observa: Cómo configurar NVIDIA Jetson con Ultralytics YOLO11
Nota
This guide has been tested with NVIDIA Jetson Orin Nano Super Developer Kit running the latest stable JetPack release of JP6.1, Seeed Studio reComputer J4012 which is based on NVIDIA Jetson Orin NX 16GB running JetPack release of JP6.0/ JetPack release of JP5.1.3 and Seeed Studio reComputer J1020 v2 which is based on NVIDIA Jetson Nano 4GB running JetPack release of JP4.6.1. It is expected to work across all the NVIDIA Jetson hardware lineup including latest and legacy.
¿Qué es NVIDIA Jetson?
NVIDIA Jetson es una serie de placas de computación integradas diseñadas para llevar la computación acelerada de IA (inteligencia artificial) a los dispositivos periféricos. Estos dispositivos compactos y potentes se basan en la arquitectura GPU de NVIDIA y son capaces de ejecutar complejos algoritmos de IA y modelos de aprendizaje profundo directamente en el dispositivo, sin necesidad de depender de recursos de computación en la nube. Las placas Jetson se utilizan a menudo en robótica, vehículos autónomos, automatización industrial y otras aplicaciones en las que la inferencia de IA debe realizarse localmente con baja latencia y alta eficiencia. Además, estas placas se basan en la arquitectura ARM64 y consumen menos energía que los dispositivos informáticos tradicionales GPU .
NVIDIA Comparación de la serie Jetson
Jetson Orin es la última iteración de la familia Jetson NVIDIA basada en la arquitectura NVIDIA Ampere que aporta un rendimiento de IA drásticamente mejorado en comparación con las generaciones anteriores. En la tabla siguiente se comparan algunos de los dispositivos Jetson del ecosistema.
Jetson AGX Orin 64 GB | Jetson Orin NX 16 GB | Jetson Orin Nano Super | Jetson AGX Xavier | Jetson Xavier NX | Jetson Nano | |
---|---|---|---|---|---|---|
Rendimiento de la IA | 275 TOPS | 100 TOPS | 67 TOPs | 32 TOPS | 21 TOPS | 472 GFLOPS |
GPU | 2048 núcleos NVIDIA Arquitectura Ampere GPU con 64 Tensor Núcleos | 1024 núcleos NVIDIA Arquitectura Ampere GPU con 32 Tensor Núcleos | 1024 núcleos NVIDIA Arquitectura Ampere GPU con 32 Tensor Núcleos | Arquitectura Volta de 512 núcleos NVIDIA GPU con 64 núcleos Tensor | Arquitectura NVIDIA Volta™ de 384 núcleos GPU con 48 Tensor Cores | Arquitectura Maxwell™ de 128 núcleos NVIDIA GPU |
GPU Frecuencia máxima | 1,3 GHz | 918 MHz | 1020 MHz | 1377 MHz | 1100 MHz | 921 MHz |
CPU | 12 núcleos NVIDIA Arm® Cortex A78AE v8.2 64 bits CPU 3MB L2 + 6MB L3 | 8 núcleos NVIDIA Arm® Cortex A78AE v8.2 64 bits CPU 2MB L2 + 4MB L3 | 6 núcleos Arm® Cortex®-A78AE v8.2 64 bits CPU 1,5 MB L2 + 4 MB L3 | 8 núcleos NVIDIA Carmel Arm®v8.2 64 bits CPU 8 MB L2 + 4 MB L3 | 6 núcleos NVIDIA Carmel Arm®v8.2 64 bits CPU 6 MB L2 + 4 MB L3 | Procesador MPCore Arm® Cortex®-A57 de cuatro núcleos |
CPU Frecuencia máxima | 2,2 GHz | 2,0 GHz | 1.7 GHz | 2,2 GHz | 1,9 GHz | 1,43 GHz |
Memoria | 64 GB LPDDR5 de 256 bits 204,8 GB/s | 16 GB LPDDR5 de 128 bits 102,4 GB/s | 8GB 128-bit LPDDR5 102 GB/s | 32 GB LPDDR4x de 256 bits 136,5 GB/s | 8 GB LPDDR4x de 128 bits 59,7 GB/s | 4 GB LPDDR4 de 64 bits a 25,6 GB/s". |
Para obtener una tabla comparativa más detallada, visite la sección de especificaciones técnicas de la página oficial de NVIDIA Jetson.
¿Qué es NVIDIA JetPack?
NVIDIA El kit de desarrollo de software JetPack de los módulos Jetson es la solución más completa y ofrece un entorno de desarrollo completo para crear aplicaciones de IA aceleradas de principio a fin y reducir el tiempo de comercialización. JetPack incluye Jetson Linux con gestor de arranque, kernel Linux, entorno de escritorio Ubuntu y un completo conjunto de librerías para la aceleración de GPU informática, multimedia, gráficos y visión por ordenador. También incluye muestras, documentación y herramientas de desarrollo tanto para el ordenador central como para el kit de desarrollo, y es compatible con SDK de nivel superior como DeepStream para análisis de vídeo en streaming, Isaac para robótica y Riva para IA conversacional.
Flash JetPack a NVIDIA Jetson
El primer paso después de conseguir un dispositivo NVIDIA Jetson es flashear NVIDIA JetPack al dispositivo. Hay varias formas de flashear dispositivos NVIDIA Jetson.
- Si posees un kit de desarrollo oficial de NVIDIA como el Jetson Orin Nano Developer Kit, puedes descargar una imagen y preparar una tarjeta SD con JetPack para arrancar el dispositivo.
- Si posees cualquier otro Kit de Desarrollo NVIDIA , puedes flashear JetPack al dispositivo usando SDK Manager.
- Si posee un dispositivo Seeed Studio reComputer J4012, puede flashear JetPack en el SSD incluido y si posee un dispositivo Seeed Studio reComputer J1020 v2, puede flashear JetPack en el eMMC/ SSD.
- Si posee cualquier otro dispositivo de terceros alimentado por el módulo NVIDIA Jetson, se recomienda seguir la línea de comandos de flasheo.
Nota
Para los métodos 3 y 4 anteriores, después de flashear el sistema y arrancar el dispositivo, por favor introduzca "sudo apt update && sudo apt install nvidia-jetpack -y" en el terminal del dispositivo para instalar el resto de componentes JetPack necesarios.
Soporte para JetPack basado en el dispositivo Jetson
La siguiente tabla muestra las versiones de NVIDIA JetPack soportadas por los diferentes dispositivos NVIDIA Jetson.
JetPack 4 | JetPack 5 | JetPack 6 | |
---|---|---|---|
Jetson Nano | ✅ | ❌ | ❌ |
Jetson TX2 | ✅ | ❌ | ❌ |
Jetson Xavier NX | ✅ | ✅ | ❌ |
Jetson AGX Xavier | ✅ | ✅ | ❌ |
Jetson AGX Orin | ❌ | ✅ | ✅ |
Jetson Orin NX | ❌ | ✅ | ✅ |
Jetson Orin Nano | ❌ | ✅ | ✅ |
Inicio rápido con Docker
La forma más rápida de empezar con Ultralytics YOLO11 en NVIDIA Jetson es ejecutar con imágenes docker pre-construidas para Jetson. Consulte la tabla anterior y elija la versión de JetPack según el dispositivo Jetson que posea.
Una vez hecho esto, vaya a la sección Utilizar TensorRT en NVIDIA Jetson.
Comience con la instalación nativa
Para una instalación nativa sin Docker, consulte los pasos siguientes.
Run on JetPack 6.1
Instale el paquete Ultralytics
Aquí instalaremos el paquete Ultralytics en el Jetson con dependencias opcionales para que podamos exportar los PyTorch modelos a otros formatos diferentes. Nos centraremos principalmente en NVIDIA TensorRT exportaciones porque TensorRT se asegurará de que podemos obtener el máximo rendimiento de los dispositivos Jetson.
-
Actualizar la lista de paquetes, instalar pip y actualizar a la última versión
-
Instale
ultralytics
Paquete pip con dependencias opcionales -
Reiniciar el dispositivo
Instalar PyTorch y Torchvision
La instalación anterior de ultralytics instalará Torch y Torchvision. Sin embargo, estos 2 paquetes instalados a través de pip no son compatibles para ejecutarse en la plataforma Jetson que se basa en la arquitectura ARM64. Por lo tanto, tenemos que instalar manualmente PyTorch pip wheel y compilar / instalar Torchvision desde el código fuente.
Instale torch 2.5.0
y torchvision 0.20
according to JP6.1
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.5.0a0+872d972e41.nv24.08-cp310-cp310-linux_aarch64.whl
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.20.0a0+afc54f7-cp310-cp310-linux_aarch64.whl
Nota
Visite la páginaPyTorch para Jetson para acceder a todas las diferentes versiones de PyTorch para diferentes versiones de JetPack. Para una lista más detallada sobre la compatibilidad de PyTorch, Torchvision, visite la página de compatibilidad dePyTorch y Torchvision.
Instale cuSPARSELt
to fix a dependency issue with torch 2.5.0
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/arm64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install libcusparselt0 libcusparselt-dev
Instale onnxruntime-gpu
En onnxruntime-gpu alojado en PyPI no tiene aarch64
binarios para la Jetson. Así que tenemos que instalar manualmente este paquete. Este paquete es necesario para algunas de las exportaciones.
Todos diferentes onnxruntime-gpu
se enumeran los paquetes correspondientes a las distintas versiones de JetPack y Python aquí. Sin embargo, aquí vamos a descargar e instalar onnxruntime-gpu 1.20.0
con Python3.10
apoyo.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.20.0-cp310-cp310-linux_aarch64.whl
Nota
onnxruntime-gpu
revertirá automáticamente la versión de numpy a la última. Así que necesitamos reinstalar numpy a 1.23.5
para solucionar un problema ejecutando:
pip install numpy==1.23.5
Run on JetPack 5.1.2
Instale el paquete Ultralytics
Aquí instalaremos el paquete Ultralytics en el Jetson con dependencias opcionales para que podamos exportar los modelos PyTorch a otros formatos diferentes. Nos centraremos principalmente en NVIDIA TensorRT exportaciones porque TensorRT se asegurará de que podemos obtener el máximo rendimiento de los dispositivos Jetson.
-
Actualizar la lista de paquetes, instalar pip y actualizar a la última versión
-
Instale
ultralytics
Paquete pip con dependencias opcionales -
Reiniciar el dispositivo
Instalar PyTorch y Torchvision
La instalación anterior de ultralytics instalará Torch y Torchvision. Sin embargo, estos 2 paquetes instalados a través de pip no son compatibles para ejecutarse en la plataforma Jetson que se basa en la arquitectura ARM64. Por lo tanto, tenemos que instalar manualmente PyTorch pip wheel y compilar / instalar Torchvision desde el código fuente.
-
Desinstalar PyTorch y Torchvision instalados actualmente
-
Instale
torch 2.1.0
ytorchvision 0.16.2
according to JP5.1.2
Nota
Visite la páginaPyTorch para Jetson para acceder a todas las diferentes versiones de PyTorch para diferentes versiones de JetPack. Para una lista más detallada sobre la compatibilidad de PyTorch, Torchvision, visite la página de compatibilidad dePyTorch y Torchvision.
Instale onnxruntime-gpu
En onnxruntime-gpu alojado en PyPI no tiene aarch64
binarios para la Jetson. Así que tenemos que instalar manualmente este paquete. Este paquete es necesario para algunas de las exportaciones.
Todos diferentes onnxruntime-gpu
se enumeran los paquetes correspondientes a las distintas versiones de JetPack y Python aquí. Sin embargo, aquí vamos a descargar e instalar onnxruntime-gpu 1.17.0
con Python3.8
apoyo.
wget https://nvidia.box.com/shared/static/zostg6agm00fb6t5uisw51qi6kpcuwzd.whl -O onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
pip install onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
Nota
onnxruntime-gpu
revertirá automáticamente la versión de numpy a la última. Así que necesitamos reinstalar numpy a 1.23.5
para solucionar un problema ejecutando:
pip install numpy==1.23.5
Utilice TensorRT en NVIDIA Jetson
De todos los formatos de exportación de modelos soportados por Ultralytics, TensorRT ofrece el mejor rendimiento de inferencia cuando se trabaja con dispositivos NVIDIA Jetson y nuestra recomendación es utilizar TensorRT con Jetson. También tenemos un documento detallado sobre TensorRT aquí.
Convierta el modelo a TensorRT y ejecute la inferencia
El modelo YOLO11n en formato PyTorch se convierte a TensorRT para ejecutar la inferencia con el modelo exportado.
Ejemplo
from ultralytics import YOLO
# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo11n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo11n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Nota
Visite la página Exportar para acceder a argumentos adicionales a la hora de exportar modelos a diferentes formatos de modelo
Utilice NVIDIA Deep Learning Accelerator (DLA)
NVIDIA Deep Learning Accelerator (DLA) es un componente de hardware especializado integrado en los dispositivos Jetson de NVIDIA que optimiza la inferencia del aprendizaje profundo en términos de eficiencia energética y rendimiento. Al descargar las tareas de GPU (liberándolo para procesos más intensivos), DLA permite que los modelos se ejecuten con un menor consumo de energía manteniendo un alto rendimiento, ideal para sistemas integrados y aplicaciones de IA en tiempo real.
Los siguientes dispositivos Jetson están equipados con hardware DLA:
- Jetson Orin NX 16 GB
- Serie Jetson AGX Orin
- Jetson AGX Serie Xavier
- Jetson Xavier Serie NX
Ejemplo
from ultralytics import YOLO
# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")
# Export the model to TensorRT with DLA enabled (only works with FP16 or INT8)
model.export(format="engine", device="dla:0", half=True) # dla:0 or dla:1 corresponds to the DLA cores
# Load the exported TensorRT model
trt_model = YOLO("yolo11n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
# Export a YOLO11n PyTorch model to TensorRT format with DLA enabled (only works with FP16 or INT8)
yolo export model=yolo11n.pt format=engine device="dla:0" half=True # dla:0 or dla:1 corresponds to the DLA cores
# Run inference with the exported model on the DLA
yolo predict model=yolo11n.engine source='https://ultralytics.com/images/bus.jpg'
Nota
Cuando se utilizan exportaciones de ADL, es posible que algunas capas no puedan ejecutarse en ADL y se remitan a GPU para su ejecución. Este retroceso puede introducir una latencia adicional y afectar al rendimiento general de la inferencia. Por lo tanto, los ADL no están diseñados principalmente para reducir la latencia de la inferencia en comparación con TensorRT , que se ejecuta completamente en GPU. En cambio, su objetivo principal es aumentar el rendimiento y mejorar la eficiencia energética.
NVIDIA Puntos de referencia de Jetson Orin YOLO11
YOLO11 benchmarks were run by the Ultralytics team on 10 different model formats measuring speed and accuracy: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, PaddlePaddle, NCNN. Benchmarks were run on both NVIDIA Jetson Orin Nano Super Developer Kit and Seeed Studio reComputer J4012 powered by Jetson Orin NX 16GB device at FP32 precision with default input image size of 640.
Comparison Charts
Aunque todos los modelos exportados funcionan con NVIDIA Jetson, sólo hemos incluido PyTorch, TorchScript, TensorRT en la tabla comparativa que aparece a continuación porque utilizan GPU en Jetson y se garantiza que producen los mejores resultados. Todas las demás exportaciones sólo utilizan CPU y su rendimiento no es tan bueno como el de las tres anteriores. Puedes encontrar puntos de referencia para todas las exportaciones en la sección después de este gráfico.
NVIDIA Jetson Orin Nano Super Developer Kit
NVIDIA Jetson Orin NX 16GB
Detailed Comparison Tables
La siguiente tabla representa los resultados del benchmark para cinco modelos diferentes (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) a través de diez formatos diferentes (PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel , TF GraphDef , TF Lite, PaddlePaddle, NCNN), dándonos el estado, el tamaño, la métrica mAP50-95(B) y el tiempo de inferencia para cada combinación.
NVIDIA Jetson Orin Nano Super Developer Kit
Rendimiento
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 5.4 | 0.6176 | 21.3 |
TorchScript | ✅ | 10.5 | 0.6100 | 13.40 |
ONNX | ✅ | 10.2 | 0.6100 | 7.94 |
OpenVINO | ✅ | 10.4 | 0.6091 | 57.36 |
TensorRT (FP32) | ✅ | 11.9 | 0.6082 | 7.60 |
TensorRT (FP16) | ✅ | 8.3 | 0.6096 | 4.91 |
TensorRT (INT8) | ✅ | 5.6 | 0.3180 | 3.91 |
TF SavedModel | ✅ | 25.8 | 0.6082 | 223.98 |
TF GraphDef | ✅ | 10.3 | 0.6082 | 289.95 |
TF Lite | ✅ | 10.3 | 0.6082 | 328.29 |
PaddlePaddle | ✅ | 20.4 | 0.6082 | 530.46 |
MNN | ✅ | 10.1 | 0.6120 | 74.75 |
NCNN | ✅ | 10.2 | 0.6106 | 46.12 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 18.4 | 0.7526 | 22.00 |
TorchScript | ✅ | 36.5 | 0.7400 | 21.35 |
ONNX | ✅ | 36.3 | 0.7400 | 13.91 |
OpenVINO | ✅ | 36.4 | 0.7391 | 126.95 |
TensorRT (FP32) | ✅ | 38.0 | 0.7400 | 13.29 |
TensorRT (FP16) | ✅ | 21.3 | 0.7431 | 7.30 |
TensorRT (INT8) | ✅ | 12.2 | 0.3243 | 5.25 |
TF SavedModel | ✅ | 91.1 | 0.7400 | 406.73 |
TF GraphDef | ✅ | 36.4 | 0.7400 | 629.80 |
TF Lite | ✅ | 36.4 | 0.7400 | 953.98 |
PaddlePaddle | ✅ | 72.5 | 0.7400 | 1311.67 |
MNN | ✅ | 36.2 | 0.7392 | 187.66 |
NCNN | ✅ | 36.2 | 0.7403 | 122.02 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 38.8 | 0.7598 | 33.00 |
TorchScript | ✅ | 77.3 | 0.7643 | 48.17 |
ONNX | ✅ | 76.9 | 0.7641 | 29.31 |
OpenVINO | ✅ | 77.1 | 0.7642 | 313.49 |
TensorRT (FP32) | ✅ | 78.7 | 0.7641 | 28.21 |
TensorRT (FP16) | ✅ | 41.8 | 0.7653 | 13.99 |
TensorRT (INT8) | ✅ | 23.2 | 0.4194 | 9.58 |
TF SavedModel | ✅ | 192.7 | 0.7643 | 802.30 |
TF GraphDef | ✅ | 77.0 | 0.7643 | 1335.42 |
TF Lite | ✅ | 77.0 | 0.7643 | 2842.42 |
PaddlePaddle | ✅ | 153.8 | 0.7643 | 3644.29 |
MNN | ✅ | 76.8 | 0.7648 | 503.90 |
NCNN | ✅ | 76.8 | 0.7674 | 298.78 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 49.0 | 0.7475 | 43.00 |
TorchScript | ✅ | 97.6 | 0.7250 | 62.94 |
ONNX | ✅ | 97.0 | 0.7250 | 36.33 |
OpenVINO | ✅ | 97.3 | 0.7226 | 387.72 |
TensorRT (FP32) | ✅ | 99.1 | 0.7250 | 35.59 |
TensorRT (FP16) | ✅ | 52.0 | 0.7265 | 17.57 |
TensorRT (INT8) | ✅ | 31.0 | 0.4033 | 12.37 |
TF SavedModel | ✅ | 243.3 | 0.7250 | 1116.20 |
TF GraphDef | ✅ | 97.2 | 0.7250 | 1603.32 |
TF Lite | ✅ | 97.2 | 0.7250 | 3607.51 |
PaddlePaddle | ✅ | 193.9 | 0.7250 | 4890.90 |
MNN | ✅ | 96.9 | 0.7222 | 619.04 |
NCNN | ✅ | 96.9 | 0.7252 | 352.85 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 109.3 | 0.8288 | 81.00 |
TorchScript | ✅ | 218.1 | 0.8308 | 113.49 |
ONNX | ✅ | 217.5 | 0.8308 | 75.20 |
OpenVINO | ✅ | 217.8 | 0.8285 | 508.12 |
TensorRT (FP32) | ✅ | 219.5 | 0.8307 | 67.32 |
TensorRT (FP16) | ✅ | 112.2 | 0.8248 | 32.94 |
TensorRT (INT8) | ✅ | 61.7 | 0.4854 | 20.72 |
TF SavedModel | ✅ | 545.0 | 0.8308 | 1048.8 |
TF GraphDef | ✅ | 217.8 | 0.8308 | 2961.8 |
TF Lite | ✅ | 217.8 | 0.8308 | 7898.8 |
PaddlePaddle | ✅ | 434.8 | 0.8308 | 9903.68 |
MNN | ✅ | 217.3 | 0.8308 | 1242.97 |
NCNN | ✅ | 217.3 | 0.8304 | 850.05 |
Benchmarked with Ultralytics 8.3.51
NVIDIA Jetson Orin NX 16GB
Rendimiento
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 5.4 | 0.6176 | 19.50 |
TorchScript | ✅ | 10.5 | 0.6100 | 13.03 |
ONNX | ✅ | 10.2 | 0.6100 | 8.44 |
OpenVINO | ✅ | 10.4 | 0.6091 | 40.83 |
TensorRT (FP32) | ✅ | 11.9 | 0.6100 | 8.05 |
TensorRT (FP16) | ✅ | 8.2 | 0.6096 | 4.85 |
TensorRT (INT8) | ✅ | 5.5 | 0.3180 | 4.37 |
TF SavedModel | ✅ | 25.8 | 0.6082 | 185.39 |
TF GraphDef | ✅ | 10.3 | 0.6082 | 244.85 |
TF Lite | ✅ | 10.3 | 0.6082 | 289.77 |
PaddlePaddle | ✅ | 20.4 | 0.6082 | 476.52 |
MNN | ✅ | 10.1 | 0.6120 | 53.37 |
NCNN | ✅ | 10.2 | 0.6106 | 33.55 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 18.4 | 0.7526 | 19.00 |
TorchScript | ✅ | 36.5 | 0.7400 | 22.90 |
ONNX | ✅ | 36.3 | 0.7400 | 14.44 |
OpenVINO | ✅ | 36.4 | 0.7391 | 88.70 |
TensorRT (FP32) | ✅ | 37.9 | 0.7400 | 14.13 |
TensorRT (FP16) | ✅ | 21.6 | 0.7406 | 7.55 |
TensorRT (INT8) | ✅ | 12.2 | 0.3243 | 5.63 |
TF SavedModel | ✅ | 91.1 | 0.7400 | 317.61 |
TF GraphDef | ✅ | 36.4 | 0.7400 | 515.99 |
TF Lite | ✅ | 36.4 | 0.7400 | 838.85 |
PaddlePaddle | ✅ | 72.5 | 0.7400 | 1170.07 |
MNN | ✅ | 36.2 | 0.7413 | 125.23 |
NCNN | ✅ | 36.2 | 0.7403 | 68.13 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 38.8 | 0.7598 | 36.50 |
TorchScript | ✅ | 77.3 | 0.7643 | 52.55 |
ONNX | ✅ | 76.9 | 0.7640 | 31.16 |
OpenVINO | ✅ | 77.1 | 0.7642 | 208.57 |
TensorRT (FP32) | ✅ | 78.7 | 0.7640 | 30.72 |
TensorRT (FP16) | ✅ | 41.5 | 0.7651 | 14.45 |
TensorRT (INT8) | ✅ | 23.3 | 0.4194 | 10.19 |
TF SavedModel | ✅ | 192.7 | 0.7643 | 590.11 |
TF GraphDef | ✅ | 77.0 | 0.7643 | 998.57 |
TF Lite | ✅ | 77.0 | 0.7643 | 2486.11 |
PaddlePaddle | ✅ | 153.8 | 0.7643 | 3236.09 |
MNN | ✅ | 76.8 | 0.7661 | 335.78 |
NCNN | ✅ | 76.8 | 0.7674 | 188.43 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 49.0 | 0.7475 | 46.6 |
TorchScript | ✅ | 97.6 | 0.7250 | 66.54 |
ONNX | ✅ | 97.0 | 0.7250 | 39.55 |
OpenVINO | ✅ | 97.3 | 0.7226 | 262.44 |
TensorRT (FP32) | ✅ | 99.2 | 0.7250 | 38.68 |
TensorRT (FP16) | ✅ | 51.9 | 0.7265 | 18.53 |
TensorRT (INT8) | ✅ | 30.9 | 0.4033 | 13.36 |
TF SavedModel | ✅ | 243.3 | 0.7250 | 850.25 |
TF GraphDef | ✅ | 97.2 | 0.7250 | 1324.60 |
TF Lite | ✅ | 97.2 | 0.7250 | 3191.24 |
PaddlePaddle | ✅ | 193.9 | 0.7250 | 4204.97 |
MNN | ✅ | 96.9 | 0.7225 | 414.41 |
NCNN | ✅ | 96.9 | 0.7252 | 237.74 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 109.3 | 0.8288 | 86.00 |
TorchScript | ✅ | 218.1 | 0.8308 | 122.43 |
ONNX | ✅ | 217.5 | 0.8307 | 77.50 |
OpenVINO | ✅ | 217.8 | 0.8285 | 508.12 |
TensorRT (FP32) | ✅ | 219.5 | 0.8307 | 76.44 |
TensorRT (FP16) | ✅ | 112.0 | 0.8309 | 35.99 |
TensorRT (INT8) | ✅ | 61.6 | 0.4854 | 22.32 |
TF SavedModel | ✅ | 545.0 | 0.8308 | 1470.06 |
TF GraphDef | ✅ | 217.8 | 0.8308 | 2549.78 |
TF Lite | ✅ | 217.8 | 0.8308 | 7025.44 |
PaddlePaddle | ✅ | 434.8 | 0.8308 | 8364.89 |
MNN | ✅ | 217.3 | 0.8289 | 827.13 |
NCNN | ✅ | 217.3 | 0.8304 | 490.29 |
Benchmarked with Ultralytics 8.3.51
Explore más pruebas comparativas realizadas por Seeed Studio en diferentes versiones del hardware NVIDIA Jetson.
Reproduzca nuestros resultados
Para reproducir las pruebas anteriores de Ultralytics en todos los formatos de exportación, ejecute este código:
Ejemplo
Ten en cuenta que los resultados de las pruebas comparativas pueden variar en función de la configuración exacta de hardware y software de un sistema, así como de la carga de trabajo actual del sistema en el momento de ejecutar las pruebas comparativas. Para obtener resultados más fiables, utilice un conjunto de datos con un gran número de imágenes, es decir data='coco8.yaml' (4 val images), or
data='coco.yaml'` (5000 imágenes val).
Buenas prácticas al utilizar NVIDIA Jetson
Cuando se utiliza NVIDIA Jetson, hay un par de buenas prácticas a seguir para permitir el máximo rendimiento en el NVIDIA Jetson ejecutando YOLO11.
-
Activar modo MAX Power
Activando el modo MAX Power en el Jetson se asegurará de que todos los núcleos CPU, GPU están encendidos.
-
Activar los relojes Jetson
Activando Jetson Clocks te asegurarás de que todos los núcleos CPU, GPU están sincronizados a su frecuencia máxima.
-
Instalar la aplicación Jetson Stats
Podemos utilizar la aplicación jetson stats para monitorizar las temperaturas de los componentes del sistema y comprobar otros detalles del sistema como ver CPU, GPU, utilización de la RAM, cambiar los modos de energía, poner los relojes al máximo, comprobar la información de JetPack
Próximos pasos
¡Enhorabuena por haber configurado con éxito YOLO11 en tu NVIDIA Jetson! ¡Para más información y ayuda, visite la guía Ultralytics YOLO11 Docs!
PREGUNTAS FRECUENTES
¿Cómo implanto Ultralytics YOLO11 en los dispositivos NVIDIA Jetson?
Desplegar Ultralytics YOLO11 en dispositivos NVIDIA Jetson es un proceso sencillo. En primer lugar, flashea tu dispositivo Jetson con el SDK JetPack de NVIDIA . A continuación, utilice una imagen Docker precompilada para una configuración rápida o instale manualmente los paquetes necesarios. Los pasos detallados para cada enfoque se pueden encontrar en las secciones Inicio rápido con Docker e Inicio con instalación nativa.
¿Qué pruebas de rendimiento puedo esperar de los modelos YOLO11 en los dispositivos NVIDIA Jetson?
YOLO11 models have been benchmarked on various NVIDIA Jetson devices showing significant performance improvements. For example, the TensorRT format delivers the best inference performance. The table in the Detailed Comparison Tables section provides a comprehensive view of performance metrics like mAP50-95 and inference time across different model formats.
¿Por qué debería utilizar TensorRT para desplegar YOLO11 en NVIDIA Jetson?
TensorRT es muy recomendable para desplegar modelos YOLO11 en NVIDIA Jetson debido a su óptimo rendimiento. Acelera la inferencia aprovechando las capacidades de GPU de Jetson, lo que garantiza la máxima eficiencia y velocidad. Obtenga más información sobre cómo convertir a TensorRT y ejecutar la inferencia en la sección Uso de TensorRT en NVIDIA Jetson.
¿Cómo puedo instalar PyTorch y Torchvision en NVIDIA Jetson?
To install PyTorch and Torchvision on NVIDIA Jetson, first uninstall any existing versions that may have been installed via pip. Then, manually install the compatible PyTorch and Torchvision versions for the Jetson's ARM64 architecture. Detailed instructions for this process are provided in the Installation of PyTorch and Torchvision section.
¿Cuáles son las mejores prácticas para maximizar el rendimiento en NVIDIA Jetson cuando se utiliza YOLO11?
Para maximizar el rendimiento en NVIDIA Jetson con YOLO11, siga estas prácticas recomendadas:
- Active el modo MAX Power para utilizar todos los núcleos CPU y GPU .
- Activa Jetson Clocks para que todos los núcleos funcionen a su frecuencia máxima.
- Instala la aplicación Jetson Stats para monitorizar las métricas del sistema.
Para obtener comandos y detalles adicionales, consulte la sección Buenas prácticas al utilizar NVIDIA Jetson.