Guía de inicio rápido: NVIDIA Jetson con Ultralytics YOLO11
Esta completa guía proporciona un recorrido detallado para implantar Ultralytics YOLO11 en los dispositivos Jetson deNVIDIA . Además, presenta pruebas de rendimiento para demostrar las capacidades de YOLO11 en estos pequeños y potentes dispositivos.
Observa: Cómo configurar NVIDIA Jetson con Ultralytics YOLO11
Nota
Esta guía ha sido probada tanto con el Seeed Studio reComputer J4012, basado en NVIDIA Jetson Orin NX 16GB, que ejecuta la última versión estable de JetPack JP6.0, como con la versión de JetPack JP5.1.3 y el Seeed Studio reComputer J1020 v2, basado en NVIDIA Jetson Nano 4GB, que ejecuta la versión de JetPack JP4.6.1. Se espera que funcione con toda la gama de hardware Jetson de NVIDIA , tanto la más reciente como la heredada.
¿Qué es NVIDIA Jetson?
NVIDIA Jetson es una serie de placas de computación integradas diseñadas para llevar la computación acelerada de IA (inteligencia artificial) a los dispositivos periféricos. Estos dispositivos compactos y potentes se basan en la arquitectura GPU de NVIDIA y son capaces de ejecutar complejos algoritmos de IA y modelos de aprendizaje profundo directamente en el dispositivo, sin necesidad de depender de recursos informáticos en la nube. Las placas Jetson se utilizan a menudo en robótica, vehículos autónomos, automatización industrial y otras aplicaciones en las que la inferencia de IA debe realizarse localmente con baja latencia y alta eficiencia. Además, estas placas se basan en la arquitectura ARM64 y consumen menos energía que los dispositivos informáticos tradicionales de GPU .
NVIDIA Comparación de la serie Jetson
Jetson Orin es la última iteración de la familia Jetson de NVIDIA basada en la arquitectura NVIDIA Ampere que aporta un rendimiento de IA drásticamente mejorado en comparación con las generaciones anteriores. En la tabla siguiente se comparan algunos de los dispositivos Jetson del ecosistema.
Jetson AGX Orin 64 GB | Jetson Orin NX 16GB | Jetson Orin Nano 8GB | Jetson AGX Xavier | Jetson Xavier NX | Jetson Nano | |
---|---|---|---|---|---|---|
Rendimiento de la IA | 275 TOPS | 100 TOPS | 40 TOPs | 32 TOPS | 21 TOPS | 472 GFLOPS |
GPU | 2048 núcleos NVIDIA Arquitectura Ampere GPU con 64 núcleos Tensor | Arquitectura de 1024 núcleos NVIDIA Ampere GPU con 32 Tensor Núcleos | Arquitectura de 1024 núcleos NVIDIA Ampere GPU con 32 Tensor Núcleos | Arquitectura Volta de 512 núcleos NVIDIA GPU con 64 núcleos Tensor | Arquitectura NVIDIA Volta™ de 384 núcleos GPU con 48 núcleos Tensor | Arquitectura Maxwell™ de 128 núcleos NVIDIA GPU |
GPU Frecuencia máxima | 1,3 GHz | 918 MHz | 625 MHz | 1377 MHz | 1100 MHz | 921MHz |
CPU | 12 núcleos NVIDIA Arm® Cortex A78AE v8.2 64 bits CPU 3MB L2 + 6MB L3 | 8 núcleos NVIDIA Arm® Cortex A78AE v8.2 64 bits CPU 2MB L2 + 4MB L3 | 6 núcleos Arm® Cortex®-A78AE v8.2 de 64 bits CPU 1,5 MB L2 + 4 MB L3 | 8 núcleos NVIDIA Carmel Arm®v8.2 64 bits CPU 8MB L2 + 4MB L3 | 6 núcleos NVIDIA Carmel Arm®v8.2 64 bits CPU 6MB L2 + 4MB L3 | Procesador MPCore Arm® Cortex®-A57 de cuatro núcleos |
CPU Frecuencia máxima | 2,2 GHz | 2,0 GHz | 1,5 GHz | 2,2 GHz | 1,9 GHz | 1,43 GHz |
Memoria | 64 GB LPDDR5 de 256 bits 204,8 GB/s | 16 GB LPDDR5 de 128 bits 102,4 GB/s | 8 GB LPDDR5 de 128 bits 68 GB/s | 32 GB LPDDR4x de 256 bits 136,5 GB/s | 8 GB LPDDR4x de 128 bits 59,7 GB/s | 4 GB LPDDR4 de 64 bits 25,6 GB/s". |
Para ver una tabla comparativa más detallada, visita la sección Especificaciones técnicas de la página oficial de NVIDIA Jetson.
¿Qué es NVIDIA JetPack?
NVIDIA El SDK Jet Pack que impulsa los módulos Jetson es la solución más completa y proporciona un entorno de desarrollo completo para crear aplicaciones de IA aceleradas de extremo a extremo y acorta el tiempo de comercialización. JetPack incluye Jetson Linux con gestor de arranque, núcleo Linux, entorno de escritorio Ubuntu y un conjunto completo de bibliotecas para la aceleración de la informática, multimedia, gráficos y visión por ordenador de GPU . También incluye muestras, documentación y herramientas para desarrolladores, tanto para el ordenador central como para el kit de desarrollador, y es compatible con SDK de nivel superior como DeepStream para análisis de vídeo en streaming, Isaac para robótica y Riva para IA conversacional.
Flash JetPack a NVIDIA Jetson
El primer paso tras hacerte con un dispositivo NVIDIA Jetson es flashear NVIDIA JetPack al dispositivo. Hay varias formas diferentes de flashear dispositivos NVIDIA Jetson.
- Si tienes un kit de desarrollo oficial de NVIDIA , como el kit de desarrollo Jetson Orin Nano, puedes descargar una imagen y preparar una tarjeta SD con JetPack para arrancar el dispositivo.
- Si posees cualquier otro Kit de Desarrollo de NVIDIA , puedes flashear JetPack en el dispositivo utilizando SDK Manager.
- Si tienes un dispositivo Seeed Studio reComputer J4012, puedes flashear JetPack en la SSD incluida y si tienes un dispositivo Seeed Studio reComputer J1020 v2, puedes flashear JetPack en la eMMC/ SSD.
- Si posees cualquier otro dispositivo de terceros alimentado por el módulo Jetson de NVIDIA , se recomienda que sigas el parpadeo de la línea de comandos.
Nota
Para los métodos 3 y 4 anteriores, después de flashear el sistema y arrancar el dispositivo, introduce "sudo apt update && sudo apt install nvidia-jetpack -y" en el terminal del dispositivo para instalar el resto de componentes de JetPack necesarios.
Soporte para JetPack basado en el dispositivo Jetson
La siguiente tabla muestra las versiones de NVIDIA JetPack compatibles con los distintos dispositivos NVIDIA Jetson.
JetPack 4 | JetPack 5 | JetPack 6 | |
---|---|---|---|
Jetson Nano | ✅ | ❌ | ❌ |
Jetson TX2 | ✅ | ❌ | ❌ |
Jetson Xavier NX | ✅ | ✅ | ❌ |
Jetson AGX Xavier | ✅ | ✅ | ❌ |
Jetson AGX Orin | ❌ | ✅ | ✅ |
Jetson Orin NX | ❌ | ✅ | ✅ |
Jetson Orin Nano | ❌ | ✅ | ✅ |
Inicio rápido con Docker
La forma más rápida de empezar a utilizar Ultralytics YOLO11 en NVIDIA Jetson es ejecutarlo con imágenes Docker preconstruidas para Jetson. Consulta la tabla anterior y elige la versión de JetPack según el dispositivo Jetson que poseas.
Una vez hecho esto, pasa a la sección Utilizar TensorRT en NVIDIA Jetson.
Empieza con la instalación nativa
Para una instalación nativa sin Docker, consulta los pasos siguientes.
Ejecutar en JetPack 6.x
Instala el paquete Ultralytics
Aquí instalaremos el paquete Ultralytics en la Jetson con dependencias opcionales para que podamos exportar los PyTorch modelos a otros formatos diferentes. Nos centraremos principalmente en las exportaciones deNVIDIA TensorRT porque TensorRT se asegurará de que podamos obtener el máximo rendimiento de los dispositivos Jetson.
Actualizar la lista de paquetes, instalar pip y actualizar a la última versión
Instala
ultralytics
paquete pip con dependencias opcionalesReinicia el dispositivo
Instala PyTorch y Torchvision
La instalación anterior de ultralytics instalará Torch y Torchvision. Sin embargo, estos 2 paquetes instalados mediante pip no son compatibles para ejecutarse en la plataforma Jetson, basada en la arquitectura ARM64. Por lo tanto, tenemos que instalar manualmente PyTorch pip wheel y compilar/instalar Torchvision desde el código fuente.
Instala torch 2.3.0
y torchvision 0.18
según JP6.0
sudo apt-get install libopenmpi-dev libopenblas-base libomp-dev -y
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.3.0-cp310-cp310-linux_aarch64.whl
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.18.0a0+6043bc2-cp310-cp310-linux_aarch64.whl
Visita la páginaPyTorch para Jetson para acceder a todas las versiones de PyTorch para las distintas versiones de JetPack. Para obtener una lista más detallada sobre la compatibilidad de PyTorchy Torchvision, visita la página de compatibilidad dePyTorch y Torchvision.
Instala onnxruntime-gpu
En onnxruntime-gpu alojado en PyPI no tiene aarch64
binarios para la Jetson. Así que tenemos que instalar manualmente este paquete. Este paquete es necesario para algunas de las exportaciones.
Todos diferentes onnxruntime-gpu
se enumeran los paquetes correspondientes a las distintas versiones de JetPack y Python aquí. Sin embargo, aquí descargaremos e instalaremos onnxruntime-gpu 1.18.0
con Python3.10
apoyo.
wget https://nvidia.box.com/shared/static/48dtuob7meiw6ebgfsfqakc9vse62sg4.whl -O onnxruntime_gpu-1.18.0-cp310-cp310-linux_aarch64.whl
pip install onnxruntime_gpu-1.18.0-cp310-cp310-linux_aarch64.whl
Nota
onnxruntime-gpu
revertirá automáticamente la versión de numpy a la última. Así que tenemos que reinstalar numpy a 1.23.5
para solucionar un problema ejecutando:
pip install numpy==1.23.5
Funciona con JetPack 5.x
Instala el paquete Ultralytics
Aquí instalaremos el paquete Ultralytics en el Jetson con dependencias opcionales para que podamos exportar los modelos PyTorch a otros formatos diferentes. Nos centraremos principalmente en las exportaciones deNVIDIA TensorRT porque TensorRT nos asegurará el máximo rendimiento de los dispositivos Jetson.
Actualizar la lista de paquetes, instalar pip y actualizar a la última versión
Instala
ultralytics
paquete pip con dependencias opcionalesReinicia el dispositivo
Instala PyTorch y Torchvision
La instalación anterior de ultralytics instalará Torch y Torchvision. Sin embargo, estos 2 paquetes instalados mediante pip no son compatibles para ejecutarse en la plataforma Jetson, basada en la arquitectura ARM64. Por lo tanto, tenemos que instalar manualmente PyTorch pip wheel y compilar/instalar Torchvision desde el código fuente.
Desinstala PyTorch y Torchvision instalados actualmente
Instala PyTorch 2.1.0 según JP5.1.3
sudo apt-get install -y libopenblas-base libopenmpi-dev wget https://developer.download.nvidia.com/compute/redist/jp/v512/pytorch/torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl -O torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl pip install torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl
Instala Torchvision v0.16.2 según PyTorch v2.1.0
Visita la páginaPyTorch para Jetson para acceder a todas las versiones de PyTorch para las distintas versiones de JetPack. Para obtener una lista más detallada sobre la compatibilidad de PyTorchy Torchvision, visita la página de compatibilidad dePyTorch y Torchvision.
Instala onnxruntime-gpu
En onnxruntime-gpu alojado en PyPI no tiene aarch64
binarios para la Jetson. Así que tenemos que instalar manualmente este paquete. Este paquete es necesario para algunas de las exportaciones.
Todos diferentes onnxruntime-gpu
se enumeran los paquetes correspondientes a las distintas versiones de JetPack y Python aquí. Sin embargo, aquí descargaremos e instalaremos onnxruntime-gpu 1.17.0
con Python3.8
apoyo.
wget https://nvidia.box.com/shared/static/zostg6agm00fb6t5uisw51qi6kpcuwzd.whl -O onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
pip install onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
Nota
onnxruntime-gpu
revertirá automáticamente la versión de numpy a la última. Así que tenemos que reinstalar numpy a 1.23.5
para solucionar un problema ejecutando:
pip install numpy==1.23.5
Utiliza TensorRT en NVIDIA Jetson
De todos los formatos de exportación de modelos que admite Ultralytics, TensorRT ofrece el mejor rendimiento de inferencia cuando se trabaja con dispositivos NVIDIA Jetson y nuestra recomendación es utilizar TensorRT con Jetson. También tenemos un documento detallado sobre TensorRT aquí.
Convierte el modelo a TensorRT y ejecuta la inferencia
El modelo YOLO11n en formato PyTorch se convierte a TensorRT para ejecutar la inferencia con el modelo exportado.
Ejemplo
from ultralytics import YOLO
# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo11n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo11n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Utiliza NVIDIA Acelerador de Aprendizaje Profundo (ADL)
NVIDIA El Acelerador de Aprendizaje Profundo (DLA) es un componente de hardware especializado integrado en los dispositivos NVIDIA Jetson que optimiza la inferencia del aprendizaje profundo para obtener eficiencia energética y rendimiento. Al descargar tareas del GPU (liberándolo para procesos más intensivos), el DLA permite que los modelos se ejecuten con un menor consumo de energía manteniendo un alto rendimiento, ideal para sistemas integrados y aplicaciones de IA en tiempo real.
Los siguientes dispositivos Jetson están equipados con hardware ADL:
- Jetson Orin NX 16GB
- Serie Jetson AGX Orin
- Jetson AGX Serie Xavier
- Jetson Xavier Serie NX
Ejemplo
from ultralytics import YOLO
# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")
# Export the model to TensorRT with DLA enabled (only works with FP16 or INT8)
model.export(format="engine", device="dla:0", half=True) # dla:0 or dla:1 corresponds to the DLA cores
# Load the exported TensorRT model
trt_model = YOLO("yolo11n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
# Export a YOLO11n PyTorch model to TensorRT format with DLA enabled (only works with FP16 or INT8)
yolo export model=yolo11n.pt format=engine device="dla:0" half=True # dla:0 or dla:1 corresponds to the DLA cores
# Run inference with the exported model on the DLA
yolo predict model=yolo11n.engine source='https://ultralytics.com/images/bus.jpg'
Nota
Visita la página Exportar para acceder a argumentos adicionales al exportar modelos a diferentes formatos de modelo
NVIDIA Benchmarks Jetson Orin YOLO11
El equipo de Ultralytics ejecutó las pruebas de YOLO11 en 10 formatos de modelo diferentes, midiendo la velocidad y la precisión: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel , TF GraphDef , TF Lite, PaddlePaddle, NCNN. Las pruebas se ejecutaron en el reComputer J4012 de Seeed Studio, equipado con el dispositivo Jetson Orin NX de 16 GB, con una precisión FP32 y un tamaño de imagen de entrada predeterminado de 640.
Cuadro comparativo
Aunque todas las exportaciones de modelos funcionan con NVIDIA Jetson, sólo hemos incluido PyTorch, TorchScript, TensorRT para la tabla comparativa de abajo porque, hacen uso del GPU en la Jetson y está garantizado que producen los mejores resultados. Todas las demás exportaciones sólo utilizan el CPU y el rendimiento no es tan bueno como el de las tres anteriores. Puedes encontrar puntos de referencia para todas las exportaciones en la sección que sigue a este gráfico.
Tabla comparativa detallada
La tabla siguiente representa los resultados de la prueba comparativa para cinco modelos diferentes (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) en diez formatos distintos (PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel , TF GraphDef , TF Lite, PaddlePaddle, NCNN), dándonos el estado, el tamaño, la métrica mAP50-95(B) y el tiempo de inferencia de cada combinación.
Rendimiento
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 5.4 | 0.6176 | 19.80 |
TorchScript | ✅ | 10.5 | 0.6100 | 13.30 |
ONNX | ✅ | 10.2 | 0.6082 | 67.92 |
OpenVINO | ✅ | 10.4 | 0.6082 | 118.21 |
TensorRT (FP32) | ✅ | 14.1 | 0.6100 | 7.94 |
TensorRT (FP16) | ✅ | 8.3 | 0.6082 | 4.80 |
TensorRT (INT8) | ✅ | 6.6 | 0.3256 | 4.17 |
TF SavedModel | ✅ | 25.8 | 0.6082 | 185.88 |
TF GraphDef | ✅ | 10.3 | 0.6082 | 256.66 |
TF Lite | ✅ | 10.3 | 0.6082 | 284.64 |
PaddlePaddle | ✅ | 20.4 | 0.6082 | 477.41 |
NCNN | ✅ | 10.2 | 0.6106 | 32.18 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 18.4 | 0.7526 | 20.20 |
TorchScript | ✅ | 36.5 | 0.7416 | 23.42 |
ONNX | ✅ | 36.3 | 0.7416 | 162.01 |
OpenVINO | ✅ | 36.4 | 0.7416 | 159.61 |
TensorRT (FP32) | ✅ | 40.3 | 0.7416 | 13.93 |
TensorRT (FP16) | ✅ | 21.7 | 0.7416 | 7.47 |
TensorRT (INT8) | ✅ | 13.6 | 0.3179 | 5.66 |
TF SavedModel | ✅ | 91.1 | 0.7416 | 316.46 |
TF GraphDef | ✅ | 36.4 | 0.7416 | 506.71 |
TF Lite | ✅ | 36.4 | 0.7416 | 842.97 |
PaddlePaddle | ✅ | 72.5 | 0.7416 | 1172.57 |
NCNN | ✅ | 36.2 | 0.7419 | 66.00 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 38.8 | 0.7595 | 36.70 |
TorchScript | ✅ | 77.3 | 0.7643 | 50.95 |
ONNX | ✅ | 76.9 | 0.7643 | 416.34 |
OpenVINO | ✅ | 77.1 | 0.7643 | 370.99 |
TensorRT (FP32) | ✅ | 81.5 | 0.7640 | 30.49 |
TensorRT (FP16) | ✅ | 42.2 | 0.7658 | 14.93 |
TensorRT (INT8) | ✅ | 24.3 | 0.4118 | 10.32 |
TF SavedModel | ✅ | 192.7 | 0.7643 | 597.08 |
TF GraphDef | ✅ | 77.0 | 0.7643 | 1016.12 |
TF Lite | ✅ | 77.0 | 0.7643 | 2494.60 |
PaddlePaddle | ✅ | 153.8 | 0.7643 | 3218.99 |
NCNN | ✅ | 76.8 | 0.7691 | 192.77 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 49.0 | 0.7475 | 47.6 |
TorchScript | ✅ | 97.6 | 0.7250 | 66.36 |
ONNX | ✅ | 97.0 | 0.7250 | 532.58 |
OpenVINO | ✅ | 97.3 | 0.7250 | 477.55 |
TensorRT (FP32) | ✅ | 101.6 | 0.7250 | 38.71 |
TensorRT (FP16) | ✅ | 52.6 | 0.7265 | 19.35 |
TensorRT (INT8) | ✅ | 31.6 | 0.3856 | 13.50 |
TF SavedModel | ✅ | 243.3 | 0.7250 | 895.24 |
TF GraphDef | ✅ | 97.2 | 0.7250 | 1301.19 |
TF Lite | ✅ | 97.2 | 0.7250 | 3202.93 |
PaddlePaddle | ✅ | 193.9 | 0.7250 | 4206.98 |
NCNN | ✅ | 96.9 | 0.7252 | 225.75 |
Formato | Estado | Tamaño en disco (MB) | mAP50-95(B) | Tiempo de inferencia (ms/im) |
---|---|---|---|---|
PyTorch | ✅ | 109.3 | 0.8288 | 85.60 |
TorchScript | ✅ | 218.1 | 0.8308 | 121.67 |
ONNX | ✅ | 217.5 | 0.8308 | 1073.14 |
OpenVINO | ✅ | 217.8 | 0.8308 | 955.60 |
TensorRT (FP32) | ✅ | 221.6 | 0.8307 | 75.84 |
TensorRT (FP16) | ✅ | 113.1 | 0.8295 | 35.75 |
TensorRT (INT8) | ✅ | 62.2 | 0.4783 | 22.23 |
TF SavedModel | ✅ | 545.0 | 0.8308 | 1497.40 |
TF GraphDef | ✅ | 217.8 | 0.8308 | 2552.42 |
TF Lite | ✅ | 217.8 | 0.8308 | 7044.58 |
PaddlePaddle | ✅ | 434.9 | 0.8308 | 8386.73 |
NCNN | ✅ | 217.3 | 0.8304 | 486.36 |
Explora más pruebas comparativas de Seeed Studio ejecutadas en diferentes versiones del hardware NVIDIA Jetson.
Reproducir nuestros resultados
Para reproducir las pruebas anteriores de Ultralytics en todos los formatos de exportación, ejecuta este código:
Ejemplo
Ten en cuenta que los resultados de las pruebas comparativas pueden variar en función de la configuración exacta de hardware y software de un sistema, así como de la carga de trabajo actual del sistema en el momento de ejecutar las pruebas comparativas. Para obtener resultados más fiables, utiliza un conjunto de datos con un gran número de imágenes, es decir data='coco8.yaml' (4 val images), or
data='coco.yaml'` (5000 imágenes val).
Buenas prácticas al utilizar NVIDIA Jetson
Cuando utilices NVIDIA Jetson, hay un par de buenas prácticas que debes seguir para conseguir el máximo rendimiento en NVIDIA Jetson ejecutando YOLO11.
Activar el modo de potencia MAX
Activando el Modo MAX Power en el Jetson te asegurarás de que todos los núcleos CPU, GPU están encendidos.
Activar los Relojes Jetson
Si activas los Relojes Jetson, te asegurarás de que todos los núcleos CPU, GPU estén sincronizados a su frecuencia máxima.
Instalar la aplicación Jetson Stats
Podemos utilizar la aplicación jetson stats para monitorizar las temperaturas de los componentes del sistema y comprobar otros detalles del sistema como ver CPU, GPU, utilización de la RAM, cambiar los modos de energía, poner los relojes al máximo, comprobar la información de JetPack
Próximos pasos
¡Enhorabuena por haber configurado con éxito YOLO11 en tu NVIDIA Jetson! ¡Para más información y ayuda, visita la guía Ultralytics YOLO11 Docs!
PREGUNTAS FRECUENTES
¿Cómo despliego Ultralytics YOLO11 en dispositivos NVIDIA Jetson?
Desplegar Ultralytics YOLO11 en dispositivos Jetson NVIDIA es un proceso sencillo. En primer lugar, flashea tu dispositivo Jetson con el SDK JetPack de NVIDIA . A continuación, utiliza una imagen Docker precompilada para una configuración rápida o instala manualmente los paquetes necesarios. Puedes encontrar los pasos detallados para cada enfoque en las secciones Inicio rápido con Docker e Inicio con instalación nativa.
¿Qué pruebas de rendimiento puedo esperar de los modelos YOLO11 en los dispositivos Jetson de NVIDIA ?
Los modelos YOLO11 se han sometido a pruebas comparativas en varios dispositivos Jetson de NVIDIA , mostrando mejoras significativas en el rendimiento. Por ejemplo, el formato TensorRT ofrece el mejor rendimiento de inferencia. La tabla de la sección Tabla comparativa detallada ofrece una visión completa de las métricas de rendimiento como mAP50-95 y el tiempo de inferencia en los distintos formatos de modelo.
¿Por qué debería utilizar TensorRT para desplegar YOLO11 en NVIDIA Jetson?
TensorRT es muy recomendable para desplegar modelos YOLO11 en NVIDIA Jetson debido a su rendimiento óptimo. Acelera la inferencia aprovechando las capacidades de GPU de la Jetson, garantizando la máxima eficacia y velocidad. Obtén más información sobre cómo convertir a TensorRT y ejecutar la inferencia en la sección Utilizar TensorRT en NVIDIA Jetson.
¿Cómo puedo instalar PyTorch y Torchvision en NVIDIA Jetson?
Para instalar PyTorch y Torchvision en NVIDIA Jetson, desinstala primero cualquier versión existente que se haya instalado mediante pip. A continuación, instala manualmente las versiones compatibles de PyTorch y Torchvision para la arquitectura ARM64 del Jetson. Encontrarás instrucciones detalladas para este proceso en la sección Instalar PyTorch y Torchvision.
¿Cuáles son las mejores prácticas para maximizar el rendimiento en NVIDIA Jetson cuando se utiliza YOLO11?
Para maximizar el rendimiento en NVIDIA Jetson con YOLO11, sigue estas prácticas recomendadas:
- Activa el modo MAX Power para utilizar todos los núcleos CPU y GPU .
- Activa los Relojes Jetson para que todos los núcleos funcionen a su frecuencia máxima.
- Instala la aplicación Jetson Stats para controlar las métricas del sistema.
Para obtener comandos y detalles adicionales, consulta la sección Buenas prácticas al utilizar NVIDIA Jetson.