Link to this sectionInferencia de Ultralytics para Rust#

Q: ¿Es compatible con vídeo?

Sí, con la característica video habilitada y FFmpeg 7+ instalado en el sistema. Esto cubre archivos de vídeo, webcams y flujos RTSP/RTMP/HTTP.

Q: ¿Qué hacen las características annotate y visualize?

Ambas están habilitadas por defecto. annotate dibuja cajas, máscaras, puntos clave y etiquetas de clase en la imagen y es necesario para que --save escriba los resultados anotados. visualize abre una ventana en vivo para --show. Para una compilación más ligera y sin interfaz gráfica (headless) que solo devuelva resultados mediante programación, desactívalas con cargo build --no-default-features (vuelve a añadir las características individuales según sea necesario).

Ultralytics Inference es una biblioteca de inferencia de alto rendimiento para YOLO y una herramienta de línea de comandos escrita en Rust. Ejecuta modelos ONNX exportados a través de ONNX Runtime para ofrecer predicciones rápidas y seguras en cuanto a memoria en imágenes, vídeos, cámaras web y flujos, sin necesidad de un entorno de ejecución de Python durante la inferencia.

El proyecto se distribuye como un único crate, ultralytics-inference, que puedes utilizar de dos formas: como CLI para predicciones rápidas y trabajos por lotes, o como una biblioteca integrada directamente en tu aplicación Rust. Es compatible con todas las tareas de Ultralytics y con una amplia gama de backends de hardware a través de una interfaz de dispositivo unificada.

Link to this section¿Por qué la inferencia en Rust?#

Velocidad nativa y tamaño reducido. Se compila en un binario nativo sin intérprete, ideal para servidores, contenedores y dispositivos de borde.
Seguridad de memoria. El modelo de propiedad de Rust elimina clases enteras de errores en tiempo de ejecución sin necesidad de un recolector de basura.
Todas las tareas de YOLO. Detecta, segmenta, estima poses, OBB, clasifica, realiza segmentación semántica y estimación de profundidad desde una única API.
Amplio soporte de hardware. CPU además de proveedores de ejecución CUDA, TensorRT, CoreML, OpenVINO, DirectML, ROCm y XNNPACK seleccionados en el momento de la compilación.
Preprocesamiento en GPU. Un kernel de CUDA fusionado opcional mantiene el letterbox, la normalización y la conversión de diseño en el dispositivo para una ruta de entrada sin copia.
Descarga automática. Los nombres conocidos de modelos YOLO y los recursos de muestra se descargan automáticamente en el primer uso.

¿Buscas el paquete de Python?

Esta página cubre el crate independiente de Rust. Para el flujo de trabajo de Python (entrenamiento, validación, exportación y predicción), consulta el Inicio rápido principal y el modo de predicción. Exporta cualquier modelo de Ultralytics a ONNX con la integración de ONNX y luego ejecútalo aquí.

Link to this sectionInstalación#

Se requiere Rust 1.89 o superior. La función vídeo necesita además FFmpeg 7+ instalado en el sistema.

# Install the command-line tool from crates.io
cargo install ultralytics-inference

# Or with GPU support compiled in
cargo install ultralytics-inference --features cuda,tensorrt

El binario se ubica en ~/.cargo/bin/ultralytics-inference (Linux y macOS) o %USERPROFILE%\.cargo\bin\ en Windows.

Link to this sectionInicio rápido de CLI#

La CLI expone un subcomando predict. Sin argumentos, descarga un modelo de detección nano e imágenes de muestra, ejecuta la inferencia y guarda los resultados anotados en runs/detect/predict.

# Detect on the built-in samples (downloads model and images)
ultralytics-inference predict

# Detect on your own image
ultralytics-inference predict --model yolo26n.onnx --source image.jpg

# Segmentation (auto-downloads yolo26n-seg.onnx)
ultralytics-inference predict --task segment --source image.jpg

# Pose on a video, shown live in a window
ultralytics-inference predict --task pose --source video.mp4 --show

# Depth estimation (auto-downloads yolo26n-depth.onnx)
ultralytics-inference predict --task depth --source image.jpg

# Depth with the DepthAnything-style palette (disparity is already the default)
ultralytics-inference predict --task depth --source image.jpg --colormap spectral

# Depth normalized by depth value instead (near = low color, far = high color)
ultralytics-inference predict --task depth --source image.jpg --depth-viz metric

# Tune thresholds and filter to specific classes
ultralytics-inference predict --source image.jpg --conf 0.5 --iou 0.45 --classes "0,1,2"

# Run a whole folder on the GPU in half precision
ultralytics-inference predict --source images/ --device cuda:0 --half

Flags comunes:

Flag	Predeterminado	Descripción
`--model`, `-m`	`yolo26n.onnx`	Ruta a un modelo ONNX; se descarga automáticamente un nombre conocido de YOLO.
`--task`	`detect`	Una de `detect`, `segment`, `pose`, `obb`, `classify`, `semantic`, `depth`.
`--source`, `-s`	sample	Imagen, directorio, glob, vídeo, índice de webcam o URL.
`--conf`	`0.25`	Umbral de confianza.
`--iou`	`0.7`	Umbral de IoU para la supresión de no máximos (NMS).
`--imgsz`	metadatos del modelo	Tamaño de imagen de inferencia.
`--device`	`cpu`	Dispositivo de ejecución, por ejemplo `cuda:0`, `coreml`, `tensorrt:0`.
`--half`	`false`	Inferencia de media precisión FP16.
`--save`	`true`	Guardar resultados anotados en `runs/<task>/predict`.
`--show`	`false`	Mostrar resultados en una ventana.
`--classes`	all	Filtrar detecciones por IDs de clase, por ejemplo `"0,1,2"`.
`--colormap`	`jet`	Mapa de colores de profundidad: `jet`, `inferno`, `spectral` o `gray` (solo profundidad).
`--depth-viz`	`disparity`	Normalización de profundidad: `disparity` (profundidad inversa, cerca = color intenso) o `metric` (solo profundidad).

Link to this sectionInicio rápido de la biblioteca#

Carga un modelo y ejecuta una predicción. Los metadatos del modelo, como los nombres de las clases, el tipo de tarea y el tamaño de la imagen, se leen automáticamente del archivo ONNX.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Metadata (classes, task, imgsz) is parsed from the model.
    let mut model = YOLOModel::load("yolo26n.onnx")?;

    let results = model.predict("image.jpg")?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let conf = boxes.conf()[i];
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("{name} {conf:.2}");
            }
        }
    }

    Ok(())
}

Usa InferenceConfig para controlar umbrales, tamaño de imagen, precisión y dispositivo con una API de constructor:

use ultralytics_inference::{Device, InferenceConfig, YOLOModel};

let config = InferenceConfig::new()
    .with_confidence(0.5)
    .with_iou(0.45)
    .with_imgsz(640, 640)
    .with_device(Device::Cuda(0))
    .with_half(true);

let mut model = YOLOModel::load_with_config("yolo26n.onnx", config)?;
let results = model.predict("image.jpg")?;

Cada tarea rellena un campo diferente en Results. Cada pestaña a continuación es un programa completo y ejecutable; el modelo y las entradas de muestra se descargan automáticamente en la primera ejecución. Cambia predict_default() por predict("image.jpg") para ejecutarlo con tus propios archivos.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let mut model = YOLOModel::load("yolo26n.onnx")?;
    let results = model.predict_default()?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            println!("{} detections", boxes.len());
            let xyxy = boxes.xyxy(); // rows of [x1, y1, x2, y2]
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("  {name} {:.2} {:?}", boxes.conf()[i], xyxy.row(i).to_vec());
            }
        }
    }

    Ok(())
}

Link to this sectionTareas admitidas#

Todas las tareas de Ultralytics son compatibles. Cuando se omite --model, el modelo nano correspondiente para la tarea seleccionada se descarga automáticamente.

Tarea	`--task`	Salida	Modelo por defecto
Detección	`detect`	Cajas delimitadoras (BBox) y clases	`yolo26n.onnx`
Segmentación de instancias	`segment`	Cajas más máscaras por instancia	`yolo26n-seg.onnx`
Pose	`pose`	Cajas más puntos clave (keypoints)	`yolo26n-pose.onnx`
Cajas orientadas	`obb`	Cajas delimitadoras rotadas	`yolo26n-obb.onnx`
Clasificación	`classify`	Probabilidades de clase	`yolo26n-cls.onnx`
Segmentación semántica	`semantic`	Mapa de clases por píxel	`yolo26n-sem.onnx`
Estimación de profundidad	`depth`	Mapa de profundidad por píxel en metros	`yolo26n-depth.onnx`

Link to this sectionCompatibilidad de modelos#

Cualquier modelo de Ultralytics exportado a ONNX puede cargarse desde un archivo local. La descarga automática está disponible para nombres de modelos estándar de YOLO26, YOLO11 y YOLOv8 en tamaños n, s, m, l y x:

Familia de modelos	Variantes descargables automáticamente
YOLO26	`yolo26{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb`, `-cls`, `-sem` y `-depth`
YOLO11	`yolo11{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb` y `-cls`
YOLOv8	`yolov8{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb` y `-cls`

La segmentación semántica (-sem) y la estimación de profundidad (-depth) son exclusivas de YOLO26.

Link to this sectionFuentes de entrada#

El argumento --source (y el tipo Source en la biblioteca) acepta muchos tipos de entrada, detectados automáticamente a partir de la cadena:

Fuente	Ejemplo	Notas
Imagen	`image.jpg`	Archivo único.
Directorio	`images/`	Todas las imágenes en la carpeta.
Glob	`images/*.jpg`	Patrón estilo shell.
Vídeo	`video.mp4`	Requiere la función `video`.
Cámara web	`0`	Requiere la función `video`.
Stream	`rtsp://...`	Requiere la función `video`.
URL	`https://example.com/image.jpg`	Descarga de imagen remota.

Link to this sectionDispositivos y proveedores de ejecución#

La inferencia se ejecuta en la CPU por defecto. Los backends de GPU y aceleradores se compilan como funciones de Cargo y se seleccionan en tiempo de ejecución con --device (CLI) o Device (biblioteca).

Cadena de dispositivo	Variante de `Device`	Función de compilación	Hardware
`cpu`	`Device::Cpu`	integrado	Cualquier CPU
`cuda:0`	`Device::Cuda(0)`	`cuda`	GPU NVIDIA
`tensorrt:0`	`Device::TensorRt(0)`	`tensorrt`	GPU NVIDIA, optimizada
`coreml`	`Device::CoreMl`	`coreml`	Apple Silicon / macOS
`openvino`	`Device::OpenVino`	`openvino`	CPU Intel / iGPU
`directml:0`	`Device::DirectMl(0)`	`directml`	GPU Windows
`rocm:0`	`Device::Rocm(0)`	`rocm`	GPU AMD
`xnnpack`	`Device::Xnnpack`	`xnnpack`	CPU optimizada

# Build the CLI with the providers you need
cargo install ultralytics-inference --features cuda,tensorrt

Link to this sectionAceleración por GPU y preprocesamiento CUDA#

En hardware NVIDIA, la característica cuda habilita el proveedor de ejecución CUDA, y tensorrt añade el proveedor TensorRT para una mayor optimización. Para obtener la menor latencia posible, la característica cuda-preprocess mueve el preprocesamiento a la GPU.

cuda-preprocess ejecuta el cambio de tamaño tipo letterbox, la normalización y la conversión de diseño HWC a CHW como un único núcleo CUDA fusionado, y luego envía el resultado al modelo como un tensor de dispositivo de copia cero. Esto elimina el coste de preprocesamiento en la CPU por imagen y la copia de host a dispositivo, lo cual es fundamental para lotes de alto rendimiento y flujos en tiempo real.

# Build with fused GPU preprocessing (implies cuda + tensorrt)
cargo build --release --features cuda-preprocess

La vía rápida se utiliza automáticamente, sin cambios en la API, cuando se cumplen todas las condiciones siguientes: la función está compilada, el dispositivo es CUDA o TensorRT, la tarea es detect, segment, pose, OBB, segmentación semántica o estimación de profundidad, y el modelo utiliza entrada FP32. Está habilitada por defecto y puede desactivarse por modelo:

use ultralytics_inference::{Device, InferenceConfig};

let config = InferenceConfig::new()
    .with_device(Device::TensorRt(0))
    .with_cuda_preprocess(false); // force CPU preprocessing

Adapta tu toolkit CUDA

cuda-preprocess requiere un toolkit CUDA compatible en tiempo de compilación y utiliza NVRTC en tiempo de ejecución para el núcleo de preprocesamiento fusionado. Consulta la guía de aceleración de CUDA y TensorRT para conocer los requisitos de versión y la resolución de problemas.

Link to this sectionCaracterísticas de Cargo#

Las características se habilitan en tiempo de compilación. Las opciones por defecto cubren la anotación y la visualización en vivo.

Característica	Predeterminado	Propósito
`annotate`	sí	Dibuja cajas, máscaras, puntos clave y etiquetas; necesario para `--save`.
`visualize`	sí	Visualización en ventana en tiempo real para `--show`.
`video`	no	Lectura y escritura de archivos de vídeo (requiere FFmpeg 7+).
`cuda`	no	Proveedor de ejecución NVIDIA CUDA.
`tensorrt`	no	Proveedor de ejecución NVIDIA TensorRT.
`cuda-preprocess`	no	Preprocesamiento fusionado en GPU con entrada de copia cero (implica cuda, tensorrt).
`coreml`	no	Proveedor de ejecución Apple CoreML.
`openvino`	no	Proveedor de ejecución Intel OpenVINO.
`rocm`	no	Proveedor de ejecución AMD ROCm.
`directml`	no	Proveedor de ejecución Windows DirectML.

Los grupos de conveniencia agrupan proveedores relacionados: nvidia (cuda, tensorrt), amd (rocm, migraphx), intel (openvino, onednn), mobile (nnapi, coreml, qnn) y all (annotate, visualize, video). Otros proveedores como nnapi, qnn, xnnpack, webgpu y otros también están disponibles.

Habilita las características al instalar la CLI o al añadir la librería:

cargo install ultralytics-inference --features video
cargo install ultralytics-inference --features cuda,tensorrt

[dependencies]
ultralytics-inference = { version = "0.0.29", features = ["video"] }

Link to this sectionSalida y guardado#

Por defecto, las predicciones se anotan y se guardan en un directorio de ejecución con incremento automático:

runs/
└── detect/
    └── predict/          # then predict2, predict3, ...
        └── image.jpg     # annotated result

La subcarpeta coincide con la tarea (runs/segment/, runs/pose/, etcétera). Para fuentes de vídeo, la salida anotada se escribe como un archivo de vídeo; pasa --save-frames para escribir fotogramas individuales en su lugar. Para la tarea semantic, --save-json escribe PNGs de mapas de clases por píxel en una subcarpeta results/. Para la tarea depth, la imagen anotada se escribe lado a lado, con la original junto al mapa de profundidad coloreado. Guardar imágenes y vídeos anotados requiere la función annotate; la exportación de PNGs de mapas de clases semánticas no. La entrada y salida de vídeo requieren la función video.

Link to this sectionFAQ#

Link to this section¿Necesito tener Python instalado?#

No. El crate ejecuta los modelos ONNX exportados directamente a través de ONNX Runtime. Python solo es necesario si entrenas o exportas modelos con el paquete Ultralytics de antemano.

Link to this section¿Qué modelos puedo ejecutar?#

Cualquier modelo YOLO de Ultralytics exportado a ONNX, incluyendo YOLO26, YOLO11 y YOLOv8. Los nombres de modelos conocidos se descargan automáticamente; también puedes apuntar --model a cualquier archivo .onnx local.

Link to this section¿Cómo obtengo un archivo de modelo?#

Expórtalo desde el paquete de Python, por ejemplo con la integración de ONNX, o deja que la CLI descargue un modelo nano estándar para la tarea elegida en la primera ejecución.

Link to this section¿Es compatible con vídeo?#

Sí, con la característica video habilitada y FFmpeg 7+ instalado en el sistema. Esto cubre archivos de vídeo, webcams y flujos RTSP/RTMP/HTTP.

Link to this section¿Qué hacen las características `annotate` y `visualize`?#

Ambas están habilitadas por defecto. annotate dibuja cajas, máscaras, puntos clave y etiquetas de clase en la imagen y es necesario para que --save escriba los resultados anotados. visualize abre una ventana en vivo para --show. Para una compilación más ligera y sin interfaz gráfica (headless) que solo devuelva resultados mediante programación, desactívalas con cargo build --no-default-features (vuelve a añadir las características individuales según sea necesario).

Link to this section¿Dónde está la referencia completa de la API?#

Esta página es una visión general de alto nivel. La referencia completa de la API, tipo por tipo, para cada estructura, método y opción de configuración pública, se publica en docs.rs, generada directamente desde el código fuente.

Colaboradores

ONonuralpszr⁸ GLglenn-jocher¹

Creado el mes pasadoActualizado hace 4 días