Link to this sectionUltralytics Inference per Rust#

Q: Il video è supportato?

Sì, con la funzionalità video abilitata e FFmpeg 7+ installato sul sistema. Questo copre file video, webcam e flussi RTSP/RTMP/HTTP.

Q: Cosa fanno le funzionalità annotate e visualize?

Entrambe sono abilitate per impostazione predefinita. annotate disegna box, maschere, keypoint ed etichette di classe sull'immagine ed è richiesto da --save per scrivere i risultati annotati. visualize apre una finestra live per --show. Per una build più piccola e headless che restituisce i risultati solo a livello programmatico, disabilitale con cargo build --no-default-features (aggiungi nuovamente le singole funzionalità secondo necessità).

Ultralytics Inference è una libreria di inferenza YOLO ad alte prestazioni e uno strumento da riga di comando scritto in Rust. Esegue modelli ONNX esportati tramite ONNX Runtime per fornire previsioni veloci e sicure per la memoria su immagini, video, webcam e flussi, senza che sia necessario alcun runtime Python al momento dell'inferenza.

Il progetto viene distribuito come un singolo crate, ultralytics-inference, che puoi utilizzare in due modi: come CLI per previsioni rapide e processi batch, o come libreria integrata direttamente nella tua applicazione Rust. Supporta ogni task di Ultralytics e una vasta gamma di backend hardware tramite un'interfaccia dispositivo uniforme.

Link to this sectionPerché l'inferenza con Rust?#

Velocità nativa e ingombro ridotto. Si compila in un binario nativo senza interprete, ideale per server, container e dispositivi edge.
Sicurezza della memoria. Il modello di ownership di Rust rimuove intere classi di errori di runtime senza bisogno di un garbage collector.
Tutti i task di YOLO. Rilevamento, segmentazione, pose, OBB, classificazione, segmentazione semantica e stima della profondità da un'unica API.
Ampio supporto hardware. CPU più provider di esecuzione CUDA, TensorRT, CoreML, OpenVINO, DirectML, ROCm e XNNPACK selezionati in fase di build.
Pre-elaborazione lato GPU. Un kernel CUDA fuso opzionale mantiene il letterbox, la normalizzazione e la conversione del layout sul dispositivo per un percorso di input a zero copie.
Download automatico. I nomi dei modelli YOLO noti e gli asset di esempio vengono scaricati automaticamente al primo utilizzo.

Cerchi il pacchetto Python?

Questa pagina copre il crate Rust autonomo. Per il flusso di lavoro Python (addestramento, convalida, esportazione e previsione) vedi la Guida rapida principale e la Modalità Predict. Esporta qualsiasi modello Ultralytics in ONNX con l'integrazione ONNX, quindi eseguilo qui.

Link to this sectionInstallazione#

È richiesto Rust 1.89 o superiore. La funzionalità video richiede inoltre che FFmpeg 7+ sia installato sul sistema.

# Install the command-line tool from crates.io
cargo install ultralytics-inference

# Or with GPU support compiled in
cargo install ultralytics-inference --features cuda,tensorrt

Il binario viene posizionato in ~/.cargo/bin/ultralytics-inference (Linux e macOS) o %USERPROFILE%\.cargo\bin\ su Windows.

Link to this sectionGuida rapida CLI#

La CLI espone un sottocomando predict. Senza argomenti, scarica un modello di rilevamento nano e immagini di esempio, esegue l'inferenza e salva i risultati annotati in runs/detect/predict.

# Detect on the built-in samples (downloads model and images)
ultralytics-inference predict

# Detect on your own image
ultralytics-inference predict --model yolo26n.onnx --source image.jpg

# Segmentation (auto-downloads yolo26n-seg.onnx)
ultralytics-inference predict --task segment --source image.jpg

# Pose on a video, shown live in a window
ultralytics-inference predict --task pose --source video.mp4 --show

# Depth estimation (auto-downloads yolo26n-depth.onnx)
ultralytics-inference predict --task depth --source image.jpg

# Depth with the DepthAnything-style palette (disparity is already the default)
ultralytics-inference predict --task depth --source image.jpg --colormap spectral

# Depth normalized by depth value instead (near = low color, far = high color)
ultralytics-inference predict --task depth --source image.jpg --depth-viz metric

# Tune thresholds and filter to specific classes
ultralytics-inference predict --source image.jpg --conf 0.5 --iou 0.45 --classes "0,1,2"

# Run a whole folder on the GPU in half precision
ultralytics-inference predict --source images/ --device cuda:0 --half

Flag comuni:

Flag	Predefinito	Descrizione
`--model`, `-m`	`yolo26n.onnx`	Percorso verso un modello ONNX; un nome YOLO noto viene scaricato automaticamente.
`--task`	`detect`	Uno tra `detect`, `segment`, `pose`, `obb`, `classify`, `semantic`, `depth`.
`--source`, `-s`	sample	Immagine, directory, glob, video, indice webcam o URL.
`--conf`	`0.25`	Soglia di confidenza.
`--iou`	`0.7`	Soglia IoU per la non-maximum suppression.
`--imgsz`	metadati del modello	Dimensione dell'immagine di inferenza.
`--device`	`cpu`	Dispositivo di esecuzione, ad esempio `cuda:0`, `coreml`, `tensorrt:0`.
`--half`	`false`	Inferenza a mezza precisione FP16.
`--save`	`true`	Salva i risultati annotati in `runs/<task>/predict`.
`--show`	`false`	Visualizza i risultati in una finestra.
`--classes`	all	Filtra i rilevamenti per ID di classe, ad esempio `"0,1,2"`.
`--colormap`	`jet`	Mappa colori della profondità: `jet`, `inferno`, `spectral` o `gray` (solo per la profondità).
`--depth-viz`	`disparity`	Normalizzazione della profondità: `disparity` (profondità inversa, vicino = colore intenso) o `metric` (solo per la profondità).

Link to this sectionGuida rapida alla libreria#

Carica un modello ed esegui una previsione. I metadati del modello come i nomi delle classi, il tipo di task e la dimensione dell'immagine vengono letti automaticamente dal file ONNX.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Metadata (classes, task, imgsz) is parsed from the model.
    let mut model = YOLOModel::load("yolo26n.onnx")?;

    let results = model.predict("image.jpg")?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let conf = boxes.conf()[i];
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("{name} {conf:.2}");
            }
        }
    }

    Ok(())
}

Usa InferenceConfig per controllare le soglie, la dimensione dell'immagine, la precisione e il dispositivo con una builder API:

use ultralytics_inference::{Device, InferenceConfig, YOLOModel};

let config = InferenceConfig::new()
    .with_confidence(0.5)
    .with_iou(0.45)
    .with_imgsz(640, 640)
    .with_device(Device::Cuda(0))
    .with_half(true);

let mut model = YOLOModel::load_with_config("yolo26n.onnx", config)?;
let results = model.predict("image.jpg")?;

Ogni task popola un campo diverso su Results. Ogni scheda qui sotto è un programma completo ed eseguibile; il modello e gli input di esempio vengono scaricati automaticamente al primo avvio. Sostituisci predict_default() con predict("image.jpg") per eseguire il programma sui tuoi file.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let mut model = YOLOModel::load("yolo26n.onnx")?;
    let results = model.predict_default()?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            println!("{} detections", boxes.len());
            let xyxy = boxes.xyxy(); // rows of [x1, y1, x2, y2]
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("  {name} {:.2} {:?}", boxes.conf()[i], xyxy.row(i).to_vec());
            }
        }
    }

    Ok(())
}

Link to this sectionTask supportati#

Tutti i task di Ultralytics sono supportati. Quando --model viene omesso, il modello nano corrispondente per il task selezionato viene scaricato automaticamente.

Compito	`--task`	Output	Modello predefinito
Rilevamento	`detect`	Bounding box e classi	`yolo26n.onnx`
Segmentazione di istanze	`segment`	Box più maschere per istanza	`yolo26n-seg.onnx`
Pose	`pose`	Box più keypoint	`yolo26n-pose.onnx`
Box orientati	`obb`	Bounding box ruotati	`yolo26n-obb.onnx`
Classificazione	`classify`	Probabilità di classe	`yolo26n-cls.onnx`
Segmentazione semantica	`semantic`	Mappa di classe per pixel	`yolo26n-sem.onnx`
Stima della profondità	`depth`	Mappa di profondità per pixel in metri	`yolo26n-depth.onnx`

Link to this sectionCompatibilità del modello#

Qualsiasi modello Ultralytics esportato in ONNX può essere caricato da un file locale. Il download automatico è disponibile per i nomi standard dei modelli YOLO26, YOLO11 e YOLOv8 nelle dimensioni n, s, m, l e x:

Famiglia di modelli	Varianti scaricabili automaticamente
YOLO26	`yolo26{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb`, `-cls`, `-sem` e `-depth`
YOLO11	`yolo11{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb` e `-cls`
YOLOv8	`yolov8{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb` e `-cls`

La segmentazione semantica (-sem) e la stima della profondità (-depth) sono esclusive di YOLO26.

Link to this sectionFonti di input#

L'argomento --source (e il tipo Source nella libreria) accetta molti tipi di input, rilevati automaticamente dalla stringa:

Sorgente	Esempio	Note
Immagine	`image.jpg`	File singolo.
Directory	`images/`	Tutte le immagini nella cartella.
Glob	`images/*.jpg`	Modello in stile shell.
Video	`video.mp4`	Richiede la funzionalità `video`.
Webcam	`0`	Richiede la funzionalità `video`.
Stream	`rtsp://...`	Richiede la funzionalità `video`.
URL	`https://example.com/image.jpg`	Download remoto di un'immagine.

Link to this sectionDispositivi e provider di esecuzione#

L'inferenza viene eseguita su CPU per impostazione predefinita. I backend GPU e acceleratore vengono compilati come funzionalità Cargo e selezionati in fase di runtime con --device (CLI) o Device (libreria).

Stringa del dispositivo	Variante `Device`	Funzionalità di build	Hardware
`cpu`	`Device::Cpu`	incorporato	Qualsiasi CPU
`cuda:0`	`Device::Cuda(0)`	`cuda`	GPU NVIDIA
`tensorrt:0`	`Device::TensorRt(0)`	`tensorrt`	GPU NVIDIA, ottimizzata
`coreml`	`Device::CoreMl`	`coreml`	Apple Silicon / macOS
`openvino`	`Device::OpenVino`	`openvino`	CPU Intel / iGPU
`directml:0`	`Device::DirectMl(0)`	`directml`	GPU Windows
`rocm:0`	`Device::Rocm(0)`	`rocm`	GPU AMD
`xnnpack`	`Device::Xnnpack`	`xnnpack`	CPU ottimizzata

# Build the CLI with the providers you need
cargo install ultralytics-inference --features cuda,tensorrt

Link to this sectionAccelerazione GPU e pre-elaborazione CUDA#

Su hardware NVIDIA, la funzionalità cuda abilita il provider di esecuzione CUDA, e tensorrt aggiunge il provider TensorRT per un'ulteriore ottimizzazione. Per la latenza più bassa possibile, la funzionalità cuda-preprocess sposta la pre-elaborazione sulla GPU.

cuda-preprocess esegue il ridimensionamento letterbox, la normalizzazione e la conversione del layout da HWC a CHW come un singolo kernel CUDA fuso, quindi invia il risultato al modello come tensore di dispositivo zero-copy. Questo rimuove il costo di pre-elaborazione della CPU per immagine e la copia da host a dispositivo, il che è fondamentale per batch ad alto throughput e flussi in tempo reale.

# Build with fused GPU preprocessing (implies cuda + tensorrt)
cargo build --release --features cuda-preprocess

Il percorso veloce viene utilizzato automaticamente, senza modifiche all'API, quando sono soddisfatte tutte le seguenti condizioni: la funzionalità è compilata, il dispositivo è CUDA o TensorRT, il task è detect, segment, pose, OBB, segmentazione semantica o stima della profondità e il modello utilizza input FP32. È abilitato per impostazione predefinita e può essere disattivato per singolo modello:

use ultralytics_inference::{Device, InferenceConfig};

let config = InferenceConfig::new()
    .with_device(Device::TensorRt(0))
    .with_cuda_preprocess(false); // force CPU preprocessing

Abbina il tuo toolkit CUDA

cuda-preprocess richiede un toolkit CUDA corrispondente al momento della compilazione e utilizza NVRTC al runtime per il kernel di pre-elaborazione fuso. Consulta la guida all'accelerazione CUDA e TensorRT per i requisiti di versione e la risoluzione dei problemi.

Link to this sectionFunzionalità Cargo#

Le funzionalità vengono abilitate in fase di compilazione. Le impostazioni predefinite coprono l'annotazione e la visualizzazione in tempo reale.

Funzionalità	Predefinito	Scopo
`annotate`	sì	Disegna riquadri, maschere, keypoint ed etichette; necessario per `--save`.
`visualize`	sì	Visualizzazione della finestra in tempo reale per `--show`.
`video`	no	Leggi e scrivi file video (richiede FFmpeg 7+).
`cuda`	no	Provider di esecuzione NVIDIA CUDA.
`tensorrt`	no	Provider di esecuzione NVIDIA TensorRT.
`cuda-preprocess`	no	Pre-elaborazione GPU fusa con input zero-copy (implica cuda, tensorrt).
`coreml`	no	Provider di esecuzione Apple CoreML.
`openvino`	no	Provider di esecuzione Intel OpenVINO.
`rocm`	no	Provider di esecuzione AMD ROCm.
`directml`	no	Provider di esecuzione Windows DirectML.

Gruppi di convenienza raggruppano i provider correlati: nvidia (cuda, tensorrt), amd (rocm, migraphx), intel (openvino, onednn), mobile (nnapi, coreml, qnn) e all (annotate, visualize, video). Sono disponibili anche ulteriori provider come nnapi, qnn, xnnpack, webgpu e altri.

Abilita le funzionalità durante l'installazione della CLI o l'aggiunta della libreria:

cargo install ultralytics-inference --features video
cargo install ultralytics-inference --features cuda,tensorrt

[dependencies]
ultralytics-inference = { version = "0.0.29", features = ["video"] }

Link to this sectionOutput e salvataggio#

Per impostazione predefinita, le predizioni vengono annotate e salvate in una directory di esecuzione a incremento automatico:

runs/
└── detect/
    └── predict/          # then predict2, predict3, ...
        └── image.jpg     # annotated result

La sottocartella corrisponde al task (runs/segment/, runs/pose/, ecc.). Per le sorgenti video, l'output annotato viene scritto come file video; passa --save-frames per scrivere invece i singoli frame. Per il task semantic, --save-json scrive file PNG della mappa di classe per pixel in una sottocartella results/. Per il task depth, l'immagine annotata viene scritta affiancata, con l'originale accanto alla mappa di profondità colorata. Il salvataggio di immagini e video annotati richiede la funzionalità annotate; l'esportazione in PNG della mappa di classe semantica no. L'input e l'output video richiedono la funzionalità video.

Link to this sectionFAQ#

Link to this sectionHo bisogno di Python installato?#

No. Il crate esegue i modelli ONNX esportati direttamente tramite ONNX Runtime. Python è necessario solo se addestri o esporti modelli con il pacchetto Ultralytics in precedenza.

Link to this sectionQuali modelli posso eseguire?#

Qualsiasi modello Ultralytics YOLO esportato in ONNX, inclusi YOLO26, YOLO11 e YOLOv8. I nomi dei modelli noti vengono scaricati automaticamente; puoi anche puntare --model a qualsiasi file .onnx locale.

Link to this sectionCome ottengo un file del modello?#

Esporta dal pacchetto Python, ad esempio con l'integrazione ONNX, oppure lascia che la CLI scarichi un modello nano standard per l'attività scelta al primo avvio.

Link to this sectionIl video è supportato?#

Sì, con la funzionalità video abilitata e FFmpeg 7+ installato sul sistema. Questo copre file video, webcam e flussi RTSP/RTMP/HTTP.

Link to this sectionCosa fanno le funzionalità `annotate` e `visualize`?#

Entrambe sono abilitate per impostazione predefinita. annotate disegna box, maschere, keypoint ed etichette di classe sull'immagine ed è richiesto da --save per scrivere i risultati annotati. visualize apre una finestra live per --show. Per una build più piccola e headless che restituisce i risultati solo a livello programmatico, disabilitale con cargo build --no-default-features (aggiungi nuovamente le singole funzionalità secondo necessità).

Link to this sectionDove si trova il riferimento completo dell'API?#

Questa pagina è una panoramica di alto livello. Il riferimento completo dell'API, tipo per tipo, per ogni struct pubblica, metodo e opzione di configurazione è pubblicato su docs.rs, generato direttamente dal codice sorgente.

Collaboratori

ONonuralpszr⁸ GLglenn-jocher¹

Creato mese scorsoAggiornato 4 giorni fa