Link to this sectionUltralytics Inference para Rust#

Q: Vídeo é suportado?

Sim, com a funcionalidade video ativada e FFmpeg 7+ instalado no sistema. Isso cobre arquivos de vídeo, webcams e streams RTSP/RTMP/HTTP.

Q: O que as funcionalidades annotate e visualize fazem?

Ambas estão ativadas por padrão. annotate desenha caixas, máscaras, pontos-chave e rótulos de classe na imagem e é necessário para --save gravar resultados anotados. visualize abre uma janela ao vivo para --show. Para uma compilação menor e sem interface gráfica que apenas retorna resultados programaticamente, desative-as com cargo build --no-default-features (adicione de volta funcionalidades individuais conforme necessário).

Ultralytics Inference é uma biblioteca de inferência YOLO de alto desempenho e uma ferramenta de linha de comando escrita em Rust. Ela executa modelos ONNX exportados através do ONNX Runtime para entregar previsões rápidas e com segurança de memória em imagens, vídeos, webcams e transmissões, sem a necessidade de um runtime Python no momento da inferência.

O projeto é distribuído como um único crate, ultralytics-inference, que podes usar de duas formas: como uma CLI para previsões rápidas e jobs em lote, ou como uma biblioteca incorporada diretamente na tua aplicação Rust. Suporta todas as tarefas da Ultralytics e um amplo conjunto de backends de hardware através de uma interface de dispositivo unificada.

Link to this sectionPor que inferência em Rust?#

Velocidade nativa e um tamanho reduzido. Compila para um binário nativo sem interpretador, ideal para servidores, containers e dispositivos de edge.
Segurança de memória. O modelo de ownership do Rust elimina classes inteiras de erros de runtime sem a necessidade de um coletor de lixo.
Todas as tarefas YOLO. Detectar, segmentar, pose, OBB, classificar, segmentação semântica e estimativa de profundidade a partir de uma única API.
Amplo suporte a hardware. CPU além de CUDA, TensorRT, CoreML, OpenVINO, DirectML, ROCm e provedores de execução XNNPACK selecionados no momento da compilação.
Pré-processamento no lado da GPU. Um kernel CUDA fundido opcional mantém o letterbox, normalização e conversão de layout no dispositivo para um caminho de entrada zero-copy.
Download automático. Nomes de modelos YOLO conhecidos e assets de exemplo são descarregados automaticamente na primeira utilização.

À procura do pacote Python?

Esta página cobre o crate Rust independente. Para o fluxo de trabalho em Python (treino, validação, exportação e previsão) consulta o Quickstart principal e o Modo de predição. Exporta qualquer modelo Ultralytics para ONNX com a integração ONNX e, em seguida, executa-o aqui.

Link to this sectionInstalação#

É necessário Rust 1.89 ou superior. A funcionalidade video necessita adicionalmente do FFmpeg 7+ instalado no sistema.

# Install the command-line tool from crates.io
cargo install ultralytics-inference

# Or with GPU support compiled in
cargo install ultralytics-inference --features cuda,tensorrt

O binário é colocado em ~/.cargo/bin/ultralytics-inference (Linux e macOS) ou %USERPROFILE%\.cargo\bin\ no Windows.

Link to this sectionQuickstart da CLI#

A CLI expõe um subcomando predict. Sem argumentos, descarrega um modelo de deteção nano e imagens de exemplo, executa a inferência e guarda os resultados anotados em runs/detect/predict.

# Detect on the built-in samples (downloads model and images)
ultralytics-inference predict

# Detect on your own image
ultralytics-inference predict --model yolo26n.onnx --source image.jpg

# Segmentation (auto-downloads yolo26n-seg.onnx)
ultralytics-inference predict --task segment --source image.jpg

# Pose on a video, shown live in a window
ultralytics-inference predict --task pose --source video.mp4 --show

# Depth estimation (auto-downloads yolo26n-depth.onnx)
ultralytics-inference predict --task depth --source image.jpg

# Depth with the DepthAnything-style palette (disparity is already the default)
ultralytics-inference predict --task depth --source image.jpg --colormap spectral

# Depth normalized by depth value instead (near = low color, far = high color)
ultralytics-inference predict --task depth --source image.jpg --depth-viz metric

# Tune thresholds and filter to specific classes
ultralytics-inference predict --source image.jpg --conf 0.5 --iou 0.45 --classes "0,1,2"

# Run a whole folder on the GPU in half precision
ultralytics-inference predict --source images/ --device cuda:0 --half

Flags comuns:

Flag	Predefinição	Descrição
`--model`, `-m`	`yolo26n.onnx`	Caminho para um modelo ONNX; um nome YOLO conhecido é descarregado automaticamente.
`--task`	`detect`	Um dos `detect`, `segment`, `pose`, `obb`, `classify`, `semantic`, `depth`.
`--source`, `-s`	sample	Imagem, diretório, glob, vídeo, índice de webcam ou URL.
`--conf`	`0.25`	Limiar de confiança.
`--iou`	`0.7`	Limiar de IoU para supressão não-máxima.
`--imgsz`	metadados do modelo	Tamanho da imagem de inferência.
`--device`	`cpu`	Dispositivo de execução, por exemplo `cuda:0`, `coreml`, `tensorrt:0`.
`--half`	`false`	Inferência em meia-precisão FP16.
`--save`	`true`	Guardar resultados anotados em `runs/<task>/predict`.
`--show`	`false`	Exibir resultados numa janela.
`--classes`	all	Filtrar deteções por IDs de classe, por exemplo `"0,1,2"`.
`--colormap`	`jet`	Mapa de cores de profundidade: `jet`, `inferno`, `spectral` ou `gray` (apenas profundidade).
`--depth-viz`	`disparity`	Normalização de profundidade: `disparity` (profundidade inversa, próximo = cor alta) ou `metric` (apenas profundidade).

Link to this sectionQuickstart da biblioteca#

Carrega um modelo e executa uma previsão. Metadados do modelo como nomes de classes, tipo de tarefa e tamanho da imagem são lidos automaticamente a partir do ficheiro ONNX.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Metadata (classes, task, imgsz) is parsed from the model.
    let mut model = YOLOModel::load("yolo26n.onnx")?;

    let results = model.predict("image.jpg")?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let conf = boxes.conf()[i];
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("{name} {conf:.2}");
            }
        }
    }

    Ok(())
}

Usa InferenceConfig para controlar limiares, tamanho da imagem, precisão e dispositivo com uma API de builder:

use ultralytics_inference::{Device, InferenceConfig, YOLOModel};

let config = InferenceConfig::new()
    .with_confidence(0.5)
    .with_iou(0.45)
    .with_imgsz(640, 640)
    .with_device(Device::Cuda(0))
    .with_half(true);

let mut model = YOLOModel::load_with_config("yolo26n.onnx", config)?;
let results = model.predict("image.jpg")?;

Cada tarefa preenche um campo diferente em Results. Cada separador abaixo é um programa completo e executável; o modelo e as entradas de exemplo são descarregados automaticamente na primeira execução. Substitui predict_default() por predict("image.jpg") para executar nos teus próprios ficheiros.

use ultralytics_inference::YOLOModel;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let mut model = YOLOModel::load("yolo26n.onnx")?;
    let results = model.predict_default()?;

    for result in &results {
        if let Some(boxes) = &result.boxes {
            println!("{} detections", boxes.len());
            let xyxy = boxes.xyxy(); // rows of [x1, y1, x2, y2]
            for i in 0..boxes.len() {
                let class_id = boxes.cls()[i] as usize;
                let name = result.names.get(&class_id).map_or("unknown", |s| s.as_str());
                println!("  {name} {:.2} {:?}", boxes.conf()[i], xyxy.row(i).to_vec());
            }
        }
    }

    Ok(())
}

Link to this sectionTarefas suportadas#

Todas as tarefas da Ultralytics são suportadas. Quando --model é omitido, o modelo nano correspondente para a tarefa selecionada é descarregado automaticamente.

Tarefa	`--task`	Saída	Modelo padrão
Deteção	`detect`	Caixas delimitadoras e classes	`yolo26n.onnx`
Segmentação de instâncias	`segment`	Caixas mais máscaras por instância	`yolo26n-seg.onnx`
Pose	`pose`	Caixas mais pontos-chave	`yolo26n-pose.onnx`
Caixas orientadas	`obb`	Caixas delimitadoras rotacionadas	`yolo26n-obb.onnx`
Classificação	`classify`	Probabilidades de classe	`yolo26n-cls.onnx`
Segmentação semântica	`semantic`	Mapa de classes por píxel	`yolo26n-sem.onnx`
Estimativa de profundidade	`depth`	Mapa de profundidade por pixel em metros	`yolo26n-depth.onnx`

Link to this sectionCompatibilidade de modelos#

Qualquer modelo Ultralytics exportado para ONNX pode ser carregado a partir de um ficheiro local. O download automático está disponível para nomes padrão de modelos YOLO26, YOLO11 e YOLOv8 nos tamanhos n, s, m, l e x:

Família de modelos	Variantes de download automático
YOLO26	`yolo26{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb`, `-cls`, `-sem` e `-depth`
YOLO11	`yolo11{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb`, e `-cls`
YOLOv8	`yolov8{n,s,m,l,x}.onnx`, `-seg`, `-pose`, `-obb`, e `-cls`

Segmentação semântica (-sem) e estimativa de profundidade (-depth) são exclusivas do YOLO26.

Link to this sectionFontes de entrada#

O argumento --source (e o tipo Source na biblioteca) aceita muitos tipos de entrada, detetados automaticamente a partir da string:

Origem	Exemplo	Notas
Imagem	`image.jpg`	Ficheiro único.
Diretório	`images/`	Todas as imagens na pasta.
Glob	`images/*.jpg`	Padrão estilo shell.
Vídeo	`video.mp4`	Requer a funcionalidade `video`.
Webcam	`0`	Requer a funcionalidade `video`.
Stream	`rtsp://...`	Requer a funcionalidade `video`.
URL	`https://example.com/image.jpg`	Download de imagem remota.

Link to this sectionDispositivos e provedores de execução#

A inferência é executada na CPU por padrão. Backends de GPU e aceleradores são compilados como funcionalidades Cargo e selecionados em tempo de execução com --device (CLI) ou Device (biblioteca).

String do dispositivo	Variante `Device`	Funcionalidade de compilação	Hardware
`cpu`	`Device::Cpu`	integrado	Qualquer CPU
`cuda:0`	`Device::Cuda(0)`	`cuda`	GPU NVIDIA
`tensorrt:0`	`Device::TensorRt(0)`	`tensorrt`	GPU NVIDIA, otimizado
`coreml`	`Device::CoreMl`	`coreml`	Apple Silicon / macOS
`openvino`	`Device::OpenVino`	`openvino`	CPU / iGPU Intel
`directml:0`	`Device::DirectMl(0)`	`directml`	GPU Windows
`rocm:0`	`Device::Rocm(0)`	`rocm`	GPU AMD
`xnnpack`	`Device::Xnnpack`	`xnnpack`	CPU otimizado

# Build the CLI with the providers you need
cargo install ultralytics-inference --features cuda,tensorrt

Link to this sectionAceleração por GPU e pré-processamento CUDA#

Em hardware NVIDIA, a funcionalidade cuda habilita o provedor de execução CUDA, e tensorrt adiciona o provedor TensorRT para otimização adicional. Para a menor latência possível, a funcionalidade cuda-preprocess move o pré-processamento para a GPU.

cuda-preprocess executa redimensionamento letterbox, normalização e a conversão de layout HWC para CHW como um único kernel CUDA fundido, enviando então o resultado para o modelo como um tensor de dispositivo zero-copy. Isso elimina o custo de pré-processamento na CPU por imagem e a cópia de host para dispositivo, o que é crucial para lotes de alto rendimento e streams em tempo real.

# Build with fused GPU preprocessing (implies cuda + tensorrt)
cargo build --release --features cuda-preprocess

O caminho rápido é usado automaticamente, sem alterações na API, quando todas as condições a seguir são atendidas: o recurso está compilado, o dispositivo é CUDA ou TensorRT, a tarefa é detect, segment, pose, OBB, segmentação semântica ou estimativa de profundidade, e o modelo usa entrada FP32. Ele é habilitado por padrão e pode ser desativado por modelo:

use ultralytics_inference::{Device, InferenceConfig};

let config = InferenceConfig::new()
    .with_device(Device::TensorRt(0))
    .with_cuda_preprocess(false); // force CPU preprocessing

Combine o seu toolkit CUDA

cuda-preprocess requer um toolkit CUDA correspondente no momento da compilação e usa NVRTC em tempo de execução para o kernel de pré-processamento fundido. Consulte o guia de aceleração CUDA e TensorRT para requisitos de versão e solução de problemas.

Link to this sectionFuncionalidades Cargo#

As funcionalidades são ativadas no momento da compilação. Os padrões cobrem anotação e exibição ao vivo.

Funcionalidade	Predefinição	Objetivo
`annotate`	sim	Desenha caixas, máscaras, pontos-chave e rótulos; necessário para `--save`.
`visualize`	sim	Exibição de janela em tempo real para `--show`.
`video`	não	Lê e grava arquivos de vídeo (requer FFmpeg 7+).
`cuda`	não	Provedor de execução NVIDIA CUDA.
`tensorrt`	não	Provedor de execução NVIDIA TensorRT.
`cuda-preprocess`	não	Pré-processamento de GPU fundido com entrada zero-copy (implica cuda, tensorrt).
`coreml`	não	Provedor de execução Apple CoreML.
`openvino`	não	Provedor de execução Intel OpenVINO.
`rocm`	não	Provedor de execução AMD ROCm.
`directml`	não	Provedor de execução Windows DirectML.

Grupos de conveniência agrupam provedores relacionados: nvidia (cuda, tensorrt), amd (rocm, migraphx), intel (openvino, onednn), mobile (nnapi, coreml, qnn) e all (annotate, visualize, video). Provedores adicionais como nnapi, qnn, xnnpack, webgpu e outros também estão disponíveis.

Habilite funcionalidades ao instalar a CLI ou adicionar a biblioteca:

cargo install ultralytics-inference --features video
cargo install ultralytics-inference --features cuda,tensorrt

[dependencies]
ultralytics-inference = { version = "0.0.29", features = ["video"] }

Link to this sectionSaída e salvamento#

Por padrão, as predições são anotadas e salvas em um diretório de execução com incremento automático:

runs/
└── detect/
    └── predict/          # then predict2, predict3, ...
        └── image.jpg     # annotated result

A subpasta corresponde à tarefa (runs/segment/, runs/pose/, etc.). Para fontes de vídeo, a saída anotada é gravada como um arquivo de vídeo; passe --save-frames para gravar quadros individuais. Para a tarefa semantic, --save-json grava PNGs de mapa de classes por pixel em uma subpasta results/. Para a tarefa depth, a imagem anotada é gravada lado a lado, com a original ao lado do mapa de profundidade colorido. O salvamento de imagens e vídeos anotados requer o recurso annotate; a exportação de PNGs de mapa de classes semânticas não. A entrada e saída de vídeo requerem o recurso video.

Link to this sectionFAQ#

Link to this sectionPreciso ter Python instalado?#

Não. O crate executa modelos ONNX exportados diretamente através do ONNX Runtime. Python só é necessário se você treinar ou exportar modelos com o pacote Ultralytics previamente.

Link to this sectionQuais modelos posso executar?#

Qualquer modelo Ultralytics YOLO exportado para ONNX, incluindo YOLO26, YOLO11 e YOLOv8. Nomes de modelos conhecidos são baixados automaticamente; você também pode apontar --model para qualquer arquivo .onnx local.

Link to this sectionComo obtenho um arquivo de modelo?#

Exporte a partir do pacote Python, por exemplo com a integração ONNX, ou deixe a CLI baixar um modelo nano padrão para a tarefa escolhida na primeira execução.

Link to this sectionVídeo é suportado?#

Sim, com a funcionalidade video ativada e FFmpeg 7+ instalado no sistema. Isso cobre arquivos de vídeo, webcams e streams RTSP/RTMP/HTTP.

Link to this sectionO que as funcionalidades `annotate` e `visualize` fazem?#

Ambas estão ativadas por padrão. annotate desenha caixas, máscaras, pontos-chave e rótulos de classe na imagem e é necessário para --save gravar resultados anotados. visualize abre uma janela ao vivo para --show. Para uma compilação menor e sem interface gráfica que apenas retorna resultados programaticamente, desative-as com cargo build --no-default-features (adicione de volta funcionalidades individuais conforme necessário).

Link to this sectionOnde está a referência completa da API?#

Esta página é uma visão geral de alto nível. A referência completa da API, tipo por tipo, para cada struct, método e opção de configuração pública é publicada no docs.rs, gerada diretamente a partir do código-fonte.

Contribuidores

ONonuralpszr⁸ GLglenn-jocher¹

Criado mês passadoAtualizado há 4 dias