Meet YOLO26: next-gen vision AI.

Link to this sectionGuia de Início Rápido: NVIDIA DGX Spark com Ultralytics YOLO26#

Este guia abrangente fornece um passo a passo detalhado para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark, o supercomputador de IA de desktop compacto da NVIDIA. Além disso, apresenta benchmarks de desempenho para demonstrar as capacidades do YOLO26 neste sistema poderoso.

NVIDIA DGX Spark AI workstation overview

Nota

Este guia foi testado com o NVIDIA DGX Spark Founders Edition executando o DGX OS baseado em Ubuntu. Espera-se que funcione com as versões mais recentes do DGX OS.

Link to this sectionO que é o NVIDIA DGX Spark?#

O NVIDIA DGX Spark é um supercomputador de IA de desktop compacto equipado com o superchip NVIDIA GB10 Grace Blackwell. Ele oferece até 1 petaFLOP de desempenho de computação de IA com precisão FP4, tornando-o ideal para desenvolvedores, pesquisadores e cientistas de dados que precisam de recursos poderosos de IA em um formato de desktop.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Link to this sectionPrincipais Especificações#

EspecificaçãoDetalhes
Desempenho de IAAté 1 PFLOP (FP4)
GPUArquitetura NVIDIA Blackwell com Tensor Cores de 5ª Geração, RT Cores de 4ª Geração
CPUProcessador Arm de 20 núcleos (10 Cortex-X925 + 10 Cortex-A725)
Memória128 GB de memória de sistema unificada LPDDR5x, interface de 256 bits, 4266 MHz, largura de banda de 273 GB/s
Armazenamento1 TB ou 4 TB NVMe M.2 com autocriptografia
Rede1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4
Conectividade4x USB Type-C, 1x HDMI 2.1a, áudio multicanal HDMI
Processamento de Vídeo1x NVENC, 1x NVDEC

Link to this sectionDGX OS#

NVIDIA DGX OS é uma distribuição Linux customizada que fornece uma base de sistema operacional estável, testada e suportada para executar aplicações de IA, aprendizado de máquina e análise em sistemas DGX. Ele inclui:

  • Uma base Linux robusta otimizada para cargas de trabalho de IA
  • Drivers e configurações de sistema pré-configurados para hardware NVIDIA
  • Atualizações de segurança e capacidades de manutenção do sistema
  • Compatibilidade com o ecossistema de software mais amplo da NVIDIA

O DGX OS segue um cronograma de lançamento regular, com atualizações normalmente fornecidas duas vezes por ano (por volta de fevereiro e agosto), com patches de segurança adicionais fornecidos entre os lançamentos principais.

Link to this sectionDGX Dashboard#

O DGX Spark vem com um DGX Dashboard integrado que fornece:

  • Monitoramento de Sistema em Tempo Real: Visão geral das métricas operacionais atuais do sistema
  • Atualizações do Sistema: Capacidade de aplicar atualizações diretamente pelo painel
  • Configurações do Sistema: Alterar nome do dispositivo e outras configurações
  • JupyterLab Integrado: Acesse Jupyter Notebooks locais para desenvolvimento

NVIDIA DGX management dashboard interface

Link to this sectionAcessando o Dashboard#

Clique no botão "Show Apps" no canto inferior esquerdo da área de trabalho do Ubuntu e selecione "DGX Dashboard" para abri-lo no seu navegador.

JupyterLab Integrado

O painel inclui uma instância de JupyterLab integrada que cria automaticamente um ambiente virtual e instala os pacotes recomendados ao iniciar. Cada conta de usuário recebe uma porta dedicada para acesso ao JupyterLab.

Link to this sectionInício Rápido com Docker#

A maneira mais rápida de começar com o Ultralytics YOLO26 no NVIDIA DGX Spark é executar com imagens docker pré-construídas. A mesma imagem Docker que suporta Jetson AGX Thor (JetPack 7.0) funciona no DGX Spark com DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

Após isso, pule para a seção Use TensorRT on NVIDIA DGX Spark section.

Link to this sectionComeçar com Instalação Nativa#

Para uma instalação nativa sem Docker, siga estas etapas.

Link to this sectionInstalar o Pacote Ultralytics#

Aqui, vamos instalar o pacote Ultralytics no DGX Spark com dependências opcionais para que possamos exportar os modelos PyTorch para outros formatos diferentes. Focaremos principalmente em NVIDIA TensorRT exports porque o TensorRT garantirá que possamos obter o desempenho máximo do DGX Spark.

  1. Atualize a lista de pacotes, instale o pip e atualize para a versão mais recente

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. Instale o pacote pip ultralytics com dependências opcionais

    pip install ultralytics[export]
  3. Reinicie o dispositivo

    sudo reboot

Link to this sectionInstalar PyTorch e Torchvision#

A instalação do ultralytics acima instalará o Torch e o Torchvision. No entanto, esses pacotes instalados via pip podem não estar totalmente otimizados para a arquitetura ARM64 do DGX Spark com CUDA 13. Portanto, recomendamos instalar as versões compatíveis com CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
Info

Ao executar o PyTorch 2.9.1 no NVIDIA DGX Spark, você pode encontrar o seguinte UserWarning ao inicializar o CUDA (por exemplo, executando yolo checks, yolo predict, etc.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Este aviso pode ser ignorado com segurança. Para resolver isso permanentemente, uma correção foi enviada no PR do PyTorch #164590, que será incluída no lançamento do PyTorch 2.10.

Link to this sectionInstalar onnxruntime-gpu#

O pacote onnxruntime-gpu hospedado no PyPI não possui binários aarch64 para sistemas ARM64. Portanto, precisamos instalar este pacote manualmente. Este pacote é necessário para algumas das exportações.

Aqui, vamos baixar e instalar o onnxruntime-gpu 1.24.0 com suporte a Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Link to this sectionUsar TensorRT no NVIDIA DGX Spark#

Entre todos os formatos de exportação de modelo suportados pelo Ultralytics, o TensorRT oferece o maior desempenho de inferência no NVIDIA DGX Spark, tornando-o nossa recomendação principal para implantações. Para instruções de configuração e uso avançado, consulte nosso guia de integração dedicado ao TensorRT.

Link to this sectionConverter Modelo para TensorRT e Executar Inferência#

O modelo YOLO26n em formato PyTorch é convertido para TensorRT para executar a inferência com o modelo exportado.

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Nota

Visite a página de Exportação para acessar argumentos adicionais ao exportar modelos para diferentes formatos de modelo

Link to this sectionBenchmarks do YOLO11 no NVIDIA DGX Spark#

Os benchmarks do YOLO11 foram executados pela equipe da Ultralytics em vários formatos de modelo, medindo velocidade e precisão: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Os benchmarks foram executados no NVIDIA DGX Spark com precisão FP32 e tamanho de imagem de entrada padrão de 640.

Link to this sectionTabela de comparação detalhada#

A tabela abaixo representa os resultados de benchmark para cinco modelos diferentes (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) em vários formatos, nos dando o status, tamanho, métrica mAP50-95(B) e tempo de inferência para cada combinação.

Desempenho
FormatoStatusTamanho em disco (MB)mAP50-95(B)Tempo de inferência (ms/im)
PyTorch5,40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

Benchmarked com Ultralytics 8.3.249

Link to this sectionReproduza os nossos resultados#

Para reproduzir os benchmarks Ultralytics acima em todos os formatos de exportação, execute este código:

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Note que os resultados dos benchmarks podem variar de acordo com a configuração exata de hardware e software do sistema, assim como a carga de trabalho atual do sistema no momento em que os benchmarks são executados. Para resultados mais confiáveis, use um conjunto de dados com um grande número de imagens, por exemplo, data='coco.yaml' (5000 imagens de validação).

Link to this sectionMelhores práticas para o NVIDIA DGX Spark#

Ao usar o NVIDIA DGX Spark, existem algumas melhores práticas a seguir para permitir o desempenho máximo ao executar o YOLO26.

  1. Monitore o desempenho do sistema

    Use as ferramentas de monitoramento da NVIDIA para rastrear a utilização de GPU e CPU:

    nvidia-smi
  2. Otimize o uso de memória

    Com 128GB de memória unificada, o DGX Spark pode lidar com grandes tamanhos de lote e modelos. Considere aumentar o tamanho do lote para melhorar o rendimento:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. Use TensorRT com FP16 ou INT8

    Para obter o melhor desempenho, exporte modelos com precisão FP16 ou INT8:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Link to this sectionAtualizações de sistema (Founders Edition)#

Manter o seu DGX Spark Founders Edition atualizado é crucial para o desempenho e a segurança. A NVIDIA fornece dois métodos principais para atualizar o SO do sistema, drivers e firmware.

Link to this sectionUsando o DGX Dashboard (Recomendado)#

O DGX Dashboard é a forma recomendada de realizar atualizações de sistema garantindo a compatibilidade. Ele permite que você:

  • Visualize atualizações de sistema disponíveis
  • Instale patches de segurança e atualizações de sistema
  • Gerencie atualizações de driver e firmware da NVIDIA

Link to this sectionAtualizações manuais de sistema#

Para usuários avançados, as atualizações podem ser realizadas manualmente via terminal:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
Aviso

Certifique-se de que seu sistema esteja conectado a uma fonte de energia estável e que você tenha feito backup de dados críticos antes de realizar as atualizações.

Link to this sectionPróximos passos#

Para mais aprendizado e suporte, veja a documentação do Ultralytics YOLO26.

Link to this sectionFAQ#

Link to this sectionComo faço para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark?#

Implantar o Ultralytics YOLO26 no NVIDIA DGX Spark é direto. Você pode usar a imagem Docker pré-construída para uma configuração rápida ou instalar manualmente os pacotes necessários. Passos detalhados para cada abordagem podem ser encontrados nas seções Início rápido com Docker e Início com instalação nativa.

Link to this sectionQue desempenho posso esperar do YOLO26 no NVIDIA DGX Spark?#

Os modelos YOLO26 oferecem excelente desempenho no DGX Spark graças ao superchip GB10 Grace Blackwell. O formato TensorRT oferece o melhor desempenho de inferência. Confira a seção Tabela de comparação detalhada para resultados de benchmark específicos em diferentes tamanhos e formatos de modelos.

Link to this sectionPor que devo usar o TensorRT para o YOLO26 no DGX Spark?#

O TensorRT é altamente recomendado para implantar modelos YOLO26 no DGX Spark devido ao seu desempenho ideal. Ele acelera a inferência aproveitando as capacidades da GPU Blackwell, garantindo máxima eficiência e velocidade. Saiba mais na seção Use o TensorRT no NVIDIA DGX Spark.

Link to this sectionComo o DGX Spark se compara aos dispositivos Jetson para o YOLO26?#

O DGX Spark oferece até 1 PFLOP de desempenho de IA e 128GB de memória unificada, em comparação com os 2070 TFLOPS e 128GB de memória do Jetson AGX Thor. O DGX Spark foi projetado como um supercomputador de IA de desktop, enquanto os dispositivos Jetson são sistemas embarcados otimizados para implantação na borda (edge).

Link to this sectionPosso usar a mesma imagem Docker para o DGX Spark e o Jetson AGX Thor?#

Sim! A imagem Docker ultralytics/ultralytics:latest-nvidia-arm64 suporta tanto o NVIDIA DGX Spark (com DGX OS) quanto o Jetson AGX Thor (com JetPack 7.0), já que ambos usam arquitetura ARM64 com CUDA 13 e pilhas de software similares.

Comentários