Guia de Início Rápido: NVIDIA DGX Spark com Ultralytics YOLO26

Este guia abrangente fornece um passo a passo detalhado para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark, o supercomputador desktop de IA compacto da NVIDIA. Além disso, apresenta benchmarks de desempenho para demonstrar as capacidades do YOLO26 neste sistema poderoso.

NVIDIA DGX Spark AI workstation overview

Nota

Este guia foi testado com o NVIDIA DGX Spark Founders Edition executando o DGX OS baseado em Ubuntu. Espera-se que funcione com as versões mais recentes do DGX OS.

O que é o NVIDIA DGX Spark?

O NVIDIA DGX Spark é um supercomputador desktop de IA compacto equipado com o superchip NVIDIA GB10 Grace Blackwell. Ele oferece até 1 petaFLOP de desempenho de computação de IA com precisão FP4, tornando-o ideal para desenvolvedores, pesquisadores e cientistas de dados que precisam de recursos avançados de IA em um formato desktop.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Especificações Principais

EspecificaçãoDetalhes
Desempenho de IAAté 1 PFLOP (FP4)
GPUArquitetura NVIDIA Blackwell com Tensor Cores de 5ª Geração, RT Cores de 4ª Geração
CPUProcessador Arm de 20 núcleos (10 Cortex-X925 + 10 Cortex-A725)
Memória128 GB de memória de sistema unificada LPDDR5x, interface de 256 bits, 4266 MHz, largura de banda de 273 GB/s
Armazenamento1 TB ou 4 TB NVMe M.2 com autocriptografia
Rede1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4
Conectividade4x USB Tipo-C, 1x HDMI 2.1a, áudio multicanal HDMI
Processamento de Vídeo1x NVENC, 1x NVDEC

DGX OS

NVIDIA DGX OS é uma distribuição Linux customizada que fornece uma base de sistema operacional estável, testada e com suporte para executar aplicações de IA, aprendizado de máquina e análise em sistemas DGX. Ele inclui:

  • Uma base Linux robusta otimizada para cargas de trabalho de IA
  • Drivers e configurações de sistema pré-configurados para hardware NVIDIA
  • Atualizações de segurança e recursos de manutenção do sistema
  • Compatibilidade com o ecossistema de software NVIDIA mais amplo

O DGX OS segue um cronograma regular de lançamentos, com atualizações normalmente fornecidas duas vezes por ano (por volta de fevereiro e agosto), com patches de segurança adicionais fornecidos entre grandes lançamentos.

DGX Dashboard

O DGX Spark vem com um DGX Dashboard integrado que fornece:

  • Monitoramento de Sistema em Tempo Real: Visão geral das métricas operacionais atuais do sistema
  • Atualizações do Sistema: Capacidade de aplicar atualizações diretamente do painel
  • Configurações do Sistema: Alterar o nome do dispositivo e outras configurações
  • JupyterLab Integrado: Acesse Jupyter Notebooks locais para desenvolvimento

NVIDIA DGX management dashboard interface

Acessando o Dashboard

Clique no botão "Mostrar Aplicativos" no canto inferior esquerdo da área de trabalho do Ubuntu e selecione "DGX Dashboard" para abri-lo no seu navegador.

JupyterLab Integrado

O painel inclui uma instância integrada do JupyterLab que cria automaticamente um ambiente virtual e instala os pacotes recomendados ao ser iniciado. Cada conta de usuário recebe uma porta dedicada para acesso ao JupyterLab.

Início Rápido com Docker

A maneira mais rápida de começar com o Ultralytics YOLO26 no NVIDIA DGX Spark é rodar com imagens Docker pré-construídas. A mesma imagem Docker que suporta o Jetson AGX Thor (JetPack 7.0) funciona no DGX Spark com o DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

Depois de fazer isso, pule para a seção Usar TensorRT no NVIDIA DGX Spark.

Começar com Instalação Nativa

Para uma instalação nativa sem o Docker, siga estes passos.

Instalar o Pacote Ultralytics

Aqui instalaremos o pacote Ultralytics no DGX Spark com dependências opcionais para que possamos exportar os modelos PyTorch para outros formatos diferentes. Focaremos principalmente em exportações NVIDIA TensorRT, pois o TensorRT garantirá que possamos obter o desempenho máximo do DGX Spark.

  1. Atualize a lista de pacotes, instale o pip e atualize para a versão mais recente

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. Instale o pacote pip ultralytics com dependências opcionais

    pip install ultralytics[export]
  3. Reinicie o dispositivo

    sudo reboot

Instale o PyTorch e o Torchvision

A instalação do ultralytics acima instalará o Torch e o Torchvision. No entanto, esses pacotes instalados via pip podem não estar totalmente otimizados para a arquitetura ARM64 do DGX Spark com CUDA 13. Portanto, recomendamos instalar as versões compatíveis com CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
Informações

Ao executar o PyTorch 2.9.1 no NVIDIA DGX Spark, você pode encontrar o seguinte UserWarning ao inicializar o CUDA (por exemplo, ao executar yolo checks, yolo predict, etc.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Este aviso pode ser ignorado com segurança. Para resolver isso permanentemente, uma correção foi enviada no PR do PyTorch #164590, que será incluída no lançamento do PyTorch 2.10.

Instale o onnxruntime-gpu

O pacote onnxruntime-gpu hospedado no PyPI não possui binários aarch64 para sistemas ARM64. Portanto, precisamos instalar este pacote manualmente. Este pacote é necessário para algumas das exportações.

Aqui, baixaremos e instalaremos o onnxruntime-gpu 1.24.0 com suporte a Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Usar TensorRT no NVIDIA DGX Spark

Dentre todos os formatos de exportação de modelo suportados pelo Ultralytics, o TensorRT oferece o maior desempenho de inferência no NVIDIA DGX Spark, tornando-o nossa principal recomendação para implantações. Para instruções de configuração e uso avançado, consulte nosso guia de integração dedicado ao TensorRT.

Converter Modelo para TensorRT e Executar Inferência

O modelo YOLO26n em formato PyTorch é convertido para TensorRT para executar a inferência com o modelo exportado.

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Nota

Visite a página de Exportação para acessar argumentos adicionais ao exportar modelos para diferentes formatos de modelo

Benchmarks YOLO11 no NVIDIA DGX Spark

Os benchmarks do YOLO11 foram executados pela equipe do Ultralytics em vários formatos de modelo, medindo velocidade e precisão: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Os benchmarks foram executados no NVIDIA DGX Spark com precisão FP32 e um tamanho de imagem de entrada padrão de 640.

Tabela de comparação detalhada

A tabela abaixo apresenta os resultados dos benchmarks para cinco modelos diferentes (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) em vários formatos, fornecendo o status, tamanho, métrica mAP50-95(B) e tempo de inferência para cada combinação.

Desempenho
FormatoStatusTamanho em disco (MB)mAP50-95(B)Tempo de inferência (ms/im)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25,70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

Benchmark realizado com Ultralytics 8.3.249

Reproduza nossos resultados

Para reproduzir os benchmarks acima do Ultralytics em todos os formatos de exportação, execute este código:

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Note que os resultados dos benchmarks podem variar com base na configuração exata de hardware e software de um sistema, bem como na carga de trabalho atual do sistema no momento em que os benchmarks são executados. Para obter os resultados mais confiáveis, use um conjunto de dados com um grande número de imagens, por exemplo, data='coco.yaml' (5000 imagens de validação).

Melhores práticas para NVIDIA DGX Spark

Ao usar o NVIDIA DGX Spark, há algumas melhores práticas a serem seguidas para permitir o desempenho máximo ao executar o YOLO26.

  1. Monitore o desempenho do sistema

    Use as ferramentas de monitoramento da NVIDIA para rastrear a utilização de GPU e CPU:

    nvidia-smi
  2. Otimize o uso da memória

    Com 128GB de memória unificada, o DGX Spark pode lidar com grandes tamanhos de lote e modelos. Considere aumentar o tamanho do lote para melhorar o throughput:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. Use TensorRT com FP16 ou INT8

    Para obter o melhor desempenho, exporte modelos com precisão FP16 ou INT8:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Atualizações do sistema (Founders Edition)

Manter o seu DGX Spark Founders Edition atualizado é crucial para o desempenho e segurança. A NVIDIA fornece dois métodos principais para atualizar o SO do sistema, drivers e firmware.

Usando o DGX Dashboard (Recomendado)

O DGX Dashboard é a maneira recomendada de realizar atualizações do sistema, garantindo compatibilidade. Ele permite que você:

  • Visualize atualizações de sistema disponíveis
  • Instale patches de segurança e atualizações de sistema
  • Gerencie atualizações de driver e firmware da NVIDIA

Atualizações manuais do sistema

Para usuários avançados, as atualizações podem ser realizadas manualmente via terminal:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
Aviso

Certifique-se de que o seu sistema esteja conectado a uma fonte de energia estável e que você fez backup de dados críticos antes de realizar as atualizações.

Próximos passos

Para mais aprendizado e suporte, veja a Documentação do Ultralytics YOLO26.

FAQ

Como faço para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark?

Implantar o Ultralytics YOLO26 no NVIDIA DGX Spark é simples. Você pode usar a imagem Docker pré-construída para uma configuração rápida ou instalar manualmente os pacotes necessários. Passos detalhados para cada abordagem podem ser encontrados nas seções Quick Start with Docker e Start with Native Installation.

Qual desempenho posso esperar do YOLO26 no NVIDIA DGX Spark?

Os modelos YOLO26 oferecem excelente desempenho no DGX Spark graças ao superchip GB10 Grace Blackwell. O formato TensorRT proporciona o melhor desempenho de inferência. Verifique a seção Detailed Comparison Table para resultados específicos de benchmark em diferentes tamanhos e formatos de modelo.

Por que devo usar TensorRT para o YOLO26 no DGX Spark?

O TensorRT é altamente recomendado para implantar modelos YOLO26 no DGX Spark devido ao seu desempenho ideal. Ele acelera a inferência aproveitando as capacidades da GPU Blackwell, garantindo máxima eficiência e velocidade. Saiba mais na seção Use TensorRT on NVIDIA DGX Spark.

Como o DGX Spark se compara aos dispositivos Jetson para o YOLO26?

O DGX Spark oferece significativamente mais poder computacional do que os dispositivos Jetson, com até 1 PFLOP de desempenho de IA e 128GB de memória unificada, em comparação com os 2070 TFLOPS e 128GB de memória do Jetson AGX Thor. O DGX Spark foi projetado como um supercomputador de IA de mesa, enquanto os dispositivos Jetson são sistemas embarcados otimizados para implantação na borda (edge).

Posso usar a mesma imagem Docker para DGX Spark e Jetson AGX Thor?

Sim! A imagem Docker ultralytics/ultralytics:latest-nvidia-arm64 suporta tanto o NVIDIA DGX Spark (com DGX OS) quanto o Jetson AGX Thor (com JetPack 7.0), pois ambos usam arquitetura ARM64 com CUDA 13 e pilhas de software semelhantes.

Comentários