Link to this sectionGuia de Início Rápido: NVIDIA DGX Spark com Ultralytics YOLO26#
Este guia abrangente fornece um passo a passo detalhado para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark, o supercomputador de IA de desktop compacto da NVIDIA. Além disso, apresenta benchmarks de desempenho para demonstrar as capacidades do YOLO26 neste sistema poderoso.
Este guia foi testado com o NVIDIA DGX Spark Founders Edition executando o DGX OS baseado em Ubuntu. Espera-se que funcione com as versões mais recentes do DGX OS.
Link to this sectionO que é o NVIDIA DGX Spark?#
O NVIDIA DGX Spark é um supercomputador de IA de desktop compacto equipado com o superchip NVIDIA GB10 Grace Blackwell. Ele oferece até 1 petaFLOP de desempenho de computação de IA com precisão FP4, tornando-o ideal para desenvolvedores, pesquisadores e cientistas de dados que precisam de recursos poderosos de IA em um formato de desktop.
Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference
Link to this sectionPrincipais Especificações#
| Especificação | Detalhes |
|---|---|
| Desempenho de IA | Até 1 PFLOP (FP4) |
| GPU | Arquitetura NVIDIA Blackwell com Tensor Cores de 5ª Geração, RT Cores de 4ª Geração |
| CPU | Processador Arm de 20 núcleos (10 Cortex-X925 + 10 Cortex-A725) |
| Memória | 128 GB de memória de sistema unificada LPDDR5x, interface de 256 bits, 4266 MHz, largura de banda de 273 GB/s |
| Armazenamento | 1 TB ou 4 TB NVMe M.2 com autocriptografia |
| Rede | 1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4 |
| Conectividade | 4x USB Type-C, 1x HDMI 2.1a, áudio multicanal HDMI |
| Processamento de Vídeo | 1x NVENC, 1x NVDEC |
Link to this sectionDGX OS#
NVIDIA DGX OS é uma distribuição Linux customizada que fornece uma base de sistema operacional estável, testada e suportada para executar aplicações de IA, aprendizado de máquina e análise em sistemas DGX. Ele inclui:
- Uma base Linux robusta otimizada para cargas de trabalho de IA
- Drivers e configurações de sistema pré-configurados para hardware NVIDIA
- Atualizações de segurança e capacidades de manutenção do sistema
- Compatibilidade com o ecossistema de software mais amplo da NVIDIA
O DGX OS segue um cronograma de lançamento regular, com atualizações normalmente fornecidas duas vezes por ano (por volta de fevereiro e agosto), com patches de segurança adicionais fornecidos entre os lançamentos principais.
Link to this sectionDGX Dashboard#
O DGX Spark vem com um DGX Dashboard integrado que fornece:
- Monitoramento de Sistema em Tempo Real: Visão geral das métricas operacionais atuais do sistema
- Atualizações do Sistema: Capacidade de aplicar atualizações diretamente pelo painel
- Configurações do Sistema: Alterar nome do dispositivo e outras configurações
- JupyterLab Integrado: Acesse Jupyter Notebooks locais para desenvolvimento
Link to this sectionAcessando o Dashboard#
Clique no botão "Show Apps" no canto inferior esquerdo da área de trabalho do Ubuntu e selecione "DGX Dashboard" para abri-lo no seu navegador.
O painel inclui uma instância de JupyterLab integrada que cria automaticamente um ambiente virtual e instala os pacotes recomendados ao iniciar. Cada conta de usuário recebe uma porta dedicada para acesso ao JupyterLab.
Link to this sectionInício Rápido com Docker#
A maneira mais rápida de começar com o Ultralytics YOLO26 no NVIDIA DGX Spark é executar com imagens docker pré-construídas. A mesma imagem Docker que suporta Jetson AGX Thor (JetPack 7.0) funciona no DGX Spark com DGX OS.
t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $tApós isso, pule para a seção Use TensorRT on NVIDIA DGX Spark section.
Link to this sectionComeçar com Instalação Nativa#
Para uma instalação nativa sem Docker, siga estas etapas.
Link to this sectionInstalar o Pacote Ultralytics#
Aqui, vamos instalar o pacote Ultralytics no DGX Spark com dependências opcionais para que possamos exportar os modelos PyTorch para outros formatos diferentes. Focaremos principalmente em NVIDIA TensorRT exports porque o TensorRT garantirá que possamos obter o desempenho máximo do DGX Spark.
-
Atualize a lista de pacotes, instale o pip e atualize para a versão mais recente
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Instale o pacote pip
ultralyticscom dependências opcionaispip install ultralytics[export] -
Reinicie o dispositivo
sudo reboot
Link to this sectionInstalar PyTorch e Torchvision#
A instalação do ultralytics acima instalará o Torch e o Torchvision. No entanto, esses pacotes instalados via pip podem não estar totalmente otimizados para a arquitetura ARM64 do DGX Spark com CUDA 13. Portanto, recomendamos instalar as versões compatíveis com CUDA 13:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130Ao executar o PyTorch 2.9.1 no NVIDIA DGX Spark, você pode encontrar o seguinte UserWarning ao inicializar o CUDA (por exemplo, executando yolo checks, yolo predict, etc.):
UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)Este aviso pode ser ignorado com segurança. Para resolver isso permanentemente, uma correção foi enviada no PR do PyTorch #164590, que será incluída no lançamento do PyTorch 2.10.
Link to this sectionInstalar onnxruntime-gpu#
O pacote onnxruntime-gpu hospedado no PyPI não possui binários aarch64 para sistemas ARM64. Portanto, precisamos instalar este pacote manualmente. Este pacote é necessário para algumas das exportações.
Aqui, vamos baixar e instalar o onnxruntime-gpu 1.24.0 com suporte a Python3.12.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlLink to this sectionUsar TensorRT no NVIDIA DGX Spark#
Entre todos os formatos de exportação de modelo suportados pelo Ultralytics, o TensorRT oferece o maior desempenho de inferência no NVIDIA DGX Spark, tornando-o nossa recomendação principal para implantações. Para instruções de configuração e uso avançado, consulte nosso guia de integração dedicado ao TensorRT.
Link to this sectionConverter Modelo para TensorRT e Executar Inferência#
O modelo YOLO26n em formato PyTorch é convertido para TensorRT para executar a inferência com o modelo exportado.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")Visite a página de Exportação para acessar argumentos adicionais ao exportar modelos para diferentes formatos de modelo
Link to this sectionBenchmarks do YOLO11 no NVIDIA DGX Spark#
Os benchmarks do YOLO11 foram executados pela equipe da Ultralytics em vários formatos de modelo, medindo velocidade e precisão: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Os benchmarks foram executados no NVIDIA DGX Spark com precisão FP32 e tamanho de imagem de entrada padrão de 640.
Link to this sectionTabela de comparação detalhada#
A tabela abaixo representa os resultados de benchmark para cinco modelos diferentes (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) em vários formatos, nos dando o status, tamanho, métrica mAP50-95(B) e tempo de inferência para cada combinação.
| Formato | Status | Tamanho em disco (MB) | mAP50-95(B) | Tempo de inferência (ms/im) |
|---|---|---|---|---|
| PyTorch | ✅ | 5,4 | 0.5071 | 2.67 |
| TorchScript | ✅ | 10.5 | 0.5083 | 2.62 |
| ONNX | ✅ | 10.2 | 0.5074 | 5.92 |
| OpenVINO | ✅ | 10.4 | 0.5058 | 14.95 |
| TensorRT (FP32) | ✅ | 12.8 | 0.5085 | 1.95 |
| TensorRT (FP16) | ✅ | 7.0 | 0.5068 | 1.01 |
| TensorRT (INT8) | ✅ | 18.6 | 0.4880 | 1.62 |
| TF SavedModel | ✅ | 25.7 | 0.5076 | 36.39 |
| TF GraphDef | ✅ | 10.3 | 0.5076 | 41.06 |
| TF Lite | ✅ | 10.3 | 0.5075 | 64.36 |
| MNN | ✅ | 10.1 | 0.5075 | 12.14 |
| NCNN | ✅ | 10.2 | 0.5041 | 12.31 |
| ExecuTorch | ✅ | 10.2 | 0.5075 | 27.61 |
Benchmarked com Ultralytics 8.3.249
Link to this sectionReproduza os nossos resultados#
Para reproduzir os benchmarks Ultralytics acima em todos os formatos de exportação, execute este código:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)Note que os resultados dos benchmarks podem variar de acordo com a configuração exata de hardware e software do sistema, assim como a carga de trabalho atual do sistema no momento em que os benchmarks são executados. Para resultados mais confiáveis, use um conjunto de dados com um grande número de imagens, por exemplo, data='coco.yaml' (5000 imagens de validação).
Link to this sectionMelhores práticas para o NVIDIA DGX Spark#
Ao usar o NVIDIA DGX Spark, existem algumas melhores práticas a seguir para permitir o desempenho máximo ao executar o YOLO26.
-
Monitore o desempenho do sistema
Use as ferramentas de monitoramento da NVIDIA para rastrear a utilização de GPU e CPU:
nvidia-smi -
Otimize o uso de memória
Com 128GB de memória unificada, o DGX Spark pode lidar com grandes tamanhos de lote e modelos. Considere aumentar o tamanho do lote para melhorar o rendimento:
from ultralytics import YOLO model = YOLO("yolo26n.engine") results = model.predict(source="path/to/images", batch=16) -
Use TensorRT com FP16 ou INT8
Para obter o melhor desempenho, exporte modelos com precisão FP16 ou INT8:
yolo export model=yolo26n.pt format=engine half=True # FP16 yolo export model=yolo26n.pt format=engine int8=True # INT8
Link to this sectionAtualizações de sistema (Founders Edition)#
Manter o seu DGX Spark Founders Edition atualizado é crucial para o desempenho e a segurança. A NVIDIA fornece dois métodos principais para atualizar o SO do sistema, drivers e firmware.
Link to this sectionUsando o DGX Dashboard (Recomendado)#
O DGX Dashboard é a forma recomendada de realizar atualizações de sistema garantindo a compatibilidade. Ele permite que você:
- Visualize atualizações de sistema disponíveis
- Instale patches de segurança e atualizações de sistema
- Gerencie atualizações de driver e firmware da NVIDIA
Link to this sectionAtualizações manuais de sistema#
Para usuários avançados, as atualizações podem ser realizadas manualmente via terminal:
sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo rebootCertifique-se de que seu sistema esteja conectado a uma fonte de energia estável e que você tenha feito backup de dados críticos antes de realizar as atualizações.
Link to this sectionPróximos passos#
Para mais aprendizado e suporte, veja a documentação do Ultralytics YOLO26.
Link to this sectionFAQ#
Link to this sectionComo faço para implantar o Ultralytics YOLO26 no NVIDIA DGX Spark?#
Implantar o Ultralytics YOLO26 no NVIDIA DGX Spark é direto. Você pode usar a imagem Docker pré-construída para uma configuração rápida ou instalar manualmente os pacotes necessários. Passos detalhados para cada abordagem podem ser encontrados nas seções Início rápido com Docker e Início com instalação nativa.
Link to this sectionQue desempenho posso esperar do YOLO26 no NVIDIA DGX Spark?#
Os modelos YOLO26 oferecem excelente desempenho no DGX Spark graças ao superchip GB10 Grace Blackwell. O formato TensorRT oferece o melhor desempenho de inferência. Confira a seção Tabela de comparação detalhada para resultados de benchmark específicos em diferentes tamanhos e formatos de modelos.
Link to this sectionPor que devo usar o TensorRT para o YOLO26 no DGX Spark?#
O TensorRT é altamente recomendado para implantar modelos YOLO26 no DGX Spark devido ao seu desempenho ideal. Ele acelera a inferência aproveitando as capacidades da GPU Blackwell, garantindo máxima eficiência e velocidade. Saiba mais na seção Use o TensorRT no NVIDIA DGX Spark.
Link to this sectionComo o DGX Spark se compara aos dispositivos Jetson para o YOLO26?#
O DGX Spark oferece até 1 PFLOP de desempenho de IA e 128GB de memória unificada, em comparação com os 2070 TFLOPS e 128GB de memória do Jetson AGX Thor. O DGX Spark foi projetado como um supercomputador de IA de desktop, enquanto os dispositivos Jetson são sistemas embarcados otimizados para implantação na borda (edge).
Link to this sectionPosso usar a mesma imagem Docker para o DGX Spark e o Jetson AGX Thor?#
Sim! A imagem Docker ultralytics/ultralytics:latest-nvidia-arm64 suporta tanto o NVIDIA DGX Spark (com DGX OS) quanto o Jetson AGX Thor (com JetPack 7.0), já que ambos usam arquitetura ARM64 com CUDA 13 e pilhas de software similares.