Hızlı Başlangıç Kılavuzu: Ultralytics YOLO26 ile NVIDIA DGX Spark

Bu kapsamlı kılavuz, Ultralytics YOLO26'yı NVIDIA'nın kompakt masaüstü yapay zeka süper bilgisayarı NVIDIA DGX Spark'ta dağıtman için ayrıntılı bir yol haritası sunar. Ayrıca, bu güçlü sistem üzerinde YOLO26'nın yeteneklerini göstermek için performans kıyaslamalarını da sergiler.

NVIDIA DGX Spark AI workstation overview

Not

Bu kılavuz, Ubuntu tabanlı DGX OS çalıştıran NVIDIA DGX Spark Founders Edition ile test edilmiştir. En güncel DGX OS sürümleriyle de çalışması beklenmektedir.

NVIDIA DGX Spark nedir?

NVIDIA DGX Spark, NVIDIA GB10 Grace Blackwell Superchip tarafından desteklenen kompakt bir masaüstü yapay zeka süper bilgisayarıdır. FP4 hassasiyetiyle 1 petaFLOP'a kadar yapay zeka işlem performansı sunar ve bu da onu masaüstü form faktöründe güçlü yapay zeka yeteneklerine ihtiyaç duyan geliştiriciler, araştırmacılar ve veri bilimciler için ideal kılar.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Temel Özellikler

ÖzellikDetaylar
Yapay Zeka Performansı1 PFLOP'a kadar (FP4)
GPUNesil Tensor Çekirdekleri, 4. Nesil RT Çekirdekleri ile NVIDIA Blackwell Mimarisi
CPU20 çekirdekli Arm işlemci (10 Cortex-X925 + 10 Cortex-A725)
Bellek128 GB LPDDR5x birleşik sistem belleği, 256-bit arayüz, 4266 MHz, 273 GB/s bant genişliği
DepolamaKendinden şifrelemeli 1 TB veya 4 TB NVMe M.2
1x RJ-45 (10 GbE), ConnectX-7 Akıllı NIC, Wi-Fi 7, Bluetooth 5.4
Bağlantı4x USB Type-C, 1x HDMI 2.1a, HDMI çok kanallı ses
Video İşleme1x NVENC, 1x NVDEC

DGX OS

NVIDIA DGX OS, DGX sistemlerinde yapay zeka, makine öğrenimi ve analitik uygulamalarını çalıştırmak için kararlı, test edilmiş ve desteklenen bir işletim sistemi temeli sağlayan özelleştirilmiş bir Linux dağıtımıdır. Şunları içerir:

  • Yapay zeka iş yükleri için optimize edilmiş sağlam bir Linux temeli
  • NVIDIA donanımı için önceden yapılandırılmış sürücüler ve sistem ayarları
  • Güvenlik güncellemeleri ve sistem bakım yetenekleri
  • Daha geniş NVIDIA yazılım ekosistemiyle uyumluluk

DGX OS, genellikle yılda iki kez (Şubat ve Ağustos civarı) sağlanan güncellemeler ve büyük sürümler arasında sağlanan ek güvenlik yamalarıyla düzenli bir yayın takvimini takip eder.

DGX Kontrol Paneli

DGX Spark, şunları sağlayan yerleşik bir DGX Kontrol Paneli ile birlikte gelir:

  • Gerçek Zamanlı Sistem İzleme: Sistemin mevcut operasyonel metriklerine genel bakış
  • Sistem Güncellemeleri: Güncellemeleri doğrudan kontrol panelinden uygulama yeteneği
  • Sistem Ayarları: Cihaz adını ve diğer yapılandırmaları değiştirme
  • Entegre JupyterLab: Geliştirme için yerel Jupyter Notebook'lara erişim

NVIDIA DGX management dashboard interface

Kontrol Paneline Erişim

Ubuntu masaüstünün sol alt köşesindeki "Uygulamaları Göster" düğmesine tıkla, ardından tarayıcında açmak için "DGX Kontrol Paneli"ni seç.

Entegre JupyterLab

Kontrol paneli, başlatıldığında otomatik olarak bir sanal ortam oluşturan ve önerilen paketleri yükleyen entegre bir JupyterLab örneği içerir. Her kullanıcı hesabına JupyterLab erişimi için özel bir port atanır.

Docker ile Hızlı Başlangıç

NVIDIA DGX Spark üzerinde Ultralytics YOLO26 ile başlamanın en hızlı yolu, önceden oluşturulmuş docker görüntüleriyle çalıştırmaktır. Jetson AGX Thor'u (JetPack 7.0) destekleyen aynı Docker görüntüsü, DGX OS yüklü DGX Spark üzerinde de çalışır.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

Bu işlem tamamlandıktan sonra, NVIDIA DGX Spark üzerinde TensorRT Kullanımı bölümüne atla.

Yerel Kurulumla Başla

Docker olmadan yerel kurulum için bu adımları izle.

Ultralytics Paketini Yükle

Burada, PyTorch modellerini diğer farklı formatlara dışa aktarabilmemiz için Ultralytics paketini DGX Spark'a isteğe bağlı bağımlılıklarla birlikte yükleyeceğiz. Temelde NVIDIA TensorRT dışa aktarmalarına odaklanacağız çünkü TensorRT, DGX Spark'tan maksimum performans almamızı sağlayacaktır.

  1. Paket listesini güncelle, pip'i yükle ve en son sürüme yükselt

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. İsteğe bağlı bağımlılıklarla ultralytics pip paketini yükle

    pip install ultralytics[export]
  3. Cihazı yeniden başlat

    sudo reboot

PyTorch ve Torchvision'ı Yükle

Yukarıdaki ultralytics kurulumu, Torch ve Torchvision'ı yükleyecektir. Ancak, pip aracılığıyla kurulan bu paketler, CUDA 13 ile DGX Spark'ın ARM64 mimarisi için tam olarak optimize edilmemiş olabilir. Bu nedenle, CUDA 13 uyumlu sürümlerini yüklemeni öneririz:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
Bilgi

When running PyTorch 2.9.1 on NVIDIA DGX Spark, you may encounter the following UserWarning when initializing CUDA (e.g. running yolo checks, yolo predict, etc.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Bu uyarı güvenle yok sayılabilir. Bunu kalıcı olarak çözmek için PyTorch PR #164590 içinde bir düzeltme gönderilmiştir ve bu düzeltme PyTorch 2.10 sürümüne dahil edilecektir.

onnxruntime-gpu yükle

PyPI'da barındırılan onnxruntime-gpu paketi, ARM64 sistemleri için aarch64 ikili dosyalarına sahip değildir. Bu yüzden bu paketi manuel olarak yüklememiz gerekiyor. Bu paket, bazı dışa aktarmalar için gereklidir.

Here we will download and install onnxruntime-gpu 1.24.0 with Python3.12 support.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

NVIDIA DGX Spark üzerinde TensorRT Kullan

Ultralytics tarafından desteklenen tüm model dışa aktarma formatları arasında TensorRT, NVIDIA DGX Spark üzerinde en yüksek çıkarım performansını sunar ve bu da onu dağıtımlar için en önemli önerimiz haline getirir. Kurulum talimatları ve gelişmiş kullanım için özel TensorRT entegrasyon kılavuzumuza göz at.

Modeli TensorRT'ye Dönüştür ve Çıkarımı Çalıştır

PyTorch formatındaki YOLO26n modeli, dışa aktarılan model ile çıkarım çalıştırmak için TensorRT'ye dönüştürülür.

Örnek
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Not

Modelleri farklı model formatlarına dışa aktarırken ek argümanlara erişmek için Dışa Aktarma sayfasına git

NVIDIA DGX Spark YOLO11 Kıyaslamaları

YOLO11 kıyaslamaları, Ultralytics ekibi tarafından birden fazla model formatında hız ve doğruluk ölçülerek çalıştırıldı: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Kıyaslamalar, varsayılan 640 giriş görsel boyutuyla FP32 hassasiyetinde NVIDIA DGX Spark üzerinde çalıştırıldı.

Ayrıntılı Karşılaştırma Tablosu

Aşağıdaki tablo, beş farklı model (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) için birden fazla formattaki kıyaslama sonuçlarını sunarak her kombinasyon için durumu, boyutu, mAP50-95(B) metriğini ve çıkarım süresini verir.

Performans
FormatDurumDisk boyutu (MB)mAP50-95(B)Çıkarım süresi (ms/görüntü)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

Ultralytics 8.3.249 ile kıyaslanmıştır

Sonuçlarımızı Yeniden Oluştur

Yukarıdaki Ultralytics kıyaslama sonuçlarını tüm dışa aktarma formatlarında yeniden oluşturmak için bu kodu çalıştır:

Örnek
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Kıyaslama sonuçlarının, sistemin donanım ve yazılım yapılandırmasına ve kıyaslamaların çalıştırıldığı andaki sistem yüküne bağlı olarak değişebileceğini unutma. En güvenilir sonuçlar için, çok sayıda görsel içeren bir veri seti kullan, örneğin data='coco.yaml' (5000 doğrulama görseli).

NVIDIA DGX Spark için En İyi Uygulamalar

NVIDIA DGX Spark kullanırken, YOLO26 çalıştırırken maksimum performans elde etmek için izlemen gereken birkaç en iyi uygulama vardır.

  1. Sistem Performansını İzle

    GPU ve CPU kullanımını takip etmek için NVIDIA'nın izleme araçlarını kullan:

    nvidia-smi
  2. Bellek Kullanımını Optimize Et

    128GB birleşik bellek ile DGX Spark, büyük yığın boyutlarını (batch size) ve modelleri yönetebilir. Daha iyi verimlilik için yığın boyutunu artırmayı düşün:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. FP16 veya INT8 ile TensorRT Kullan

    En iyi performans için modelleri FP16 veya INT8 hassasiyetiyle dışa aktar:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Sistem Güncellemeleri (Founders Edition)

DGX Spark Founders Edition'ını güncel tutmak, performans ve güvenlik için kritiktir. NVIDIA, sistem işletim sistemini, sürücüleri ve aygıt yazılımını güncellemek için iki ana yöntem sunar.

DGX Panosunu Kullanma (Önerilen)

DGX Dashboard, uyumluluğu sağlayarak sistem güncellemelerini gerçekleştirmenin önerilen yoludur. Şunları yapmana olanak tanır:

  • Mevcut sistem güncellemelerini görüntüle
  • Güvenlik yamalarını ve sistem güncellemelerini yükle
  • NVIDIA sürücü ve aygıt yazılımı güncellemelerini yönet

Manuel Sistem Güncellemeleri

İleri düzey kullanıcılar için güncellemeler terminal üzerinden manuel olarak gerçekleştirilebilir:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
Uyarı

Güncellemeleri yapmadan önce sisteminin stabil bir güç kaynağına bağlı olduğundan ve kritik verileri yedeklediğinden emin ol.

Sonraki Adımlar

Daha fazla öğrenme ve destek için Ultralytics YOLO26 Dokümantasyonuna göz at.

SSS

Ultralytics YOLO26'yı NVIDIA DGX Spark üzerinde nasıl dağıtırım?

Ultralytics YOLO26'yı NVIDIA DGX Spark üzerinde dağıtmak oldukça basittir. Hızlı kurulum için önceden oluşturulmuş Docker imajını kullanabilir veya gerekli paketleri manuel olarak yükleyebilirsin. Her yaklaşım için ayrıntılı adımlar Docker ile Hızlı Başlangıç ve Yerel Kurulum ile Başla bölümlerinde bulunabilir.

NVIDIA DGX Spark üzerinde YOLO26'dan ne tür bir performans bekleyebilirim?

YOLO26 modelleri, GB10 Grace Blackwell Süper Çipi sayesinde DGX Spark üzerinde mükemmel performans sunar. TensorRT formatı en iyi çıkarım performansını sağlar. Farklı model boyutları ve formatlarındaki belirli kıyaslama sonuçları için Ayrıntılı Kıyaslama Tablosu bölümüne bak.

DGX Spark üzerinde YOLO26 için neden TensorRT kullanmalıyım?

TensorRT, optimum performansı nedeniyle DGX Spark üzerinde YOLO26 modellerini dağıtmak için şiddetle önerilir. Blackwell GPU yeteneklerinden yararlanarak çıkarımı hızlandırır, maksimum verimlilik ve hız sağlar. NVIDIA DGX Spark üzerinde TensorRT Kullanımı bölümünde daha fazlasını öğren.

YOLO26 için DGX Spark, Jetson cihazlarla nasıl karşılaştırılır?

DGX Spark, 1 PFLOP'a kadar AI performansı ve 128GB birleşik bellek ile, Jetson AGX Thor'un 2070 TFLOPS ve 128GB belleğine kıyasla çok daha fazla hesaplama gücü sunar. DGX Spark bir masaüstü AI süper bilgisayarı olarak tasarlanmıştır, Jetson cihazlar ise uçta dağıtım için optimize edilmiş gömülü sistemlerdir.

DGX Spark ve Jetson AGX Thor için aynı Docker imajını kullanabilir miyim?

Evet! ultralytics/ultralytics:latest-nvidia-arm64 Docker imajı, her ikisi de CUDA 13 ve benzer yazılım yığınlarıyla ARM64 mimarisini kullandığından hem NVIDIA DGX Spark'ı (DGX OS ile) hem de Jetson AGX Thor'u (JetPack 7.0 ile) destekler.

Yorumlar