Hızlı Başlangıç Kılavuzu: Ultralytics YOLO26 ile NVIDIA DGX Spark
Bu kapsamlı kılavuz, Ultralytics YOLO26'yı NVIDIA'nın kompakt masaüstü yapay zeka süper bilgisayarı NVIDIA DGX Spark'ta dağıtman için ayrıntılı bir yol haritası sunar. Ayrıca, bu güçlü sistem üzerinde YOLO26'nın yeteneklerini göstermek için performans kıyaslamalarını da sergiler.
Bu kılavuz, Ubuntu tabanlı DGX OS çalıştıran NVIDIA DGX Spark Founders Edition ile test edilmiştir. En güncel DGX OS sürümleriyle de çalışması beklenmektedir.
NVIDIA DGX Spark nedir?
NVIDIA DGX Spark, NVIDIA GB10 Grace Blackwell Superchip tarafından desteklenen kompakt bir masaüstü yapay zeka süper bilgisayarıdır. FP4 hassasiyetiyle 1 petaFLOP'a kadar yapay zeka işlem performansı sunar ve bu da onu masaüstü form faktöründe güçlü yapay zeka yeteneklerine ihtiyaç duyan geliştiriciler, araştırmacılar ve veri bilimciler için ideal kılar.
Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference
Temel Özellikler
| Özellik | Detaylar |
|---|---|
| Yapay Zeka Performansı | 1 PFLOP'a kadar (FP4) |
| GPU | Nesil Tensor Çekirdekleri, 4. Nesil RT Çekirdekleri ile NVIDIA Blackwell Mimarisi |
| CPU | 20 çekirdekli Arm işlemci (10 Cortex-X925 + 10 Cortex-A725) |
| Bellek | 128 GB LPDDR5x birleşik sistem belleği, 256-bit arayüz, 4266 MHz, 273 GB/s bant genişliği |
| Depolama | Kendinden şifrelemeli 1 TB veya 4 TB NVMe M.2 |
| Ağ | 1x RJ-45 (10 GbE), ConnectX-7 Akıllı NIC, Wi-Fi 7, Bluetooth 5.4 |
| Bağlantı | 4x USB Type-C, 1x HDMI 2.1a, HDMI çok kanallı ses |
| Video İşleme | 1x NVENC, 1x NVDEC |
DGX OS
NVIDIA DGX OS, DGX sistemlerinde yapay zeka, makine öğrenimi ve analitik uygulamalarını çalıştırmak için kararlı, test edilmiş ve desteklenen bir işletim sistemi temeli sağlayan özelleştirilmiş bir Linux dağıtımıdır. Şunları içerir:
- Yapay zeka iş yükleri için optimize edilmiş sağlam bir Linux temeli
- NVIDIA donanımı için önceden yapılandırılmış sürücüler ve sistem ayarları
- Güvenlik güncellemeleri ve sistem bakım yetenekleri
- Daha geniş NVIDIA yazılım ekosistemiyle uyumluluk
DGX OS, genellikle yılda iki kez (Şubat ve Ağustos civarı) sağlanan güncellemeler ve büyük sürümler arasında sağlanan ek güvenlik yamalarıyla düzenli bir yayın takvimini takip eder.
DGX Kontrol Paneli
DGX Spark, şunları sağlayan yerleşik bir DGX Kontrol Paneli ile birlikte gelir:
- Gerçek Zamanlı Sistem İzleme: Sistemin mevcut operasyonel metriklerine genel bakış
- Sistem Güncellemeleri: Güncellemeleri doğrudan kontrol panelinden uygulama yeteneği
- Sistem Ayarları: Cihaz adını ve diğer yapılandırmaları değiştirme
- Entegre JupyterLab: Geliştirme için yerel Jupyter Notebook'lara erişim
Kontrol Paneline Erişim
Ubuntu masaüstünün sol alt köşesindeki "Uygulamaları Göster" düğmesine tıkla, ardından tarayıcında açmak için "DGX Kontrol Paneli"ni seç.
Kontrol paneli, başlatıldığında otomatik olarak bir sanal ortam oluşturan ve önerilen paketleri yükleyen entegre bir JupyterLab örneği içerir. Her kullanıcı hesabına JupyterLab erişimi için özel bir port atanır.
Docker ile Hızlı Başlangıç
NVIDIA DGX Spark üzerinde Ultralytics YOLO26 ile başlamanın en hızlı yolu, önceden oluşturulmuş docker görüntüleriyle çalıştırmaktır. Jetson AGX Thor'u (JetPack 7.0) destekleyen aynı Docker görüntüsü, DGX OS yüklü DGX Spark üzerinde de çalışır.
t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $tBu işlem tamamlandıktan sonra, NVIDIA DGX Spark üzerinde TensorRT Kullanımı bölümüne atla.
Yerel Kurulumla Başla
Docker olmadan yerel kurulum için bu adımları izle.
Ultralytics Paketini Yükle
Burada, PyTorch modellerini diğer farklı formatlara dışa aktarabilmemiz için Ultralytics paketini DGX Spark'a isteğe bağlı bağımlılıklarla birlikte yükleyeceğiz. Temelde NVIDIA TensorRT dışa aktarmalarına odaklanacağız çünkü TensorRT, DGX Spark'tan maksimum performans almamızı sağlayacaktır.
-
Paket listesini güncelle, pip'i yükle ve en son sürüme yükselt
sudo apt update sudo apt install python3-pip -y pip install -U pip -
İsteğe bağlı bağımlılıklarla
ultralyticspip paketini yüklepip install ultralytics[export] -
Cihazı yeniden başlat
sudo reboot
PyTorch ve Torchvision'ı Yükle
Yukarıdaki ultralytics kurulumu, Torch ve Torchvision'ı yükleyecektir. Ancak, pip aracılığıyla kurulan bu paketler, CUDA 13 ile DGX Spark'ın ARM64 mimarisi için tam olarak optimize edilmemiş olabilir. Bu nedenle, CUDA 13 uyumlu sürümlerini yüklemeni öneririz:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130When running PyTorch 2.9.1 on NVIDIA DGX Spark, you may encounter the following UserWarning when initializing CUDA (e.g. running yolo checks, yolo predict, etc.):
UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)Bu uyarı güvenle yok sayılabilir. Bunu kalıcı olarak çözmek için PyTorch PR #164590 içinde bir düzeltme gönderilmiştir ve bu düzeltme PyTorch 2.10 sürümüne dahil edilecektir.
onnxruntime-gpu yükle
PyPI'da barındırılan onnxruntime-gpu paketi, ARM64 sistemleri için aarch64 ikili dosyalarına sahip değildir. Bu yüzden bu paketi manuel olarak yüklememiz gerekiyor. Bu paket, bazı dışa aktarmalar için gereklidir.
Here we will download and install onnxruntime-gpu 1.24.0 with Python3.12 support.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlNVIDIA DGX Spark üzerinde TensorRT Kullan
Ultralytics tarafından desteklenen tüm model dışa aktarma formatları arasında TensorRT, NVIDIA DGX Spark üzerinde en yüksek çıkarım performansını sunar ve bu da onu dağıtımlar için en önemli önerimiz haline getirir. Kurulum talimatları ve gelişmiş kullanım için özel TensorRT entegrasyon kılavuzumuza göz at.
Modeli TensorRT'ye Dönüştür ve Çıkarımı Çalıştır
PyTorch formatındaki YOLO26n modeli, dışa aktarılan model ile çıkarım çalıştırmak için TensorRT'ye dönüştürülür.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")Modelleri farklı model formatlarına dışa aktarırken ek argümanlara erişmek için Dışa Aktarma sayfasına git
NVIDIA DGX Spark YOLO11 Kıyaslamaları
YOLO11 kıyaslamaları, Ultralytics ekibi tarafından birden fazla model formatında hız ve doğruluk ölçülerek çalıştırıldı: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Kıyaslamalar, varsayılan 640 giriş görsel boyutuyla FP32 hassasiyetinde NVIDIA DGX Spark üzerinde çalıştırıldı.
Ayrıntılı Karşılaştırma Tablosu
Aşağıdaki tablo, beş farklı model (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) için birden fazla formattaki kıyaslama sonuçlarını sunarak her kombinasyon için durumu, boyutu, mAP50-95(B) metriğini ve çıkarım süresini verir.
| Format | Durum | Disk boyutu (MB) | mAP50-95(B) | Çıkarım süresi (ms/görüntü) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.4 | 0.5071 | 2.67 |
| TorchScript | ✅ | 10.5 | 0.5083 | 2.62 |
| ONNX | ✅ | 10.2 | 0.5074 | 5.92 |
| OpenVINO | ✅ | 10.4 | 0.5058 | 14.95 |
| TensorRT (FP32) | ✅ | 12.8 | 0.5085 | 1.95 |
| TensorRT (FP16) | ✅ | 7.0 | 0.5068 | 1.01 |
| TensorRT (INT8) | ✅ | 18.6 | 0.4880 | 1.62 |
| TF SavedModel | ✅ | 25.7 | 0.5076 | 36.39 |
| TF GraphDef | ✅ | 10.3 | 0.5076 | 41.06 |
| TF Lite | ✅ | 10.3 | 0.5075 | 64.36 |
| MNN | ✅ | 10.1 | 0.5075 | 12.14 |
| NCNN | ✅ | 10.2 | 0.5041 | 12.31 |
| ExecuTorch | ✅ | 10.2 | 0.5075 | 27.61 |
Ultralytics 8.3.249 ile kıyaslanmıştır
Sonuçlarımızı Yeniden Oluştur
Yukarıdaki Ultralytics kıyaslama sonuçlarını tüm dışa aktarma formatlarında yeniden oluşturmak için bu kodu çalıştır:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)Kıyaslama sonuçlarının, sistemin donanım ve yazılım yapılandırmasına ve kıyaslamaların çalıştırıldığı andaki sistem yüküne bağlı olarak değişebileceğini unutma. En güvenilir sonuçlar için, çok sayıda görsel içeren bir veri seti kullan, örneğin data='coco.yaml' (5000 doğrulama görseli).
NVIDIA DGX Spark için En İyi Uygulamalar
NVIDIA DGX Spark kullanırken, YOLO26 çalıştırırken maksimum performans elde etmek için izlemen gereken birkaç en iyi uygulama vardır.
-
Sistem Performansını İzle
GPU ve CPU kullanımını takip etmek için NVIDIA'nın izleme araçlarını kullan:
nvidia-smi -
Bellek Kullanımını Optimize Et
128GB birleşik bellek ile DGX Spark, büyük yığın boyutlarını (batch size) ve modelleri yönetebilir. Daha iyi verimlilik için yığın boyutunu artırmayı düşün:
from ultralytics import YOLO model = YOLO("yolo26n.engine") results = model.predict(source="path/to/images", batch=16) -
FP16 veya INT8 ile TensorRT Kullan
En iyi performans için modelleri FP16 veya INT8 hassasiyetiyle dışa aktar:
yolo export model=yolo26n.pt format=engine half=True # FP16 yolo export model=yolo26n.pt format=engine int8=True # INT8
Sistem Güncellemeleri (Founders Edition)
DGX Spark Founders Edition'ını güncel tutmak, performans ve güvenlik için kritiktir. NVIDIA, sistem işletim sistemini, sürücüleri ve aygıt yazılımını güncellemek için iki ana yöntem sunar.
DGX Panosunu Kullanma (Önerilen)
DGX Dashboard, uyumluluğu sağlayarak sistem güncellemelerini gerçekleştirmenin önerilen yoludur. Şunları yapmana olanak tanır:
- Mevcut sistem güncellemelerini görüntüle
- Güvenlik yamalarını ve sistem güncellemelerini yükle
- NVIDIA sürücü ve aygıt yazılımı güncellemelerini yönet
Manuel Sistem Güncellemeleri
İleri düzey kullanıcılar için güncellemeler terminal üzerinden manuel olarak gerçekleştirilebilir:
sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo rebootGüncellemeleri yapmadan önce sisteminin stabil bir güç kaynağına bağlı olduğundan ve kritik verileri yedeklediğinden emin ol.
Sonraki Adımlar
Daha fazla öğrenme ve destek için Ultralytics YOLO26 Dokümantasyonuna göz at.
SSS
Ultralytics YOLO26'yı NVIDIA DGX Spark üzerinde nasıl dağıtırım?
Ultralytics YOLO26'yı NVIDIA DGX Spark üzerinde dağıtmak oldukça basittir. Hızlı kurulum için önceden oluşturulmuş Docker imajını kullanabilir veya gerekli paketleri manuel olarak yükleyebilirsin. Her yaklaşım için ayrıntılı adımlar Docker ile Hızlı Başlangıç ve Yerel Kurulum ile Başla bölümlerinde bulunabilir.
NVIDIA DGX Spark üzerinde YOLO26'dan ne tür bir performans bekleyebilirim?
YOLO26 modelleri, GB10 Grace Blackwell Süper Çipi sayesinde DGX Spark üzerinde mükemmel performans sunar. TensorRT formatı en iyi çıkarım performansını sağlar. Farklı model boyutları ve formatlarındaki belirli kıyaslama sonuçları için Ayrıntılı Kıyaslama Tablosu bölümüne bak.
DGX Spark üzerinde YOLO26 için neden TensorRT kullanmalıyım?
TensorRT, optimum performansı nedeniyle DGX Spark üzerinde YOLO26 modellerini dağıtmak için şiddetle önerilir. Blackwell GPU yeteneklerinden yararlanarak çıkarımı hızlandırır, maksimum verimlilik ve hız sağlar. NVIDIA DGX Spark üzerinde TensorRT Kullanımı bölümünde daha fazlasını öğren.
YOLO26 için DGX Spark, Jetson cihazlarla nasıl karşılaştırılır?
DGX Spark, 1 PFLOP'a kadar AI performansı ve 128GB birleşik bellek ile, Jetson AGX Thor'un 2070 TFLOPS ve 128GB belleğine kıyasla çok daha fazla hesaplama gücü sunar. DGX Spark bir masaüstü AI süper bilgisayarı olarak tasarlanmıştır, Jetson cihazlar ise uçta dağıtım için optimize edilmiş gömülü sistemlerdir.
DGX Spark ve Jetson AGX Thor için aynı Docker imajını kullanabilir miyim?
Evet! ultralytics/ultralytics:latest-nvidia-arm64 Docker imajı, her ikisi de CUDA 13 ve benzer yazılım yığınlarıyla ARM64 mimarisini kullandığından hem NVIDIA DGX Spark'ı (DGX OS ile) hem de Jetson AGX Thor'u (JetPack 7.0 ile) destekler.