İçeriğe geç

Hızlı Başlangıç Kılavuzu: Ultralytics YOLO11 ile NVIDIA Spark

Bu kapsamlı kılavuz, NVIDIA kompakt masaüstü yapay zeka süper bilgisayarı NVIDIA SparkYOLO11 Ultralytics YOLO11 dağıtmak için ayrıntılı bir adım adım kılavuz sunar. Ayrıca, bu güçlü YOLO11 yeteneklerini göstermek için performans karşılaştırmaları da içerir.

NVIDIA Spark

Not

Bu kılavuz, Ubuntu tabanlı DGX OS çalıştıran NVIDIA Spark Founders Edition ile test edilmiştir. En son DGX OS sürümleriyle çalışması beklenmektedir.

NVIDIA Spark nedir?

NVIDIA Spark, NVIDIA Grace Blackwell Süper Çip ile güçlendirilmiş kompakt bir masaüstü yapay zeka süper bilgisayarıdır. FP4 hassasiyetiyle 1 petaFLOP'a kadar yapay zeka hesaplama performansı sunarak, masaüstü form faktöründe güçlü yapay zeka yeteneklerine ihtiyaç duyan geliştiriciler, araştırmacılar ve veri bilimcileri için ideal bir seçimdir.

Önemli Özellikler

ÖzelliklerAyrıntılar
Yapay Zeka Performansı1 PFLOP'a kadar (FP4)
GPU5. Nesil Tensor ve 4. Nesil RT Çekirdekleri ile NVIDIA Mimarisi
CPU20 çekirdekli Arm işlemci (10 Cortex-X925 + 10 Cortex-A725)
Bellek128 GB LPDDR5x birleşik sistem belleği, 256 bit arabirim, 4266 MHz, 273 GB/s bant genişliği
Depolama1 TB veya 4 TB NVMe M.2, kendi kendine şifreleme özelliği ile
1x RJ-45 (10 GbE), ConnectX-7 Akıllı NIC, Wi-Fi 7, Bluetooth 5.4
Bağlantı4x USB Type-C, 1x HDMI 2.1a, HDMI çok kanallı ses
Video İşleme1x NVENC, 1x NVDEC

DGX İşletim Sistemi

NVIDIA OS, DGX sistemlerinde yapay zeka, makine öğrenimi ve analitik uygulamaları çalıştırmak için kararlı, test edilmiş ve desteklenen bir işletim sistemi temeli sağlayan özelleştirilmiş bir Linux dağıtımıdır. Şunları içerir:

  • AI iş yükleri için optimize edilmiş sağlam bir Linux temeli
  • NVIDIA için önceden yapılandırılmış sürücüler ve sistem ayarları
  • Güvenlik güncellemeleri ve sistem bakım yetenekleri
  • Daha geniş NVIDIA ekosistemiyle uyumluluk

DGX OS, genellikle yılda iki kez (Şubat ve Ağustos aylarında) güncellemeler sunan düzenli bir sürüm takvimi izler ve büyük sürümler arasında ek güvenlik yamaları sağlanır.

DGX Kontrol Paneli

DGX Spark, aşağıdakileri sağlayan yerleşik bir DGX Dashboard ile birlikte gelir:

  • Gerçek Zamanlı Sistem İzleme: Sistemin mevcut operasyonel metriklerine genel bakış
  • Sistem Güncellemeleri: Güncellemeleri doğrudan kontrol panelinden uygulama yeteneği
  • Sistem Ayarları: Cihaz adını ve diğer yapılandırmaları değiştirin
  • Entegre JupyterLab: Geliştirme için yerel Jupyter Notebook'lara erişin

NVIDIA Kontrol Paneli

Kontrol Paneline Erişim

Ubuntu masaüstünün sol alt köşesindeki "Uygulamaları Göster" düğmesini tıklayın, ardından "DGX Dashboard" seçeneğini seçerek tarayıcınızda açın.

# Open an SSH tunnel
ssh -L 11000:localhost:11000 <username>@<IP or spark-abcd.local>

# Then open in browser
# http://localhost:11000

NVIDIA ile bağlandıktan sonra, "DGX Dashboard" düğmesine tıklayarak kontrol panelini açın. http://localhost:11000.

Entegre JupyterLab

Kontrol paneli, başlatıldığında otomatik olarak sanal bir ortam oluşturan ve önerilen paketleri yükleyen entegre bir JupyterLab örneği içerir. Her kullanıcı hesabına JupyterLab erişimi için özel bir bağlantı noktası atanır.

Docker ile Hızlı Başlangıç

NVIDIA SparkYOLO11 Ultralytics YOLO11 kullanmaya başlamanın en hızlı yolu, önceden oluşturulmuş docker görüntülerini çalıştırmaktır. Jetson AGX Thor (JetPack 7.0) destekleyen aynı Docker görüntüsü, DGX OS ile DGX Spark üzerinde de çalışır.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

Bu işlem tamamlandıktan sonra, NVIDIA TensorRT Kullanma bölümüne geçin.

Yerel Kurulum ile başlayın

Docker olmadan yerel kurulum için şu adımları izleyin.

Ultralytics Paketini Kurulumu

Burada, DGX Spark üzerine Ultralytics isteğe bağlı bağımlılıklarla birlikte yükleyeceğiz, böylece PyTorch modellerini farklı formatlara aktarabilmek için DGX Spark'a Ultralytics paketini yükleyeceğiz. TensorRT , DGX Spark'tan maksimum performansı elde etmemizi TensorRT , esas olarak NVIDIA TensorRT odaklanacağız.

  1. Paketler listesini güncelleyin, pip'i kurun ve en son sürüme yükseltin

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
    
  2. Kurulum ultralytics isteğe bağlı bağımlılıkları olan pip paketi

    pip install ultralytics[export]
    
  3. Cihazı yeniden başlatın

    sudo reboot
    

PyTorch ve Torchvision'ı yükle

Yukarıdaki ultralytics Torch Torchvision'ı yükleyecektir. Ancak, pip aracılığıyla yüklenen bu paketler, CUDA ile DGX Spark'ın ARM64 mimarisi için tam olarak optimize edilmemiş olabilir. Bu nedenle, CUDA ile uyumlu sürümleri yüklemenizi öneririz:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130

Bilgi

NVIDIA Spark üzerinde PyTorch .9.1 çalıştırırken, aşağıdakilerle karşılaşabilirsiniz UserWarning CUDA başlatırken CUDA örneğin, yolo checks, yolo predict, vb.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Bu uyarı güvenle göz ardı edilebilir. Bu sorunu kalıcı olarak çözmek için, PyTorch #164590 'da bir düzeltme gönderilmiştir ve bu düzeltme PyTorch .10 sürümüne dahil edilecektir.

Kurulum onnxruntime-gpu

onnxruntime-gpu PyPI'de barındırılan paketinde aarch64 ARM64 sistemleri için ikili dosyalar. Bu yüzden bu paketi manuel olarak yüklememiz gerekiyor. Bu paket bazı dışa aktarımlar için gereklidir.

Burada indirecek ve kuracağız onnxruntime-gpu 1.24.0 ile Python3.12 destek.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

NVIDIA TensorRT kullanın

Ultralytics tarafından desteklenen tüm model dışa aktarım formatları arasında, TensorRT NVIDIA Spark üzerinde en yüksek çıkarım performansı TensorRT ve bu nedenle dağıtımlar için en çok önerdiğimiz seçenektir. Kurulum talimatları ve gelişmiş kullanım için özel TensorRT kılavuzumuza bakın.

Modeli TensorRT'ye Dönüştürün ve Çıkarım Çalıştırın

PyTorch formatındaki YOLO11n modeli, dışa aktarılan modelle çıkarım çalıştırmak için TensorRT'ye dönüştürülür.

Örnek

from ultralytics import YOLO

# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo11n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo11n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
# Export a YOLO11n PyTorch model to TensorRT format
yolo export model=yolo11n.pt format=engine # creates 'yolo11n.engine'

# Run inference with the exported model
yolo predict model=yolo11n.engine source='https://ultralytics.com/images/bus.jpg'

Not

Modelleri farklı model formatlarına aktarırken ek argümanlara erişmek için Dışa Aktarma sayfasına gidin

NVIDIA Spark YOLO11

YOLO11 , Ultralytics tarafından hız ve doğruluğu ölçen birden fazla model formatında gerçekleştirildi: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF , MNN, NCNN, ExecuTorch. Karşılaştırmalar, NVIDIA Spark üzerinde FP32 hassasiyetinde ve varsayılan giriş görüntü boyutu 640 olarak gerçekleştirildi.

Detaylı Karşılaştırma Tablosu

Aşağıdaki tablo, beş farklı modelin (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) birden fazla formatta elde edilen karşılaştırma sonuçlarını göstermektedir. Bu tablo, her bir kombinasyonun durumunu, boyutunu, mAP50(B) metriğini ve çıkarım süresini vermektedir.

Performans

FormatDurumDisk üzerindeki boyut (MB)mAP50-95(B)Çıkarım süresi (ms/im)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61
FormatDurumDisk üzerindeki boyut (MB)mAP50-95(B)Çıkarım süresi (ms/im)
PyTorch18.40.57675.38
TorchScript36.50.57815.48
ONNX36.30.57848.17
OpenVINO36.40.580927.12
TensorRT (FP32)39.80.57833.59
TensorRT (FP16)20.10.58001.85
TensorRT (INT8)17.50.56641.88
TF SavedModel90.80.578266.63
TF GraphDef36.30.578271.67
TF Lite36.30.5782187.36
MNN36.20.577527.05
NCNN36.20.580626.26
ExecuTorch36.20.578254.73
FormatDurumDisk üzerindeki boyut (MB)mAP50-95(B)Çıkarım süresi (ms/im)
PyTorch38.80.625411.14
TorchScript77.30.630412.00
ONNX76.90.630413.83
OpenVINO77.10.628462.44
TensorRT (FP32)79.90.63056.96
TensorRT (FP16)40.60.63133.14
TensorRT (INT8)26.60.62043.30
TF SavedModel192.40.6306139.85
TF GraphDef76.90.6306146.76
TF Lite76.90.6306568.18
MNN76.80.630667.67
NCNN76.80.630860.49
ExecuTorch76.90.6306120.37
FormatDurumDisk üzerindeki boyut (MB)mAP50-95(B)Çıkarım süresi (ms/im)
PyTorch49.00.636613.95
TorchScript97.60.639915.67
ONNX97.00.639916.62
OpenVINO97.30.637778.80
TensorRT (FP32)99.20.64078.86
TensorRT (FP16)50.80.63503.85
TensorRT (INT8)32.50.62244.52
TF SavedModel242.70.6409187.45
TF GraphDef97.00.6409193.92
TF Lite97.00.6409728.61
MNN96.90.636985.21
NCNN96.90.637377.62
ExecuTorch97.00.6409153.56
FormatDurumDisk üzerindeki boyut (MB)mAP50-95(B)Çıkarım süresi (ms/im)
PyTorch109.30.699223.19
TorchScript218.10.690025.75
ONNX217.50.690027.43
OpenVINO217.80.6872149.44
TensorRT (FP32)222.70.690213.87
TensorRT (FP16)111.10.68836.19
TensorRT (INT8)62.90.67936.62
TF SavedModel543.90.6900335.10
TF GraphDef217.50.6900348.86
TF Lite217.50.69001578.66
MNN217.30.6874168.95
NCNN217.40.6901132.13
ExecuTorch217.40.6900297.17

Ultralytics .3.249 ile karşılaştırılmıştır.

Sonuçlarımızı Tekrar Üretin

Yukarıdaki Ultralytics kıyaslamalarını tüm dışa aktarma biçimlerinde yeniden oluşturmak için bu kodu çalıştırın:

Örnek

from ultralytics import YOLO

# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")

# Benchmark YOLO11n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)
# Benchmark YOLO11n speed and accuracy on the COCO128 dataset for all export formats
yolo benchmark model=yolo11n.pt data=coco128.yaml imgsz=640

Kıyaslama sonuçlarının, bir sistemin donanım ve yazılım yapılandırmasına ve kıyaslamaların çalıştırıldığı zamanki sistemin mevcut iş yüküne göre değişebileceğini unutmayın. En güvenilir sonuçlar için, çok sayıda görüntü içeren bir veri kümesi kullanın, örneğin: data='coco.yaml' (5000 doğrulama görüntüsü).

NVIDIA Spark için En İyi Uygulamalar

NVIDIA Spark kullanırken, YOLO11 çalıştırırken maksimum performans elde etmek için izlenmesi gereken birkaç en iyi uygulama vardır.

  1. Sistem Performansını İzleme

    NVIDIA izleme araçlarını kullanarakGPU CPU track :

    nvidia-smi
    
  2. Bellek Kullanımını Optimize Et

    128 GB birleşik bellek ile DGX Spark, büyük parti boyutlarını ve modelleri işleyebilir. Daha iyi verimlilik için parti boyutunu artırmayı düşünün:

    from ultralytics import YOLO
    
    model = YOLO("yolo11n.engine")
    results = model.predict(source="path/to/images", batch=16)
    
  3. FP16 veya INT8 TensorRT kullanın

    En iyi performans için, FP16 veya INT8 hassasiyetiyle modelleri dışa aktarın:

    yolo export model=yolo11n.pt format=engine half=True # FP16
    yolo export model=yolo11n.pt format=engine int8=True # INT8
    

Sistem Güncellemeleri (Kurucular Sürümü)

DGX Spark Founders Edition'ı güncel tutmak, performans ve güvenlik açısından çok önemlidir. NVIDIA , sistem işletim sistemini, sürücüleri ve ürün yazılımını güncellemek için iki temel yöntem NVIDIA .

DGX Dashboard, uyumluluğu sağlayan sistem güncellemelerini gerçekleştirmek için önerilen yöntemdir. Bu araçla şunları yapabilirsiniz:

  • Mevcut sistem güncellemelerini görüntüle
  • Güvenlik yamalarını ve sistem güncellemelerini yükleyin
  • NVIDIA ve ürün yazılımı güncellemelerini yönetme

Manuel Sistem Güncellemeleri

İleri düzey kullanıcılar için güncellemeler terminal üzerinden manuel olarak gerçekleştirilebilir:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot

Uyarı

Güncellemeleri gerçekleştirmeden önce sisteminizin sabit bir güç kaynağına bağlı olduğundan ve önemli verilerinizi yedeklediğinizden emin olun.

Sonraki Adımlar

Daha fazla öğrenme ve destek için Ultralytics YOLO11 Belgeleri'ne bakınız.

SSS

Ultralytics YOLO11 NVIDIA YOLO11 nasıl kullanırım?

Ultralytics YOLO11 NVIDIA SparkYOLO11 kurmak oldukça basittir. Hızlı kurulum için önceden oluşturulmuş Docker görüntüsünü kullanabilir veya gerekli paketleri manuel olarak yükleyebilirsiniz. Her iki yaklaşım için ayrıntılı adımlar, Docker ile Hızlı Başlangıç ve Yerel Kurulum ile Başlangıç bölümlerinde bulunabilir.

NVIDIA Spark YOLO11 ne tür bir performans bekleyebilirim?

YOLO11 , GB10 Grace Blackwell Superchip sayesinde DGX Spark üzerinde mükemmel performans sunar. TensorRT en iyi çıkarım performansını sağlar. Farklı model boyutları ve formatları için spesifik karşılaştırma sonuçlarını görmek için Ayrıntılı Karşılaştırma Tablosu bölümüne bakın.

DGX YOLO11 TensorRT neden TensorRT kullanmalıyım?

TensorRT , optimum performansı nedeniyle DGX Spark üzerinde YOLO11 dağıtmak için şiddetle tavsiye TensorRT . Blackwell GPU yararlanarak çıkarımları hızlandırır ve maksimum verimlilik ve hız sağlar. NVIDIA TensorRT Kullanma bölümünde daha fazla bilgi edinebilirsiniz.

DGX Spark, YOLO11 için Jetson cihazlarıyla karşılaştırıldığında nasıl bir performans sergiliyor?

DGX Spark, Jetson AGX Thor'un 2070 TFLOPS ve 128 GB bellek kapasitesine kıyasla, 1 PFLOP'a varan AI performansı ve 128 GB birleşik bellek ile Jetson cihazlarından önemli ölçüde daha fazla hesaplama gücü sunar. DGX Spark, masaüstü AI süper bilgisayarı olarak tasarlanırken, Jetson cihazları uç dağıtım için optimize edilmiş gömülü sistemlerdir.

DGX Spark ve Jetson AGX Thor için aynı Docker görüntüsünü kullanabilir miyim?

Evet! ultralytics/ultralytics:latest-nvidia-arm64 Docker görüntüsü, NVIDIA Spark (DGX OS ile) ve Jetson AGX Thor (JetPack 7.0 ile) destekler, çünkü her ikisi de CUDA ve benzer yazılım yığınları ile ARM64 mimarisini kullanır.



📅 0 gün önce oluşturuldu ✏️ 0 gün önce güncellendi
onuralpszr

Yorumlar