دليل البدء السريع: NVIDIA DGX Spark مع Ultralytics YOLO26

يوفر هذا الدليل الشامل جولة تفصيلية لنشر Ultralytics YOLO26 على NVIDIA DGX Spark، وهو حاسوب فائق للذكاء الاصطناعي مكتبي ومدمج من NVIDIA. بالإضافة إلى ذلك، فإنه يعرض مقاييس الأداء لإظهار قدرات YOLO26 على هذا النظام القوي.

NVIDIA DGX Spark AI workstation overview

ملاحظة

تم اختبار هذا الدليل مع NVIDIA DGX Spark Founders Edition الذي يعمل بنظام DGX OS القائم على Ubuntu. من المتوقع أن يعمل مع أحدث إصدارات DGX OS.

ما هو NVIDIA DGX Spark؟

NVIDIA DGX Spark هو حاسوب فائق للذكاء الاصطناعي مكتبي مدمج مدعوم بشريحة NVIDIA GB10 Grace Blackwell Superchip. يوفر ما يصل إلى 1 بيتا فلوب من أداء الحوسبة للذكاء الاصطناعي بدقة FP4، مما يجعله مثالياً للمطورين والباحثين وعلماء البيانات الذين يحتاجون إلى قدرات ذكاء اصطناعي قوية في شكل مكتبي.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

المواصفات الرئيسية

المواصفاتالتفاصيل
أداء الذكاء الاصطناعييصل إلى 1 PFLOP (FP4)
GPUبنية NVIDIA Blackwell مع الجيل الخامس من Tensor Cores، والجيل الرابع من RT Cores
CPUمعالج Arm بـ 20 نواة (10 Cortex-X925 + 10 Cortex-A725)
الذاكرة128 جيجابايت LPDDR5x ذاكرة نظام موحدة، واجهة 256-بت، 4266 ميجاهرتز، عرض نطاق ترددي 273 جيجابايت/ثانية
التخزين1 تيرابايت أو 4 تيرابايت NVMe M.2 مع تشفير ذاتي
الشبكة1x RJ-45 (10 GbE)، بطاقة شبكة ذكية ConnectX-7، Wi-Fi 7، بلوتوث 5.4
الاتصال4x USB Type-C، 1x HDMI 2.1a، صوت متعدد القنوات عبر HDMI
معالجة الفيديو1x NVENC، 1x NVDEC

DGX OS

NVIDIA DGX OS هو توزيعة Linux مخصصة توفر أساس نظام تشغيل مستقر ومختبر ومدعوم لتشغيل تطبيقات الذكاء الاصطناعي والتعلم الآلي والتحليلات على أنظمة DGX. وهو يتضمن:

  • أساس Linux قوي ومحسن لأحمال عمل الذكاء الاصطناعي
  • برامج تشغيل وإعدادات نظام مهيأة مسبقاً لأجهزة NVIDIA
  • تحديثات أمنية وقدرات صيانة النظام
  • التوافق مع النظام البيئي الأوسع لبرمجيات NVIDIA

يتبع DGX OS جدول إصدار منتظم مع تحديثات يتم توفيرها عادة مرتين في السنة (حوالي فبراير وأغسطس)، مع توفير تصحيحات أمنية إضافية بين الإصدارات الرئيسية.

DGX Dashboard

يأتي DGX Spark مع DGX Dashboard مدمج يوفر:

  • مراقبة النظام في الوقت الفعلي: نظرة عامة على مقاييس التشغيل الحالية للنظام
  • تحديثات النظام: القدرة على تطبيق التحديثات مباشرة من لوحة التحكم
  • إعدادات النظام: تغيير اسم الجهاز وتكوينات أخرى
  • JupyterLab متكامل: الوصول إلى Jupyter Notebooks محلياً للتطوير

NVIDIA DGX management dashboard interface

الوصول إلى لوحة التحكم

انقر على زر "Show Apps" في الزاوية اليسرى السفلية من سطح مكتب Ubuntu، ثم حدد "DGX Dashboard" لفتحه في متصفحك.

JupyterLab متكامل

تتضمن لوحة التحكم مثيل JupyterLab متكامل يقوم تلقائياً بإنشاء بيئة افتراضية وتثبيت الحزم الموصى بها عند التشغيل. يتم تخصيص منفذ مخصص لكل حساب مستخدم للوصول إلى JupyterLab.

البدء السريع مع Docker

أسرع طريقة للبدء مع Ultralytics YOLO26 على NVIDIA DGX Spark هي التشغيل باستخدام صور docker المبنية مسبقاً. نفس صورة Docker التي تدعم Jetson AGX Thor (JetPack 7.0) تعمل على DGX Spark مع DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

بعد الانتهاء من ذلك، انتقل إلى قسم استخدام TensorRT على NVIDIA DGX Spark.

البدء بالتثبيت الأصلي

للتثبيت الأصلي بدون Docker، اتبع الخطوات التالية.

تثبيت حزمة Ultralytics

هنا سنقوم بتثبيت حزمة Ultralytics على DGX Spark مع التبعيات الاختيارية حتى نتمكن من تصدير نماذج PyTorch إلى تنسيقات مختلفة أخرى. سنركز بشكل أساسي على صادرات NVIDIA TensorRT لأن TensorRT سيضمن حصولنا على أقصى أداء من DGX Spark.

  1. تحديث قائمة الحزم، وتثبيت pip والترقية إلى الأحدث

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. تثبيت حزمة pip ultralytics مع التبعيات الاختيارية

    pip install ultralytics[export]
  3. إعادة تشغيل الجهاز

    sudo reboot

تثبيت PyTorch و Torchvision

سيقوم تثبيت ultralytics المذكور أعلاه بتثبيت Torch و Torchvision. ومع ذلك، قد لا تكون هذه الحزم المثبتة عبر pip محسنة بالكامل لبنية ARM64 الخاصة بـ DGX Spark مع CUDA 13. لذلك، نوصي بتثبيت الإصدارات المتوافقة مع CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
معلومات

عند تشغيل PyTorch 2.9.1 على NVIDIA DGX Spark، قد تواجه UserWarning التالي عند تهيئة CUDA (على سبيل المثال، عند تشغيل yolo checks، yolo predict، وما إلى ذلك):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

يمكن تجاهل هذا التحذير بأمان. لمعالجة هذا بشكل دائم، تم تقديم إصلاح في PyTorch PR #164590 والذي سيتم تضمينه في إصدار PyTorch 2.10.

تثبيت onnxruntime-gpu

حزمة onnxruntime-gpu المستضافة في PyPI لا تحتوي على ملفات ثنائية aarch64 لأنظمة ARM64. لذا نحتاج إلى تثبيت هذه الحزمة يدوياً. هذه الحزمة مطلوبة لبعض الصادرات.

هنا سنقوم بتنزيل وتثبيت onnxruntime-gpu 1.24.0 مع دعم Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

استخدام TensorRT على NVIDIA DGX Spark

من بين جميع تنسيقات تصدير النماذج المدعومة من قبل Ultralytics، يوفر TensorRT أعلى أداء للاستدلال على NVIDIA DGX Spark، مما يجعله توصيتنا الأولى للنشر. للحصول على تعليمات الإعداد والاستخدام المتقدم، راجع دليل تكامل TensorRT المخصص.

تحويل النموذج إلى TensorRT وتشغيل الاستدلال

تم تحويل نموذج YOLO26n بتنسيق PyTorch إلى TensorRT لتشغيل الاستدلال باستخدام النموذج المصدر.

مثال
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
ملاحظة

قم بزيارة صفحة التصدير للوصول إلى وسيطات إضافية عند تصدير النماذج إلى تنسيقات نماذج مختلفة

معايير أداء NVIDIA DGX Spark YOLO11

تم تشغيل معايير YOLO11 بواسطة فريق Ultralytics على تنسيقات نماذج متعددة لقياس السرعة والدقة: PyTorch، TorchScript، ONNX، OpenVINO، TensorRT، TF SavedModel، TF GraphDef، TF Lite، MNN، NCNN، ExecuTorch. تم تشغيل المعايير على NVIDIA DGX Spark بدقة FP32 [الدقة] (https://www.ultralytics.com/glossary/precision) مع حجم صورة إدخال افتراضي قدره 640.

جدول مقارنة مفصل

يمثل الجدول أدناه نتائج المعايير لخمسة نماذج مختلفة (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) عبر تنسيقات متعددة، مما يعطينا الحالة، الحجم، مقياس mAP50-95(B)، ووقت الاستدلال لكل مجموعة.

الأداء
التنسيقالحالةالحجم على القرص (MB)mAP50-95(B)وقت الاستنتاج (مللي ثانية/صورة)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

تم تحديد المعايير باستخدام Ultralytics 8.3.249

إعادة إنتاج نتائجنا

لإعادة إنتاج معايير Ultralytics المذكورة أعلاه على جميع تنسيقات التصدير، قم بتشغيل هذا الكود:

مثال
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

لاحظ أن نتائج قياس الأداء قد تختلف بناءً على التكوين الدقيق للأجهزة والبرامج للنظام، بالإضافة إلى عبء العمل الحالي على النظام وقت تشغيل المعايير. للحصول على أكثر النتائج موثوقية، استخدم مجموعة بيانات تحتوي على عدد كبير من الصور، على سبيل المثال data='coco.yaml' (5000 صورة تحقق).

أفضل الممارسات لجهاز NVIDIA DGX Spark

عند استخدام NVIDIA DGX Spark، هناك بعض أفضل الممارسات التي يجب اتباعها لتمكين أقصى أداء عند تشغيل YOLO26.

  1. مراقبة أداء النظام

    استخدم أدوات المراقبة الخاصة بـ NVIDIA لتتبع استخدام GPU و CPU:

    nvidia-smi
  2. تحسين استخدام الذاكرة

    مع 128 جيجابايت من الذاكرة الموحدة، يمكن لـ DGX Spark التعامل مع أحجام دفعات ونماذج كبيرة. فكر في زيادة حجم الدفعة لتحسين معدل الإنتاجية:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. استخدم TensorRT مع FP16 أو INT8

    للحصول على أفضل أداء، قم بتصدير النماذج بدقة FP16 أو INT8:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

تحديثات النظام (إصدار Founders Edition)

الحفاظ على تحديث جهاز DGX Spark Founders Edition الخاص بك أمر بالغ الأهمية للأداء والأمان. توفر NVIDIA طريقتين أساسيتين لتحديث نظام تشغيل الجهاز وبرامج التشغيل والبرامج الثابتة (firmware).

استخدام DGX Dashboard (موصى به)

تعد لوحة تحكم DGX الطريقة الموصى بها لإجراء تحديثات النظام وضمان التوافق. فهي تتيح لك:

  • عرض تحديثات النظام المتاحة
  • تثبيت تصحيحات الأمان وتحديثات النظام
  • إدارة تحديثات برامج تشغيل NVIDIA والبرامج الثابتة

تحديثات النظام اليدوية

للمستخدمين المتقدمين، يمكن إجراء التحديثات يدويًا عبر الجهاز (terminal):

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
تحذير

تأكد من توصيل نظامك بمصدر طاقة مستقر وأنك قمت بنسخ البيانات الهامة احتياطيًا قبل إجراء التحديثات.

الخطوات التالية

لمزيد من التعلم والدعم، راجع وثائق Ultralytics YOLO26.

الأسئلة الشائعة

كيف يمكنني نشر Ultralytics YOLO26 على NVIDIA DGX Spark؟

نشر Ultralytics YOLO26 على NVIDIA DGX Spark أمر مباشر. يمكنك استخدام صورة Docker المعدة مسبقًا للإعداد السريع أو تثبيت الحزم المطلوبة يدويًا. يمكن العثور على خطوات مفصلة لكل نهج في قسمي البدء السريع باستخدام Docker و البدء بالتثبيت الأصلي.

ما الأداء الذي يمكنني توقعه من YOLO26 على NVIDIA DGX Spark؟

تقدم نماذج YOLO26 أداءً ممتازًا على DGX Spark بفضل شريحة GB10 Grace Blackwell Superchip. يوفر تنسيق TensorRT أفضل أداء للاستدلال. تحقق من قسم جدول المقارنة التفصيلي للحصول على نتائج معايير محددة عبر أحجام وتنسيقات النماذج المختلفة.

لماذا يجب أن أستخدم TensorRT لـ YOLO26 على DGX Spark؟

يوصى بشدة باستخدام TensorRT لنشر نماذج YOLO26 على DGX Spark نظرًا لأدائه الأمثل. فهو يسرع الاستدلال من خلال الاستفادة من إمكانيات Blackwell GPU، مما يضمن أقصى قدر من الكفاءة والسرعة. تعرف على المزيد في قسم استخدام TensorRT على NVIDIA DGX Spark.

كيف يقارن DGX Spark بأجهزة Jetson لـ YOLO26؟

يوفر DGX Spark قوة حوسبة أكبر بكثير من أجهزة Jetson مع ما يصل إلى 1 PFLOP من أداء الذكاء الاصطناعي و 128 جيجابايت من الذاكرة الموحدة، مقارنة بـ 2070 TFLOPS و 128 جيجابايت من الذاكرة في Jetson AGX Thor. تم تصميم DGX Spark كحاسوب فائق للذكاء الاصطناعي مكتبي، بينما تعتبر أجهزة Jetson أنظمة مدمجة محسنة للنشر عند الحافة (edge deployment).

هل يمكنني استخدام نفس صورة Docker لـ DGX Spark و Jetson AGX Thor؟

نعم! تدعم صورة Docker ultralytics/ultralytics:latest-nvidia-arm64 كلاً من NVIDIA DGX Spark (مع DGX OS) و Jetson AGX Thor (مع JetPack 7.0)، حيث يستخدم كلاهما معمارية ARM64 مع CUDA 13 ومجموعات برامج متشابهة.

التعليقات