Meet YOLO26: next-gen vision AI.

Link to this sectionدليل البدء السريع: NVIDIA DGX Spark مع Ultralytics YOLO26#

يقدم هذا الدليل الشامل جولة تفصيلية لنشر Ultralytics YOLO26 على NVIDIA DGX Spark، وهو حاسوب فائق الجودة مدمج لسطح المكتب من NVIDIA مخصص للذكاء الاصطناعي. بالإضافة إلى ذلك، يعرض الدليل معايير الأداء لتوضيح قدرات YOLO26 على هذا النظام القوي.

NVIDIA DGX Spark AI workstation overview

ملاحظة

تم اختبار هذا الدليل مع NVIDIA DGX Spark Founders Edition الذي يعمل بنظام DGX OS القائم على Ubuntu. ومن المتوقع أن يعمل مع أحدث إصدارات DGX OS.

Link to this sectionما هو NVIDIA DGX Spark؟#

NVIDIA DGX Spark هو حاسوب فائق الجودة مدمج لسطح المكتب مخصص للذكاء الاصطناعي، يعمل بواسطة الشريحة الفائقة NVIDIA GB10 Grace Blackwell. يوفر أداء حوسبة ذكاء اصطناعي يصل إلى 1 بيتا فلوب (petaFLOP) بدقة FP4، مما يجعله مثاليًا للمطورين والباحثين وعلماء البيانات الذين يحتاجون إلى قدرات ذكاء اصطناعي قوية في شكل سطح مكتب.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Link to this sectionالمواصفات الرئيسية#

المواصفاتالتفاصيل
أداء الذكاء الاصطناعيما يصل إلى 1 PFLOP (دقة FP4)
وحدة معالجة الرسومات (GPU)بنية NVIDIA Blackwell مع الجيل الخامس من Tensor Cores، والجيل الرابع من RT Cores
وحدة المعالجة المركزية (CPU)معالج Arm بـ 20 نواة (10 Cortex-X925 + 10 Cortex-A725)
الذاكرةذاكرة نظام موحدة 128 جيجابايت LPDDR5x، واجهة 256 بت، 4266 ميجاهرتز، نطاق ترددي 273 جيجابايت/ثانية
التخزين1 تيرابايت أو 4 تيرابايت NVMe M.2 مع تشفير ذاتي
الشبكة1x RJ-45 (10 جيجابت إيثرنت)، ConnectX-7 Smart NIC، Wi-Fi 7، Bluetooth 5.4
الاتصال4x USB Type-C، 1x HDMI 2.1a، صوت متعدد القنوات عبر HDMI
معالجة الفيديو1x NVENC، 1x NVDEC

Link to this sectionنظام DGX OS#

NVIDIA DGX OS هو توزيعة Linux مخصصة توفر أساس نظام تشغيل مستقر ومختبر ومدعوم لتشغيل تطبيقات الذكاء الاصطناعي، والتعلم الآلي، والتحليلات على أنظمة DGX. وهو يتضمن:

  • أساس Linux قوي ومحسّن لأحمال عمل الذكاء الاصطناعي
  • برامج تشغيل وإعدادات نظام مهيأة مسبقًا لأجهزة NVIDIA
  • تحديثات أمنية وإمكانيات صيانة النظام
  • التوافق مع نظام برمجيات NVIDIA الأوسع

يتبع DGX OS جدول إصدارات منتظم مع توفير التحديثات عادةً مرتين سنويًا (حوالي فبراير وأغسطس)، مع توفير تصحيحات أمنية إضافية بين الإصدارات الرئيسية.

Link to this sectionلوحة تحكم DGX#

يأتي DGX Spark مزودًا بـ DGX Dashboard مدمج يوفر:

  • مراقبة النظام في الوقت الفعلي: نظرة عامة على مقاييس التشغيل الحالية للنظام
  • تحديثات النظام: القدرة على تطبيق التحديثات مباشرة من لوحة التحكم
  • إعدادات النظام: تغيير اسم الجهاز وتكوينات أخرى
  • JupyterLab متكامل: الوصول إلى Jupyter Notebooks المحلية للتطوير

NVIDIA DGX management dashboard interface

Link to this sectionالوصول إلى لوحة التحكم#

انقر فوق زر "Show Apps" في الزاوية السفلية اليسرى من سطح مكتب Ubuntu، ثم حدد "DGX Dashboard" لفتحه في متصفحك.

JupyterLab متكامل

تتضمن لوحة التحكم مثيل JupyterLab متكامل ينشئ تلقائيًا بيئة افتراضية ويثبت الحزم الموصى بها عند بدء التشغيل. يتم تعيين منفذ مخصص لكل حساب مستخدم للوصول إلى JupyterLab.

Link to this sectionالبدء السريع مع Docker#

أسرع طريقة للبدء باستخدام Ultralytics YOLO26 على NVIDIA DGX Spark هي التشغيل باستخدام صور Docker جاهزة. صورة Docker نفسها التي تدعم Jetson AGX Thor (JetPack 7.0) تعمل على DGX Spark مع نظام DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

بعد القيام بذلك، انتقل إلى قسم استخدام TensorRT على NVIDIA DGX Spark.

Link to this sectionالبدء بالتثبيت الأصلي#

للتثبيت الأصلي بدون Docker، اتبع الخطوات التالية.

Link to this sectionتثبيت حزمة Ultralytics#

هنا سنقوم بتثبيت حزمة Ultralytics على DGX Spark مع التبعيات الاختيارية حتى نتمكن من تصدير نماذج PyTorch إلى تنسيقات مختلفة أخرى. سنركز بشكل أساسي على صادرات NVIDIA TensorRT لأن TensorRT سيضمن لنا الحصول على أقصى أداء من DGX Spark.

  1. تحديث قائمة الحزم، وتثبيت pip والترقية إلى أحدث إصدار

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. تثبيت حزمة ultralytics عبر pip مع التبعيات الاختيارية

    pip install ultralytics[export]
  3. إعادة تشغيل الجهاز

    sudo reboot

Link to this sectionتثبيت PyTorch و Torchvision#

تثبيت ultralytics أعلاه سيقوم بتثبيت Torch و Torchvision. ومع ذلك، قد لا تكون هذه الحزم المثبتة عبر pip محسنة بالكامل لبنية ARM64 الخاصة بـ DGX Spark مع CUDA 13. لذلك، نوصي بتثبيت الإصدارات المتوافقة مع CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
معلومات

عند تشغيل PyTorch 2.9.1 على NVIDIA DGX Spark، قد تواجه UserWarning التالية عند تهيئة CUDA (على سبيل المثال عند تشغيل yolo checks أو yolo predict وما إلى ذلك):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

يمكن تجاهل هذا التحذير بأمان. ولحل هذه المشكلة بشكل دائم، تم تقديم إصلاح في PyTorch PR #164590 والذي سيتم تضمينه في إصدار PyTorch 2.10.

Link to this sectionتثبيت onnxruntime-gpu#

لا تحتوي حزمة onnxruntime-gpu المستضافة على PyPI على ثنائيات aarch64 لأنظمة ARM64. لذا نحتاج إلى تثبيت هذه الحزمة يدويًا. هذه الحزمة مطلوبة لبعض عمليات التصدير.

هنا سنقوم بتنزيل وتثبيت onnxruntime-gpu 1.24.0 مع دعم Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Link to this sectionاستخدام TensorRT على NVIDIA DGX Spark#

من بين جميع تنسيقات تصدير النماذج التي تدعمها Ultralytics، يوفر TensorRT أعلى أداء للاستدلال على NVIDIA DGX Spark، مما يجعله توصيتنا الأولى لعمليات النشر. للحصول على تعليمات الإعداد والاستخدام المتقدم، راجع دليل تكامل TensorRT المخصص الخاص بنا.

Link to this sectionتحويل النموذج إلى TensorRT وتشغيل الاستدلال#

يتم تحويل نموذج YOLO26n بتنسيق PyTorch إلى TensorRT لتشغيل الاستدلال باستخدام النموذج المصدر.

مثال
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
ملاحظة

قم بزيارة صفحة التصدير للوصول إلى وسيطات إضافية عند تصدير النماذج إلى تنسيقات نماذج مختلفة

Link to this sectionمعايير أداء NVIDIA DGX Spark YOLO11#

تم تشغيل معايير أداء YOLO11 بواسطة فريق Ultralytics على تنسيقات نماذج متعددة لقياس السرعة والدقة: PyTorch، TorchScript، ONNX، OpenVINO، TensorRT، TF SavedModel، TF GraphDef، TF Lite، MNN، NCNN، ExecuTorch. تم تشغيل المعايير على NVIDIA DGX Spark بدقة FP32 الدقة مع حجم صورة إدخال افتراضي قدره 640.

Link to this sectionجدول مقارنة مفصل#

يمثل الجدول أدناه نتائج المعايير لخمسة نماذج مختلفة (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) عبر تنسيقات متعددة، مما يعطينا الحالة والحجم ومقياس mAP50-95(B) ووقت الاستدلال لكل تركيبة.

الأداء
التنسيقالحالةالحجم على القرص (ميجابايت)mAP50-95(B)وقت الاستدلال (ms/im)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

تمت مقارنة الأداء باستخدام Ultralytics 8.3.249

Link to this sectionإعادة إنتاج نتائجنا#

لإعادة إنتاج معايير Ultralytics المذكورة أعلاه على جميع تنسيقات التصدير، قم بتشغيل هذا الكود:

مثال
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

لاحظ أن نتائج قياس الأداء قد تختلف بناءً على التكوين الدقيق للأجهزة والبرامج الخاصة بالنظام، بالإضافة إلى حمل العمل الحالي للنظام وقت تشغيل الاختبارات. للحصول على أكثر النتائج موثوقية، استخدم مجموعة بيانات تحتوي على عدد كبير من الصور، على سبيل المثال data='coco.yaml' (5000 صورة تحقق).

Link to this sectionأفضل الممارسات لـ NVIDIA DGX Spark#

عند استخدام NVIDIA DGX Spark، هناك بعض أفضل الممارسات التي يجب اتباعها لتمكين أقصى أداء عند تشغيل YOLO26.

  1. مراقبة أداء النظام

    استخدم أدوات المراقبة من NVIDIA لتتبع استخدام GPU و CPU:

    nvidia-smi
  2. تحسين استخدام الذاكرة

    مع ذاكرة موحدة بسعة 128 جيجابايت، يمكن لـ DGX Spark التعامل مع أحجام دفعات ونماذج كبيرة. فكر في زيادة حجم الدفعة لتحسين الإنتاجية:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. استخدم TensorRT مع FP16 أو INT8

    للحصول على أفضل أداء، قم بتصدير النماذج بدقة FP16 أو INT8:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Link to this sectionتحديثات النظام (إصدار المؤسسين Founders Edition)#

يعد الحفاظ على تحديث جهاز DGX Spark Founders Edition أمراً بالغ الأهمية للأداء والأمان. توفر NVIDIA طريقتين أساسيتين لتحديث نظام التشغيل وبرامج التشغيل والبرامج الثابتة.

Link to this sectionاستخدام لوحة تحكم DGX (موصى به)#

تعد لوحة تحكم DGX الطريقة الموصى بها لإجراء تحديثات النظام لضمان التوافق. وهي تتيح لك القيام بما يلي:

  • عرض تحديثات النظام المتاحة
  • تثبيت تصحيحات الأمان وتحديثات النظام
  • إدارة تحديثات برنامج تشغيل NVIDIA والبرامج الثابتة

Link to this sectionتحديثات النظام اليدوية#

للمستخدمين المتقدمين، يمكن إجراء التحديثات يدوياً عبر الطرفية (terminal):

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
تحذير

تأكد من توصيل نظامك بمصدر طاقة مستقر وأنك قمت بنسخ البيانات المهمة احتياطياً قبل إجراء التحديثات.

Link to this sectionالخطوات التالية#

لمزيد من التعلم والدعم، راجع وثائق Ultralytics YOLO26.

Link to this sectionالأسئلة الشائعة#

Link to this sectionكيف يمكنني نشر Ultralytics YOLO26 على NVIDIA DGX Spark؟#

نشر Ultralytics YOLO26 على NVIDIA DGX Spark عملية مباشرة. يمكنك استخدام صورة Docker الجاهزة للإعداد السريع أو تثبيت الحزم المطلوبة يدوياً. يمكن العثور على خطوات مفصلة لكل نهج في قسمي البدء السريع باستخدام Docker و البدء بالتثبيت الأصلي.

Link to this sectionما الأداء الذي يمكنني توقعه من YOLO26 على NVIDIA DGX Spark؟#

تقدم نماذج YOLO26 أداءً ممتازاً على DGX Spark بفضل شريحة GB10 Grace Blackwell Superchip. يوفر تنسيق TensorRT أفضل أداء للاستدلال. تحقق من قسم جدول المقارنة التفصيلي للحصول على نتائج معيارية محددة عبر أحجام وتنسيقات النماذج المختلفة.

Link to this sectionلماذا يجب علي استخدام TensorRT لـ YOLO26 على DGX Spark؟#

يوصى بشدة باستخدام TensorRT لنشر نماذج YOLO26 على DGX Spark نظراً لأدائه الأمثل. فهو يعمل على تسريع الاستدلال من خلال الاستفادة من قدرات Blackwell GPU، مما يضمن أقصى قدر من الكفاءة والسرعة. تعرف على المزيد في قسم استخدام TensorRT على NVIDIA DGX Spark.

Link to this sectionكيف يقارن DGX Spark بأجهزة Jetson بالنسبة لـ YOLO26؟#

يوفر DGX Spark ما يصل إلى 1 PFLOP من أداء الذكاء الاصطناعي و128 جيجابايت من الذاكرة الموحدة، مقارنة بـ 2070 TFLOPS و128 جيجابايت من الذاكرة في Jetson AGX Thor. تم تصميم DGX Spark كحاسوب فائق للذكاء الاصطناعي مكتبي، بينما تعد أجهزة Jetson أنظمة مدمجة محسنة للنشر على الحافة (edge).

Link to this sectionهل يمكنني استخدام نفس صورة Docker لـ DGX Spark و Jetson AGX Thor؟#

نعم! تدعم صورة Docker ultralytics/ultralytics:latest-nvidia-arm64 كلاً من NVIDIA DGX Spark (مع نظام DGX OS) و Jetson AGX Thor (مع JetPack 7.0)، حيث يستخدم كلاهما بنية ARM64 مع CUDA 13 ومجموعات برمجية مماثلة.

التعليقات