Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO في مقابل YOLO26#

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، مدفوعاً بالحاجة إلى بنيات توازن بين الدقة العالية والاستدلال منخفض التأخير. تتعمق هذه المقارنة في التفاصيل التقنية لـ DAMO-YOLO و Ultralytics YOLO26، وتستكشف ابتكاراتهما المعمارية ومنهجيات التدريب وحالات الاستخدام المثالية.

سواء كنت تقوم بنشر نماذج الرؤية على أجهزة الحافة (edge devices) أو تبني خطوط معالجة سحابية ذات إنتاجية عالية، فإن فهم الفروق الدقيقة بين هذه النماذج أمر بالغ الأهمية لاتخاذ قرارات معمارية مستنيرة في تطوير الذكاء الاصطناعي الحديث.

Link to this sectionDAMO-YOLO: البحث في البنية العصبية على نطاق واسع#

تم إصدار DAMO-YOLO، الذي طورته Alibaba Group، في 23 نوفمبر 2022. صممه كل من Xianzhe Xu و Yiqi Jiang و Weihua Chen و Yilun Huang و Yuan Zhang و Xiuyu Sun، ويركز النموذج بشكل كبير على الاكتشاف الآلي للبنيات الفعالة باستخدام بحث البنية العصبية (NAS).

يمكنك مراجعة البحث الأصلي في ورقة ArXiv الخاصة بهم أو استكشاف الكود المصدري على مستودع DAMO-YOLO على GitHub.

Link to this sectionالميزات المعمارية الرئيسية#

يقدم DAMO-YOLO العديد من الابتكارات التقنية المصممة لدفع حدود الكشف عن الأجسام في الوقت الفعلي:

  • بنيات MAE-NAS: يستخدم DAMO-YOLO بحثاً تطورياً متعدد الأهداف للعثور على البنيات الأساسية (backbones) المثلى. يكتشف نهج NAS هذا البنيات التي توازن بدقة بين دقة الكشف وسرعة الاستدلال على أجهزة محددة.
  • Efficient RepGFPN: تصميم عنق ثقيل يحسن دمج الميزات بشكل كبير، وهو مفيد للغاية عند تحليل المشاهد المعقدة مثل تلك الموجودة في الصور الجوية.
  • تصميم ZeroHead: رأس كشف مبسط للغاية يقلل من التعقيد الحسابي لطبقات التنبؤ النهائية.
  • AlignedOTA والتقطير: يستخدم DAMO-YOLO تعيين النقل الأمثل المحاذي (AlignedOTA) لحل غموض تعيين التسميات، مقترناً باستراتيجية قوية لتعزيز تقطير المعرفة لزيادة دقة نماذج الطلاب الأصغر باستخدام شبكات معلمين أكبر.

تعرف على المزيد حول DAMO-YOLO

Link to this sectionميزة Ultralytics: YOLO26#

تم إصدار YOLO26 في 14 يناير 2026 بواسطة Glenn Jocher و Jing Qiu في Ultralytics، وهو يمثل قمة الرؤية الحاسوبية عالية الأداء والقابلة للوصول. بناءً على إرث YOLO11 و YOLOv10، تم تصميم YOLO26 من الألف إلى الياء للنشر على الحافة (edge-first)، وتعدد الاستخدامات متعدد الوسائط، وسهولة الاستخدام التي لا تضاهى.

Link to this sectionابتكارات YOLO26#

يقدم Ultralytics YOLO26 العديد من الميزات الرائدة التي تجعله الخيار النهائي لتطبيقات الرؤية الحاسوبية الحديثة:

  • تصميم شامل (End-to-End) خالٍ من NMS: يلغي YOLO26 محلياً معالجة ما بعد الكشف غير الأقصى (NMS). هذا النهج الشامل، الذي تم ريادته في YOLOv10، يبسط خطوط معالجة النشر بشكل جذري ويضمن استدلالاً حتمياً ومنخفض التأخير.
  • استدلال أسرع بنسبة تصل إلى 43% على CPU: تم تحسين YOLO26 معمارياً لحوسبة الحافة، ويوفر سرعة استثنائية على أجهزة الحافة و وحدات المعالجة المركزية (CPUs) القياسية، مما يجعله مثالياً لأجهزة IoT التي تعمل بالبطارية.
  • مُحسِّن MuSGD: مستوحى من تدريب النماذج اللغوية الكبيرة (مثل Kimi K2 من Moonshot AI)، يدمج YOLO26 مزيجاً من SGD و Muon. يجلب هذا استقرار تدريب النماذج اللغوية الكبيرة إلى الرؤية الحاسوبية، مما يؤدي إلى تقارب أسرع وأكثر موثوقية.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، يتم تبسيط رسم بياني للنموذج، مما يسمح بالتصدير السلس إلى تنسيقات مثل ONNX و TensorRT.
  • ProgLoss + STAL: توفر دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي ميزة حاسمة لـ عمليات الطائرات بدون طيار و الزراعة.
تحسينات خاصة بالمهمة

يتضمن YOLO26 تحسينات متخصصة عبر وسائط متعددة: بروتو متعدد المقاييس لـ تجزئة المثيلات، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضع، وخسارة الزاوية المتقدمة للتخفيف من مشاكل الحدود في الكشف عن مربع التحديد الموجه (OBB).

تعرف على المزيد حول YOLO26

Link to this sectionمقارنة الأداء#

عند تقييم هذه النماذج، يعد التوازن بين الدقة (mAP) والكفاءة الحسابية (السرعة/FLOPs) أمراً بالغ الأهمية. يسلط الجدول أدناه الضوء على كيفية مقارنة هذه النماذج باستخدام مجموعة بيانات COCO القياسية في الصناعة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما رأينا أعلاه، يوفر YOLO26 باستمرار دقة أعلى مع عدد أقل بكثير من المعلمات و FLOPs، مما يؤدي إلى بنية أكثر كفاءة بكثير لكل من التدريب والاستدلال.

Link to this sectionكفاءة التدريب وسهولة الاستخدام#

Link to this sectionتعقيدات DAMO-YOLO#

بينما يحقق DAMO-YOLO دقة تنافسية، فإن منهجية تدريبه معقدة للغاية. إن الاعتماد على بحث البنية العصبية (NAS) وتقطير المعرفة الثقيل يعني أن تدريب نموذج مخصص يتطلب غالباً موارد GPU كبيرة ومعرفة متخصصة. يمكن لهذه العملية متعددة المراحل—تدريب نموذج معلم ضخم للتقطير في نموذج طالب أصغر—أن تعيق فرق الهندسة الرشيقة التي تحاول التكرار بسرعة على مجموعات البيانات المخصصة.

Link to this sectionتجربة Ultralytics المبسطة#

في المقابل، تم تصميم Ultralytics YOLO26 لسهولة الاستخدام من البداية إلى الاحتراف. يتم تجريد دورة حياة التدريب والتحقق والنشر بأكملها خلف Python API و CLI نظيف وموحد. علاوة على ذلك، يتطلب YOLO26 ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالنماذج القائمة على Transformer مثل RT-DETR، مما يسمح للباحثين بتدريب نماذج متطورة على أجهزة المستهلك العادية.

فيما يلي مثال على مدى بساطة تدريب وتقييم وتصدير نموذج YOLO26 باستخدام Ultralytics SDK:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

بالنسبة للفرق التي تفضل بيئة بدون كود، توفر منصة Ultralytics واجهة بديهية لتعليق البيانات، والتدريب السحابي، والنشر السلس.

Link to this sectionتطبيقات العالم الحقيقي#

يعتمد اختيار البنية الصحيحة بشكل كبير على بيئة النشر المستهدفة وقيود الأجهزة.

Link to this sectionمراقبة الجودة الصناعية#

بالنسبة لـ أتمتة التصنيع عالية السرعة، يمكن أن يعمل DAMO-YOLO بشكل جيد على أجهزة GPU مخصصة. ومع ذلك، فإن YOLO26 هو الخيار المفضل لخطوط التجميع الحديثة. يضمن تصميمه الشامل الخالي من NMS استدلالاً حتمياً وخالياً من التذبذب، وهو أمر ضروري عند مزامنة البيانات المرئية مع المشغلات الروبوتية في الوقت الفعلي.

Link to this sectionذكاء الحافة والأجهزة المحمولة#

يتطلب نشر الرؤية الحاسوبية على الأجهزة التي تعمل بالبطارية كفاءة فائقة. بينما يعتمد DAMO-YOLO على أعناق RepGFPN محددة، تم تحسين YOLO26n (Nano) خصيصاً لحوسبة الحافة. إن إزالة DFL و الاستدلال الأسرع بنسبة 43% على CPU يجعله الحل الأمثل للكاميرات الذكية، وتطبيقات الهاتف المحمول، و أنظمة إنذار الأمن.

Link to this sectionمتطلبات المشاريع متعددة الوسائط#

إذا كان المشروع يتطلب أكثر من مجرد الكشف عن الأجسام—مثل تحليل ميكانيكا اللاعب في الرياضة باستخدام تقدير الوضع، أو استخراج حدود البكسل الدقيقة باستخدام تجزئة المثيلات—يوفر YOLO26 دعماً محلياً عبر كل هذه المهام داخل قاعدة كود واحدة وموحدة. يقتصر DAMO-YOLO بشكل صارم على كشف مربع التحديد.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين DAMO-YOLO و YOLO26 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار DAMO-YOLO#

يعد DAMO-YOLO خياراً قوياً لما يلي:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار YOLO26#

يوصى بـ YOLO26 لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالخلاصة#

تمثل كلتا البنيتين إنجازات مهمة في مجال التعلم العميق. يقدم DAMO-YOLO لمحة رائعة عن قوة بحث البنية العصبية وتقنيات التقطير المصممة لمعايير الأجهزة المحددة.

ومع ذلك، بالنسبة للمطورين والباحثين والشركات التي تبحث عن حل جاهز للإنتاج، يبرز Ultralytics YOLO26 كخيار متفوق. إن مزيجه من التصميم الشامل الخالي من NMS، ومكاسب استدلال CPU الهائلة، وتعدد الوسائط، والتكامل في نظام Ultralytics البيئي الذي يتم صيانته جيداً يجعله الأداة الأكثر قوة وعملية لحل تحديات الرؤية الحاسوبية في العالم الحقيقي اليوم.

للمستخدمين المهتمين باستكشاف نماذج أخرى داخل نظام Ultralytics البيئي، تتوفر وثائق شاملة لـ YOLO11 و YOLOv8 و RT-DETR القائم على Transformer.

المساهمون

التعليقات