تخطي إلى المحتوى

YOLO YOLO26: مواجهة تقنية للكشف عن الكائنات في الوقت الفعلي

كان الدافع وراء تطور الرؤية الحاسوبية هو السعي المستمر لتحقيق الكفاءة والسرعة والدقة. ومن الأسماء البارزة في هذا المجالYOLO الذي طورته مجموعة Alibaba، و YOLO26 المتطور، وهو أحدث إصدار من Ultralytics. بينماYOLO ابتكارات مهمة في مجال البحث عن البنية العصبية (NAS) في عام 2022، أعاد YOLO26 تعريف المشهد في عام 2026 بتصميم شامل NMS مصمم خصيصًا للنشر المتطور وقابلية التوسع في الإنتاج.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين، ويقارن بين هياكلهما ومقاييس أدائهما ومدى ملاءمتهما للتطبيقات الواقعية.

YOLO: ابتكار في البحث عن البنية العصبية

تم تطوير YOLO (Distillation-Enhanced Neural Architecture Search-based YOLO) بواسطة أكاديمية DAMO التابعة لشركة Alibaba، وهو يركز على أتمتة تصميم هياكل الكشف الأساسية لتحقيق أقصى قدر من الأداء في ظل قيود زمنية محددة.

الميزات المعمارية الرئيسية

YOLO بعدة تقنيات متقدمة:

  • البحث عن البنية العصبية (NAS): على عكس البنى الأساسية المصممة يدويًا (مثل CSPDarknet)،YOLO MAE-NAS (طريقة أتمتة البحث عن البنية العصبية الفعالة) لاكتشاف الهياكل المثلى. وينتج عن ذلك شبكة طوبولوجية مخصصة خصيصًا لتحقيق التوازن بين عمليات النقطة العائمة (FLOPs) والدقة.
  • RepGFPN: تصميم ثقيل الرقبة يستخدم شبكات هرمية عامة للميزات (GFPN) مقترنة بإعادة تحديد المعلمات. وهذا يسمح بدمج الميزات بكفاءة عبر مستويات مختلفة، مما يحسن من كشف الأجسام ذات الأحجام المتفاوتة.
  • ZeroHead: رأس كشف مبسط يقلل من عبء الحساب أثناء الاستدلال.
  • AlignedOTA: إستراتيجية ديناميكية لإسناد الملصقات تحل عدم التوافق بين مهام التصنيف والانحدار أثناء التدريب.

الأداء والقيود

YOLO قفزة كبيرة إلى الأمام في عام 2022، حيث تفوق على الإصدارات السابقة مثل YOLOv6 و YOLOv7 في معايير قياس محددة. ومع ذلك، فإن اعتماده على خطوط تدريب معقدة — وتحديدًا الحاجة إلى مرحلة تقطير باستخدام نموذج تعليمي كبير — يمكن أن يجعله مرهقًا للمطورين الذين يحتاجون إلى التكرار السريع على مجموعات بيانات مخصصة. بالإضافة إلى ذلك، على الرغم من قوة RepGFPN، إلا أنه يمكن أن يستهلك الكثير من الذاكرة مقارنة بالبنى الحديثة المبسطة.

تفاصيل DAMO-YOLO:

  • المؤلفون: شيانزه شو، ييكي جيانغ، ويهوا تشين، ييلون هوانغ، يوان تشانغ، وشيويو سون
  • المنظمة: مجموعة علي بابا
  • التاريخ: 2022-11-23
  • Arxiv: 2211.15444v2
  • GitHub: YOLO

Ultralytics : ثورة الحافة الشاملة

تم إصدار Ultralytics في يناير 2026، وهو يعتمد على إرث YOLOv8 و YOLO11، حيث أدخل تغييرًا جذريًا في طريقة معالجة عمليات الكشف. وقد تم تصميمه ليس فقط لتحقيق نتائج عالية في الاختبارات المعيارية، بل أيضًا للتطبيق العملي والسلس على كل شيء بدءًا من خوادم السحابة وحتى أجهزة إنترنت الأشياء ذات الموارد المحدودة.

هندسة معمارية متطورة

يضم YOLO26 العديد من التطورات الحديثة التي تميزه عن أجهزة الكشف التقليدية القائمة على المراسي أو الخالية من المراسي:

  • تصميم NMS من البداية إلى النهاية: ربما يكون التغيير الأكثر أهمية هو إزالة Non-Maximum Suppression (NMS). من خلال اعتماد استراتيجية المطابقة الفردية أثناء التدريب (التي ابتكرتها YOLOv10)، يقدم النموذج التنبؤات النهائية مباشرة. وهذا يزيل تباين زمن الاستجابة الناتج عن NMS والذي غالبًا ما يمثل عقبة في المشاهد المزدحمة.
  • محسّن MuSGD: مستوحى من الابتكارات في تدريب نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 محسّنًا هجينًا يجمع بين SGD Muon. وهذا يوفر استقرارًا غير مسبوق لتدريب الرؤية الحاسوبية، مما يؤدي إلى تقارب أسرع.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، يتم تبسيط طبقة الإخراج. وهذا يجعل التصدير إلى تنسيقات مثل ONNX و TensorRT أكثر نظافة، مما يعزز بشكل كبير التوافق مع الأجهزة الطرفية والميكروكونترولرات منخفضة الطاقة.
  • ProgLoss + STAL: يوفر دمج Progressive Loss و Soft-Target Anchor Labeling (STAL) تحسينات قوية في اكتشاف الأجسام الصغيرة، وهو مطلب أساسي للصور الجوية والروبوتات.

تفوق في الانتشار

تم تصميم YOLO26 من أجل السرعة. فهو يوفر CPU أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة، مما يجعله الخيار المثالي للتطبيقات التي تعمل على Raspberry Pi أو وحدات المعالجة المركزية المحمولة أو أجهزة الكمبيوتر الشخصية Intel .

تعرف على المزيد حول YOLO26

تفاصيل YOLO26:

تحليل الأداء المقارن

يُقارن الجدول التالي أداءYOLO YOLO26 عبر مختلف أحجام النماذج. يُظهر YOLO26 كفاءة فائقة، حيث يحقق mAP مماثل أو أفضل mAP زمن انتقال أقل بكثير، لا سيما على CPU حيث تبرز NMS .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

ميزة زمن الاستجابة

ال CPU ONNX لـ YOLO26 تبرز الميزة الهائلة للتصميم NMS. من خلال إزالة خطوة المعالجة اللاحقة، يضمن YOLO26 أن يكون وقت الاستدلال حتميًا ومنخفضًا باستمرار، وهو أمر بالغ الأهمية لتحليلات الفيديو في الوقت الفعلي.

ميزة Ultralytics

بينماYOLO رؤى أكاديمية مثيرة للاهتمام في مجال البحث المعماري، يوفر Ultralytics حلاً شاملاً مصمماً لعمليات التطوير الحديثة.

1. سهولة الاستخدام والنظام البيئي

قد يشكل تعقيد التدريب القائم على التقطيرYOLO عائقًا أمام الدخول. في المقابل، Ultralytics تجربة "من الصفر إلى القمة". باستخدام Python موحدة، يمكن للمطورين تحميل النماذج وتدريبها ونشرها في غضون دقائق. تعمل Ultralytics على تبسيط ذلك بشكل أكبر من خلال توفير التدريب السحابي وإدارة مجموعات البيانات وأدوات التعليق التلقائي.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)

2. تنوع المهام

YOLO في الأساس بنية لكشف الأجسام. أما Ultralytics فهي أداة قوية متعددة المهام. يدعم إطار عمل واحد ما يلي:

  • تجزئة المثيلات: بما في ذلك التحسينات الخاصة بالمهام مثل فقدان التجزئة الدلالية.
  • تقدير الوضع: استخدام تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) للحصول على نقاط مرجعية عالية الدقة.
  • OBB: فقدان الزاوية المتخصص للمربعات المحددة الاتجاه، وهو أمر ضروري لتحليل صور الأقمار الصناعية.
  • التصنيف: تصنيف الصور عالية السرعة.

3. كفاءة التدريب والذاكرة

تم تحسين YOLO26 للأجهزة الاستهلاكية. تسمح تقنيات مثل مُحسّن MuSGD بتدريب مستقر مع أحجام دفعات أكبر مقارنةً بالمحولات الهجينة التي تستهلك الكثير من الذاكرة أو بنى NAS القديمة. هذا التعميم لتدريب الذكاء الاصطناعي يعني أنك لا تحتاج إلى مجموعة H100 مؤسسية لضبط نموذج متطور.

حالات الاستخدام المثالية

يعتمد اختيار النموذج المناسب على القيود المحددة الخاصة بك، ولكن بالنسبة لمعظم سيناريوهات الإنتاج، يوفر YOLO26 أفضل عائد على الاستثمار.

  • اخترYOLO : كنت باحثًا يدرس بشكل خاص منهجيات البحث في الهندسة العصبية أو لديك خط إنتاج قديم مبني على قاعدة كود tinyvision.
  • اختر Ultralytics إذا:
    • نشر الحافة: تحتاج إلى التشغيل على Raspberry Pi أو الأجهزة المحمولة أو وحدات المعالجة المركزية حيث يوفر التصميم NMS سرعات هائلة.
    • التطوير السريع: تحتاج إلى نموذج يسهل تدريبه والتحقق من صحته وتصديره إلى تنسيقات مثل CoreML TFLite إعدادات معقدة.
    • مهام الرؤية المعقدة: يتطلب مشروعك أكثر من مجرد مربعات حدودية، مثل تقسيم الكائنات أو تتبع وضعية الإنسان.
    • الصيانة طويلة الأمد: تحتاج إلى نموذج مدعوم بمجتمع نشط وتحديثات متكررة ووثائق شاملة.

الخلاصة

يمثل كل منYOLO YOLO26 معلمين هامين في مجال اكتشاف الأجسام.YOLO إمكانات البحث الآلي في البنية، مما دفع حدود ما كان ممكنًا في عام 2022. ومع ذلك، فإن YOLO26 هو الخيار النهائي لعام 2026 وما بعده. من خلال حل NMS وتحسين CPU ، ودمج تقنيات التدريب المتقدمة مثل MuSGD، Ultralytics نموذجًا ليس فقط أسرع وأكثر دقة، ولكنه أيضًا أسهل في الاستخدام بشكل ملحوظ.

بالنسبة للمطورين الذين يسعون إلى بناء تطبيقات رؤية حاسوبية قوية ومستقبلية، يوفر Ultralytics الأدوات والنماذج والدعم اللازم لتحقيق النجاح.

للمهتمين باستكشاف بنى أخرى عالية الأداء، ننصح بالاطلاع على YOLO11 للكشف عن الأغراض العامة أو RT-DETR للتطبيقات القائمة على المحولات.


تعليقات