Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 مقابل YOLO11: تحليل متعمق لهياكل اكتشاف الكائنات في الوقت الفعلي#

يتطور مجال الرؤية الحاسوبية باستمرار، حيث تدفع الهياكل الجديدة حدود ما هو ممكن على أجهزة الحافة وخوادم السحابة. اثنان من أبرز المنافسين في مجال اكتشاف الكائنات في الوقت الفعلي حالياً هما RTDETRv2 و YOLO11. وعلى الرغم من أن كلا النموذجين يقدمان أداءً استثنائياً، إلا أنهما يمثلان فلسفات هيكلية مختلفة تماماً: النهج المعتمد على Transformer مقابل الشبكات العصبية التلافيفية (CNN) عالية التحسين.

في هذه المقارنة التقنية الشاملة، سنستكشف الهياكل، ومقاييس الأداء، ومنهجيات التدريب، وحالات الاستخدام المثالية لكلا النموذجين، مما يساعدك على اتخاذ قرار مستنير لتطبيق الذكاء الاصطناعي التالي الخاص بك.

Link to this sectionRTDETRv2: المنافس القائم على Transformer#

كإصدار مطور من Real-Time Detection Transformer الأصلي، تستفيد RTDETRv2 من آليات الانتباه لمعالجة البيانات المرئية. ومن خلال التعامل مع رقع الصور كتسلسلات، فإنها تحقق فهماً شاملاً لسياق الصورة، وهو أمر مفيد للغاية لاكتشاف الكائنات المتداخلة بكثافة في المشاهد المعقدة.

تفاصيل النموذج:

Link to this sectionنقاط القوة والضعف الهيكلية#

الابتكار الرئيسي في RTDETRv2 هو هيكلها الذي يعمل بنهاية واحدة دون الحاجة إلى NMS. فمن خلال إلغاء كبت غير الأقصى (NMS)، يتم تبسيط خط معالجة ما بعد المعالجة. علاوة على ذلك، تم تحسين قدرات استخراج الميزات متعددة النطاقات مقارنة بـ نموذج RT-DETR الأصلي، مما يتيح له تحديد الكائنات ذات الأحجام المختلفة بشكل أفضل.

ومع ذلك، ونظراً لاعتمادها على Transformers، تعاني RTDETRv2 عادةً من متطلبات ذاكرة أعلى بكثير أثناء التدريب. فنماذج Transformers تتقارب بشكل أبطأ عموماً وتتطلب ذاكرة CUDA أكبر بكثير مقارنة بـ CNN التقليدية، مما يجعلها أقل سهولة للباحثين الذين يعملون على أجهزة بمواصفات استهلاكية أو عند النشر في بيئات ذكاء اصطناعي عند الحافة محدودة الموارد.

تعرف على المزيد حول RTDETR

Link to this sectionUltralytics YOLO11: قمة كفاءة CNN#

بناءً على سنوات من البحث التأسيسي، أطلقت Ultralytics نموذج YOLO11 كقفزة نوعية كبيرة في سلسلة YOLO. فهي تنقح هيكل CNN لتحقيق سرعة ودقة غير مسبوقتين، مع الحفاظ على المرونة والنظام البيئي الصديق للمطورين الذي يتوقعه المجتمع.

تفاصيل النموذج:

Link to this sectionميزة Ultralytics#

يتألق YOLO11 في توازن الأداء. فهو يحقق مقايضة غير عادية بين السرعة والدقة، مما يجعله متعدد الاستخدامات بشكل استثنائي لسيناريوهات النشر الواقعية المتنوعة، بدءاً من مجموعات الحوسبة السحابية الضخمة وصولاً إلى الأجهزة المحمولة خفيفة الوزن.

علاوة على ذلك، تشتهر نماذج YOLO من Ultralytics بانخفاض استهلاك الذاكرة أثناء التدريب والاستنتاج. وعلى عكس نماذج Transformer التي يمكنها استنفاد ذاكرة VRAM بسهولة، يسمح YOLO11 بأحجام دفعات (batch sizes) أكبر على وحدات معالجة الرسوميات القياسية. بالإضافة إلى ذلك، لا يقتصر YOLO11 على اكتشاف الكائنات فحسب؛ بل يتميز بتعدد استخدامات لا يصدق، مع دعم أصلي لـ تجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، وصناديق التحديد الموجهة (OBB).

تعرف على المزيد حول YOLO11

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة الأرقام الخام، يتضح أنه بينما تحقق RTDETRv2 دقة مبهرة، يوفر YOLO11 تشكيلة أكثر دقة من أحجام النماذج مع سرعات استنتاج فائقة، خاصة على TensorRT.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

كما يظهر في الجدول، يحقق نموذج YOLO11x دقة mAPval متفوقة تبلغ 54.7% بينما يستخدم عدد أقل من عمليات FLOP (194.9 مليار مقابل 259 مليار) ويقدم استنتاجاً أسرع على TensorRT (11.3 مللي ثانية مقابل 15.03 مللي ثانية) مقارنة بمتغير RTDETRv2-x. توفر متغيرات YOLO11 الصغيرة (nano و small) خيارات خفيفة الوزن لا مثيل لها للأجهزة المحدودة مثل Raspberry Pi.

Link to this sectionالنظام البيئي، سهولة الاستخدام، والتدريب#

السمة المميزة لنماذج Ultralytics هي تجربة المستخدم الانسيابية. توفر حزمة ultralytics بلغة Python واجهة برمجة تطبيقات (API) موحدة وبديهية تتولى المهام الشاقة المتمثلة في تعزيز البيانات، والتدريب الموزع، وتصدير النماذج. بينما يتطلب مستودع أبحاث RTDETRv2 قدراً كبيراً من الإعدادات والتهيئة، توفر Ultralytics خط تدفق "من البداية إلى الاحتراف".

من المثير للاهتمام أن النظام البيئي لـ Ultralytics قوي جداً لدرجة أنه يدعم أصلاً تشغيل نماذج RT-DETR جنباً إلى جنب مع نماذج YOLO! هذا يتيح لك الاستفادة من النظام البيئي المعتنى به جيداً في Ultralytics—بما في ذلك التكامل مع Weights & Biases و Comet ML—لتتبع التجارب دون عناء.

from ultralytics import RTDETR, YOLO

# Load an RTDETR model seamlessly through the Ultralytics API
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load a highly optimized YOLO11 model
model_yolo = YOLO("yolo11n.pt")

# Train YOLO11 with highly efficient memory usage
results = model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained YOLO model to ONNX format
model_yolo.export(format="onnx")
بسّط سير عملك

كفاءة التدريب أمر بالغ الأهمية في تعلم الآلة. تستخدم نماذج Ultralytics أوزاناً مدربة مسبقاً تتقارب بسرعة. لإدارة مجموعات البيانات الخاصة بك، وتشغيل التدريب، ونقاط نهاية النشر دون كتابة تعليمات برمجية، استكشف منصة Ultralytics للحصول على تجربة MLOps متكاملة.

Link to this sectionتطبيقات العالم الحقيقي#

غالباً ما يعتمد الاختيار بين هذه الهياكل على قيود النشر المحددة لمشروعك.

حيث تتفوق RTDETRv2: يعد العمود الفقري لـ RTDETRv2 القائم على Transformer فعالاً للغاية في السيناريوهات التي تحتوي على كائنات كثيفة ومحجوبة بشدة حيث يلزم سياق عالمي. غالباً ما يتم تقييمها في الأبحاث الأكاديمية والتطبيقات التي يكون فيها الميزانية الحسابية أقل أهمية من رسم العلاقات القائم على الانتباه.

حيث يهيمن YOLO11: YOLO11 هو البطل بلا منازع للنشر العملي في العالم الحقيقي. بصمته الدنيا في الذاكرة وسرعات الاستنتاج الفائقة تجعله مثالياً لـ:

  • التصنيع الذكي: تشغيل اكتشاف العيوب في الوقت الفعلي على خطوط الإنتاج باستخدام أجهزة الكمبيوتر الصناعية.
  • الزراعة: النشر على الطائرات بدون طيار لمراقبة صحة المحاصيل في الوقت الفعلي وروبوتات الحصاد الآلية.
  • تحليلات التجزئة: معالجة تدفقات الكاميرات المتعددة في وقت واحد لإدارة طوابير الانتظار وتتبع المخزون دون الحاجة إلى مزارع خوادم ضخمة.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين RT-DETR و YOLO11 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار RT-DETR#

RT-DETR خيار قوي لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار YOLO11#

يوصى بـ YOLO11 لـ:

  • نشر الإنتاج عند الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث تكون الموثوقية والصيانة النشطة أمراً بالغ الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب اكتشافاً، وتجزئة، وتقدير وضعية، وOBB ضمن إطار عمل واحد موحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى التحرك بسرعة من جمع البيانات إلى الإنتاج باستخدام Ultralytics Python API الانسيابي.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionنتطلع قدماً: وصول YOLO26#

إذا كنت تبدأ مشروعاً جديداً، فيجب عليك أيضاً التفكير في الجيل القادم من رؤية الذكاء الاصطناعي: Ultralytics YOLO26. تم إصدار YOLO26 في يناير 2026، وهو يجمع بين أفضل ما في العالمين. إنه يقدم تصميماً بنهاية واحدة خالي من NMS (تم ريادته لأول مرة في YOLOv10)، مما يلغي تماماً زمن انتقال ما بعد المعالجة تماماً مثل RTDETRv2، ولكن مع السرعة التي لا تضاهى لـ CNN.

يتميز YOLO26 بـ MuSGD Optimizer—المستوحى من ابتكارات تدريب LLM—من أجل تقارب سريع ومستقر بشكل لا يصدق، ويوفر استنتاجاً أسرع لوحدة المعالجة المركزية بنسبة تصل إلى 43% عن طريق إزالة Distribution Focal Loss (DFL). مع وظائف الخسارة ProgLoss + STAL المتخصصة التي تحسن بشكل كبير التعرف على الكائنات الصغيرة، يعد YOLO26 التوصية النهائية لأي خط تدفق رؤية حاسوبية حديث.

سواء اخترت YOLO11 لتعدد استخداماته المثبت، أو RTDETRv2 لآليات الانتباه الخاصة به، أو YOLO26 المتطور للحصول على أداء حافة نهائي، فإن توثيق Ultralytics يوفر جميع الموارد اللازمة للنجاح في رحلة الرؤية الحاسوبية الخاصة بك.

التعليقات