Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 مقابل YOLO26#

تطور مشهد اكتشاف الكائنات في الوقت الفعلي بشكل كبير، حيث يواصل الباحثون تجاوز حدود السرعة والدقة وكفاءة النشر. اثنان من أبرز البنى التي تقود هذا المسار حاليًا هما RTDETRv2 القائم على Transformer وUltralytics YOLO26 الذي يمثل أحدث ما توصلت إليه الشبكات العصبية التلافيفية (CNN). يقدم هذا الدليل تحليلاً متعمقاً لبنيتها ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار النموذج المناسب لمشروعك القادم في مجال رؤية الحاسوب.

Link to this sectionRTDETRv2: محولات اكتشاف الوقت الفعلي#

يعتمد RTDETRv2 على بنية RT-DETR الأصلية، بهدف الجمع بين وعي السياق العالمي لمحولات الرؤية والسرعة المطلوبة للتطبيقات في الوقت الفعلي.

الخصائص الرئيسية:

  • المؤلفون: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang, و Yi Liu
  • المنظمة: Baidu
  • التاريخ: 24-07-2024
  • روابط: Arxiv, GitHub, Docs

Link to this sectionالمعمارية ونقاط القوة#

على عكس كاشفات الأجسام التقليدية القائمة على المرساة، يستفيد RTDETRv2 من نهج قائم على Transformer يلغي بشكل أصلي الحاجة إلى كبت غير الحد الأقصى (NMS) أثناء المعالجة اللاحقة. ومن خلال استخدام آلية انتباه مرنة، يكون النموذج فعالاً للغاية في فهم المشاهد المعقدة والأجسام المتداخلة. وقد أدت تحسينات "Bag-of-Freebies" إلى تعزيز دقته بشكل كبير على مجموعة بيانات COCO مع الحفاظ على سرعات استنتاج مقبولة على وحدات معالجة الرسومات المتطورة.

Link to this sectionالقيود#

على الرغم من أن RTDETRv2 يحقق نتائج أكاديمية مبهرة، فإنه غالباً ما يفرض تحديات في بيئات الإنتاج. تتطلب بنى Transformer بطبيعتها استخداماً أعلى للذاكرة أثناء التدريب والاستنتاج مقارنة بشبكات CNN، مما قد يجعل النشر على أجهزة الذكاء الاصطناعي الطرفي ذات الموارد المحدودة أمراً صعباً. بالإضافة إلى ذلك، يتطلب تدريب المحولات عادةً أحجام دفعات أكبر والمزيد من ذاكرة CUDA، مما قد يمثل عنق زجاجة للباحثين ذوي الأجهزة المحدودة.

اعرف المزيد عن RTDETRv2

Link to this sectionYOLO26: ذروة رؤية الذكاء الاصطناعي الطرفية#

تم إطلاق Ultralytics YOLO26 في أوائل عام 2026، وهو يعيد تعريف ما هو ممكن باستخدام اكتشاف الأجسام القائم على CNN. وهو يدمج تحسينات متطورة مصممة خصيصاً للنشر السلس في الإنتاج وكفاءة فائقة في الأجهزة.

الخصائص الرئيسية:

  • المؤلفون: Glenn Jocher و Jing Qiu
  • المنظمة: Ultralytics
  • التاريخ: 14 يناير 2026
  • روابط: GitHub, Docs

Link to this sectionطفرات معمارية#

يقدم YOLO26 العديد من الميزات الثورية التي تحل نقاط الألم الشائعة في نشر النماذج:

  • تصميم طرفي إلى طرفي بدون NMS: بناءً على المفاهيم الرائدة في YOLOv10، فإن YOLO26 هو تصميم طرفي إلى طرفي بشكل أصلي. ومن خلال إزالة المعالجة اللاحقة NMS، فإنه يقلل بشكل كبير من تباين زمن الوصول، مما يضمن أوقات استنتاج يمكن التنبؤ بها للغاية في بيئات الإنتاج.
  • سرعة استنتاج على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%: من خلال التحسينات المعمارية الاستراتيجية وإزالة Distribution Focal Loss (DFL)، يحقق YOLO26 سرعات غير مسبوقة على وحدة المعالجة المركزية، مما يجعله الخيار الأول لـ الحوسبة الطرفية بدون وحدات معالجة رسومات مخصصة.
  • محسن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 محسن MuSGD (هجين بين SGD وMuon). وهذا يضمن عمليات تدريب مستقرة للغاية وتقارباً سريعاً للغاية.
  • ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي ترقية أساسية للتطبيقات التي تتضمن الصور الجوية والمراقبة القائمة على الطائرات بدون طيار.
تحسينات خاصة بالمهمة في YOLO26

بعيداً عن الاكتشاف القياسي، يتميز YOLO26 بتحسينات متخصصة: خسارة التجزئة الدلالية وproto متعدد النطاق لـ مهام التجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضعية، وخسارة زاوية مخصصة لحل مشكلات الحدود في اكتشاف صندوق الإحاطة الموجه (OBB).

تعرف على المزيد حول YOLO26

Link to this sectionمقارنة الأداء#

عند تقييم هذه النماذج، يعد تحقيق توازن قوي في الأداء بين الدقة (mAP) والكفاءة الحسابية أمراً بالغ الأهمية. يوضح الجدول أدناه كيف يتفوق YOLO26 باستمرار على RTDETRv2 عبر متغيرات الحجم المختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما رأينا أعلاه، يحقق نموذج YOLO26x دقة 57.5 mAP ملحوظة، متجاوزاً بشكل كبير نموذج RTDETRv2-x مع استخدام عدد أقل من المعلمات والحفاظ على سرعة استنتاج TensorRT أسرع. علاوة على ذلك، فإن متطلبات الذاكرة لـ YOLO26 أقل بشكل ملحوظ، مما يجعله الخيار الأمثل لعمليات النشر الطرفي في الوقت الفعلي.

Link to this sectionالنظام البيئي وسهولة الاستخدام#

على الرغم من أن الأداء الخام أمر حيوي، فإن النظام البيئي المحيط هو الذي يحدد مدى سرعة نقل النموذج من البحث إلى الإنتاج. وهنا توفر منصة Ultralytics ميزة لا مثيل لها.

Link to this sectionنظام بيئي موحد ومُصان جيداً#

يعمل RTDETRv2 في المقام الأول كمستودع بحثي، مما قد يستلزم إعدادات بيئة معقدة وبرمجة يدوية للمهام المخصصة. وعلى العكس من ذلك، يستفيد Ultralytics YOLO26 من حزمة Python ناضجة ومختبرة بشكل مكثف. يوفر نظام Ultralytics البيئي تجربة مستخدم مبسطة بشكل لا يصدق، حيث يقدم API بسيطاً للتدريب والتحقق والتنبؤ والتصدير.

مع تكاملات مدمجة لـ Weights & Biases وComet ML، أصبح تتبع التجارب سلساً. علاوة على ذلك، فإن نماذج Ultralytics متعددة الاستخدامات للغاية؛ فبينما يركز RTDETRv2 على اكتشاف الأجسام، يدعم YOLO26 بشكل أصلي تجزئة المثيلات وتقدير الوضعية وتصنيف الصور ضمن نفس الإطار تماماً.

Link to this sectionمثال كودي: البساطة في العمل#

يسمح Ultralytics API للمطورين بالتحميل والتدريب وتشغيل الاستنتاج ببضعة أسطر فقط من التعليمات البرمجية. وهذا يحسن كفاءة التدريب بشكل كبير ويقلل من وقت الوصول إلى السوق.

from ultralytics import RTDETR, YOLO

# Load an RT-DETR model
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load a state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Run inference on an image seamlessly
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")

# Display the YOLO26 results
results_yolo[0].show()

# Export YOLO26 to ONNX format with one click
model_yolo.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين RT-DETR وYOLO26 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار RT-DETR#

RT-DETR خيار قوي لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار YOLO26#

يوصى بـ YOLO26 لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionاستكشاف بنيات أخرى#

بينما يمثل YOLO26 قمة الأداء الحالية، قد يجد المطورون أيضاً قيمة في استكشاف الإصدارات السابقة. لا يزال YOLO11 الناجح للغاية نموذجاً قوياً ومدعوماً بالكامل لمجموعة متنوعة من الأنظمة القديمة. يمكنك التعمق في قدراته من خلال قراءة مقارنة RTDETR وYOLO11. بالإضافة إلى ذلك، إذا كنت تحلل بنيات قديمة، فإن الاطلاع على مقارنة EfficientDet وYOLO26 يوفر سياقاً تاريخياً رائعاً حول المدى الذي وصلت إليه بنيات اكتشاف الكائنات.

Link to this sectionأفكار ختامية#

يقدم كل من RTDETRv2 وYOLO26 تطورات مذهلة في مجال الذكاء الاصطناعي. ومع ذلك، بالنسبة للفرق التي تعطي الأولوية للانتقال السلس إلى الإنتاج، والحد الأدنى من بصمة الذاكرة، وتعدد استخدامات المهام على نطاق واسع، فإن Ultralytics YOLO26 هو التوصية الواضحة. تضمن بنيته الخالية من NMS وسرعات CPU السريعة ودعم نظام Ultralytics البيئي القوي بقاء مشاريع رؤية الذكاء الاصطناعي الخاصة بك قابلة للتوسع وفعالة ومستعدة للمستقبل. سواء كنت تقوم بالنشر على خادم سحابي أو Raspberry Pi محدود الموارد، يقدم YOLO26 أداءً لا هوادة فيه خارج الصندوق.

المساهمون

التعليقات