Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLO26 و RTDETRv2#

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، مما يضع الممارسين أمام خيار حاسم: هل يجب الاستفادة من الشبكات العصبية التلافيفية (CNNs) المحسنة للغاية أم اعتماد بنى تعتمد على تقنية المحولات (Transformer) الأحدث؟ هناك منافسان بارزان في هذا المجال هما النموذج المتطور Ultralytics YOLO26 ونموذج RTDETRv2 المقدم من Baidu. يدفع كلا النموذجين حدود اكتشاف الكائنات في الوقت الفعلي ولكنهما يعتمدان على فلسفات معمارية مختلفة جذرياً.

يوفر هذا الدليل نظرة فنية متعمقة لكلا النموذجين، مع مقارنة هياكلهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار الأساس الأفضل لمشروع الرؤية الحاسوبية القادم الخاص بك.

Link to this sectionUltralytics YOLO26: قمة الذكاء الاصطناعي البصري الموجه للحافة#

تم تطوير YOLO26 بواسطة Ultralytics، ويمثل قفزة جيلية هائلة لعائلة YOLO. تم إصداره في يناير 2026، وهو مصمم خصيصاً للسرعة والدقة والنشر السلس عبر بيئات السحابة والحافة.

Link to this sectionالابتكارات المعمارية ونقاط القوة#

يقدم YOLO26 العديد من الميزات الرائدة التي تميزه ليس فقط عن نماذج المحولات (Transformer) بل أيضاً عن الإصدارات السابقة مثل YOLO11:

  • تصميم شامل بدون NMS: يلغي YOLO26 خاصية كبت الحد الأقصى غير (NMS) التقليدية أثناء المعالجة اللاحقة. هذا النهج الشامل (end-to-end) الذي تم ابتكاره في نماذج مثل YOLOv10، يقلل من تباين زمن انتقال الاستدلال ويبسط منطق النشر، خاصة على أجهزة الحافة.
  • سرعة استدلال على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%: إدراكاً للحاجة المتزايدة للذكاء الاصطناعي اللامركزي، تم تحسين YOLO26 بشكل كبير للأجهزة التي تفتقر إلى وحدات معالجة رسومية (GPU) مخصصة، مثل Raspberry Pi.
  • إزالة DFL: من خلال إزالة خسارة التوزيع البؤري (DFL)، يوفر YOLO26 عملية تصدير مبسطة وتحسيناً هائلاً في التوافق مع أجهزة الحافة منخفضة الطاقة والمتحكمات الدقيقة.
  • مُحسِّن MuSGD: لسد الفجوة بين تدريب نماذج اللغات الكبيرة (LLM) والرؤية الحاسوبية، يستخدم YOLO26 مُحسِّن MuSGD. يضمن هذا المزيج الهجين من SGD و Muon — المستوحى من Kimi K2 لشركة Moonshot AI — استقراراً قوياً في التدريب وتقارباً أسرع.
  • ProgLoss + STAL: تجلب وظائف الخسارة المتقدمة تحسينات ملحوظة في التعرف على الأشياء الصغيرة. هذا أمر بالغ الأهمية للصناعات التي تعتمد على تحليل الصور الجوية وأجهزة استشعار إنترنت الأشياء (IoT).

تعرف على المزيد حول YOLO26

Link to this sectionتعدد الاستخدامات عبر مهام الرؤية#

على عكس النماذج المقتصرة بدقة على الصناديق المحيطة (bounding boxes)، فإن YOLO26 يعد قوة متنوعة. فهو يتضمن تحسينات خاصة بالمهام، مثل خسارة التجزئة الدلالية و proto متعدد النطاقات لـ تجزئة المثيلات، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضع، وخسارة زاوية متخصصة لحل مشكلات الحدود في مهام صندوق التحديد الموجه (OBB).

استراتيجية نشر الحافة

عند النشر على أجهزة الحافة، استخدم متغيرات YOLO26n (Nano) أو YOLO26s (Small). تصدير هذه النماذج إلى CoreML أو TFLite سلس للغاية بفضل إزالة DFL والمعمارية الخالية من NMS، مما يضمن أداءً سلساً في الوقت الفعلي على نظامي iOS و Android.

Link to this sectionRTDETRv2: تعزيز محولات الاكتشاف في الوقت الفعلي#

يعتمد RTDETRv2، الذي طوره باحثون في Baidu، على إطار عمل RT-DETR الأصلي. ويهدف إلى إثبات أن محولات الاكتشاف (DETRs) يمكنها منافسة، وأحياناً تجاوز، سرعة ودقة الشبكات العصبية التلافيفية (CNNs) المحسنة للغاية في سيناريوهات الوقت الفعلي.

Link to this sectionالهيكلية والقدرات#

يستخدم RTDETRv2 بنية تعتمد على المحولات (Transformer)، والتي تعالج الصور بطبيعتها بشكل مختلف عن الشبكات العصبية التلافيفية (CNNs) من خلال الاستفادة من آليات الانتباه الذاتي لفهم السياق العالمي.

  • مجموعة الهدايا (Bag-of-Freebies): يقدم إصدار v2 سلسلة من تقنيات التدريب المحسنة (bag-of-freebies) التي تعمل على تحسين أداء الخط الأساسي دون إضافة تكلفة استدلال.
  • الوعي بالسياق العالمي: بسبب طبقات انتباه المحولات (Transformer)، فإن RTDETRv2 بارع بشكل طبيعي في فهم المشاهد المعقدة حيث يكون السياق العالمي ضرورياً للتمييز بين الأشياء المتداخلة أو المحجوبة.

تعرف على المزيد حول RTDETR

Link to this sectionقيود نماذج المحولات#

على الرغم من قوتها، غالباً ما تواجه نماذج الاكتشاف القائمة على المحولات مثل RTDETRv2 تحديات في النشر العملي. فهي تظهر عموماً متطلبات ذاكرة CUDA أعلى أثناء التدريب مقارنة بـ CNNs الفعالة. علاوة على ذلك، يمكن أن يكون دمجها في بيئات الحافة المتنوعة أمراً مرهقاً بسبب العمليات المعقدة التي تتطلبها طبقات الانتباه، مما يجعل نماذج مثل YOLO26 أكثر جاذبية بكثير لعمليات النشر ذات الموارد المحدودة.

Link to this sectionمقارنة الأداء#

يكشف تقييم هذه النماذج وجهاً لوجه عن الفوائد الملموسة لأحدث تحسينات CNN. يوضح الجدول أدناه أداءها في المعايير القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

كما هو موضح، يتفوق YOLO26 باستمرار على RTDETRv2 عبر جميع متغيرات الحجم. يحقق YOLO26x معدل mAP رائعاً قدره 57.5 مع زمن انتقال أقل (11.8 مللي ثانية على TensorRT) وعدد أقل بكثير من المعلمات (55.7 مليون) مقارنة بـ RTDETRv2-x (54.3 mAP، 15.03 مللي ثانية، 76 مليون معلمة).

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLO26 و RT-DETR على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLO26#

YOLO26 هو خيار قوي لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionمتى تختار RT-DETR#

يوصى بـ RT-DETR لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionميزة Ultralytics#

اختيار بنية تعلم الآلة الصحيحة هو مجرد جزء من المعادلة؛ فالنظام البيئي المحيط يحدد مدى سرعة انتقال الفريق من النموذج الأولي إلى الإنتاج.

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

توفر واجهة برمجة تطبيقات Ultralytics Python تجربة مبسطة بشكل ملحوظ. لم يعد تدريب النماذج المعقدة يتطلب كوداً نمطياً مطولاً. علاوة على ذلك، فإن كفاءة تدريب YOLO26 أفضل بشكل كبير، حيث تستهلك ذاكرة فيديو (VRAM) أقل بكثير لوحدة معالجة الرسومات مقارنة بآليات الانتباه المستهلكة للذاكرة في RTDETRv2، مما يسمح بأحجام دفعات أكبر حتى على الأجهزة الاستهلاكية.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Execute high-speed, NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionنظام بيئي مُدار جيداً#

من خلال استخدام نماذج Ultralytics، يحصل المطورون على إمكانية الوصول إلى إطار عمل مُدار بنشاط يتكامل بشكل أصلي مع أدوات التتبع الحديثة مثل Weights & Biases و Comet ML. بالنسبة لأولئك الذين يفضلون نهجاً بدون كود، تسهل منصة Ultralytics التدريب السحابي وإدارة مجموعات البيانات والنشر بنقرة واحدة.

Link to this sectionتوازن الأداء#

يحقق YOLO26 توازناً لا مثيل له بين سرعة الاستدلال والدقة. تضمن إزالة NMS مقترنة بمُحسِّن MuSGD أنك تقوم بنشر نموذج دقيق للغاية في التعامل مع الأشياء الصغيرة (بفضل ProgLoss + STAL) وسريع جداً في الإنتاج، مما يجعله الخيار الأمثل لجميع تطبيقات الرؤية الحاسوبية الحديثة تقريباً.

Link to this sectionنماذج أخرى في النظام البيئي#

بينما يغطي YOLO26 و RTDETRv2 أحدث تقنيات الاكتشاف في الوقت الفعلي، قد يرغب المطورون الذين يديرون خطوط إنتاج قديمة أو يستكشفون منحنيات كفاءة مختلفة في التفكير أيضاً في YOLOv8 لبيئات المؤسسات الراسخة، أو استكشاف بنى أخرى مثل EfficientDet. ومع ذلك، بالنسبة لأي مبادرة جديدة، يظل YOLO26 هو التوصية النهائية.

المساهمون

التعليقات