YOLO26 مقابل YOLOX: تطوير الكشف عن الكائنات في الوقت الفعلي
في المشهد المتطور بسرعة للرؤية الحاسوبية، يعد اختيار النموذج المناسب لتطبيقك أمرًا بالغ الأهمية. يقدم هذا الدليل مقارنة فنية متعمقة بين Ultralytics YOLO26، أحدث نموذج متطور لتطبيقات الحافة والوقت الفعلي، و YOLOX، وهو كاشف عالي الأداء خالٍ من الـ anchor تم إصداره في عام 2021 بواسطة Megvii. نحلل معماريتهما، ومقاييس الأداء، ومدى ملاءمتهما للنشر لمساعدتك على اتخاذ قرارات مستنيرة لمشاريعك.
نظرة عامة على النماذج
قبل الخوض في التفاصيل الفنية، من الضروري فهم الأصول والفلسفات الأساسية التي تدفع تطوير كل نموذج.
Ultralytics YOLO26
تم إصداره في يناير 2026 بواسطة Glenn Jocher و Jing Qiu في Ultralytics، يمثل YOLO26 قفزة كبيرة في الكفاءة وسهولة الاستخدام. مصمم خصيصًا لـ أجهزة الحافة والمنخفضة الطاقة، يقدم بنية أصلية شاملة وخالية من NMS. يلغي هذا التصميم الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، وهو عنق زجاجة شائع في مسارات النشر.
تشمل الابتكارات الرئيسية مُحسِّن MuSGD—المستوحى من Kimi K2 من Moonshot AI—الذي يكيف تقنيات تدريب نماذج اللغة الكبيرة (LLM) لمهام الرؤية، وإزالة Distribution Focal Loss (DFL) لتبسيط عمليات التصدير. مع ما يصل إلى 43% أسرع في الاستدلال على CPU مقارنة بالنماذج السابقة، يتفوق YOLO26 في السيناريوهات التي تتطلب سرعة عالية بدون تسريع GPU.
YOLOX
كان YOLOX، الذي طوره باحثون في Megvii عام 2021، إصدارًا محوريًا شاع نموذج الكشف الخالي من الـ anchor ضمن عائلة YOLO. من خلال فصل رأس التنبؤ واستخدام SimOTA لتخصيص التسميات، حقق YOLOX دقة تنافسية وفاز بتحدي Streaming Perception في ورشة عمل CVPR 2021. لا يزال نموذجًا محترمًا في مجتمع البحث لتصميمه النظيف وفعاليته في بيئات GPU عالية الأداء.
مقارنة الأداء
عند تقييم كاشفات الكائنات، تعد المفاضلة بين السرعة (الكمون) والدقة (mAP) أمرًا بالغ الأهمية. يُظهر YOLO26 مزايا كبيرة في كلا المقياسين، خاصة على الأجهزة التي تعتمد على CPU.
تحليل المقاييس
يبرز الجدول التالي أداء مقاييس النماذج المختلفة على مجموعة بيانات COCO.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
تفسير الأداء
يتفوق YOLO26 باستمرار على YOLOX عبر جميع المقاييس من حيث الدقة (mAP). على سبيل المثال، يحقق YOLO26s 48.6 mAP مقارنة بـ YOLOX-s عند 40.5 mAP، وهو تحسن كبير للنماذج ذات الحجم المماثل. بالإضافة إلى ذلك، يضمن التصميم الأصلي الشامل لـ YOLO26 أن السرعات المدرجة تعكس وقت الاستدلال الإجمالي، بينما غالبًا ما تستبعد المعايير التقليدية وقت NMS.
الاختلافات المعمارية الرئيسية
1. من البداية إلى النهاية مقابل المعالجة اللاحقة
أحد أبرز الاختلافات هو مسار الاستدلال.
- YOLO26: أصيل شامل. من خلال توظيف تقنيات تدريب متقدمة، يتنبأ بالعدد الدقيق للكائنات دون الحاجة إلى Non-Maximum Suppression (NMS). هذا يمثل إنجازًا للنشر، حيث غالبًا ما يكون تسريع NMS صعبًا على وحدات المعالجة العصبية (NPUs) ومعالجات الحافة.
- YOLOX: يعتمد على NMS. بينما قدم آلية خالية من الـ anchor لتبسيط الرأس، لا يزال الإخراج الخام يحتوي على مربعات متداخلة يجب تصفيتها، مما يضيف زمن انتقال وتعقيدًا أثناء تصدير النموذج إلى تنسيقات مثل TensorRT أو CoreML.
2. دوال الخسارة والتحسين
يقدم YOLO26 ProgLoss (موازنة الخسارة التدريجية) و STAL (تخصيص التسميات المدرك للأهداف الصغيرة). تستهدف هذه الابتكارات على وجه التحديد الكشف عن الكائنات الصغيرة، وهو ضعف شائع في الكاشفات السابقة. علاوة على ذلك، يستخدم YOLO26 مُحسِّن MuSGD، وهو مزيج من SGD و Muon، والذي يثبت التدريب بشكل أسرع بكثير من المحسّنات القياسية المستخدمة في YOLOX.
3. تحسين الحوسبة الطرفية
يزيل YOLO26 صراحة وحدة Distribution Focal Loss (DFL). بينما يحسن DFL (المستخدم في نماذج مثل YOLOv8) دقة المربع، فإنه يعتمد على عمليات قد تكون بطيئة على أجهزة معينة. بإزالته، يحقق YOLO26 ما يصل إلى 43% أسرع في الاستدلال على CPU، مما يجعله الخيار الأفضل لأجهزة Raspberry Pi، ووحدات CPU المحمولة، والبيئات الأخرى محدودة الموارد.
سهولة الاستخدام والنظام البيئي
بالنسبة للمطورين، الميزات "الناعمة" للنموذج—التوثيق وجودة واجهة برمجة التطبيقات (API) والدعم—لا تقل أهمية عن المقاييس الخام.
ميزة Ultralytics
تم دمج YOLO26 في نظام Ultralytics البيئي القوي. وهذا يضمن:
- واجهة برمجة تطبيقات Python بسيطة: التحميل والتدريب والنشر في ثلاثة أسطر من التعليمات البرمجية.
- تعدد الاستخدامات: على عكس YOLOX، الذي هو في الأساس كاشف، يدعم YOLO26 تجزئة الكائنات (Instance Segmentation)، تقدير الوضعيات (Pose Estimation)، صناديق الإحاطة الموجهة (OBB)، والتصنيف جاهزًا للاستخدام.
- الصيانة: تحديثات متكررة، توثيق شامل، ودعم مجتمعي نشط عبر GitHub و Discord.
نظام YOLOX البيئي
يوفر YOLOX تطبيق PyTorch قويًا ويدعم تنسيقات مثل ONNX و TensorRT. ومع ذلك، فإنه يتطلب عمومًا المزيد من التعليمات البرمجية النمطية للتدريب والاستدلال مقارنة بـ ultralytics حزمة. نظامه البيئي أقل مركزية، وغالبًا ما يتطلب من المستخدمين التعامل يدويًا مع عمليات زيادة البيانات وسكريبتات النشر التي تأتي قياسية مع نماذج Ultralytics.
مقارنة التعليمات البرمجية
يوضح الفرق في سهولة الاستخدام بشكل أفضل من خلال التعليمات البرمجية.
تدريب YOLO26 باستخدام Ultralytics:
from ultralytics import YOLO
# Load model and train on COCO8 dataset
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=100, imgsz=640)
تدريب YOLOX (التطبيق القياسي):يتطلب استنساخ المستودع، وتثبيت متطلبات محددة، وإعداد مجموعة البيانات في هيكل دليل معين، وتشغيل سلاسل CLI معقدة.
# Example YOLOX training command (conceptual)
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o -c yolox_s.pth
حالات الاستخدام المثالية
متى تختار YOLO26
- النشر على الحافة: إذا كنت تقوم بالنشر على الأجهزة المحمولة، أو مستشعرات إنترنت الأشياء (IoT)، أو وحدات CPU حيث يكون تسريع TensorRT أو NPU محدودًا.
- المهام المعقدة: عندما يتطلب مشروعك تجزئة، أو تقدير الوضعيات، أو detect الكائنات الدوارة (obb) إلى جانب الكشف القياسي.
- التطوير السريع: عندما تحتاج إلى التكرار بسرعة باستخدام واجهة برمجة تطبيقات مستقرة وموثقة جيدًا مع دعم مدمج لـ إدارة مجموعات البيانات.
- كشف الكائنات الصغيرة: تطبيقات مثل التصوير الجوي أو مراقبة الجودة حيث يكون التنبؤ بالأهداف الصغيرة أمرًا بالغ الأهمية.
متى تفكر في YOLOX
- الأبحاث القديمة: إذا كنت تعيد إنتاج نتائج أكاديمية من 2021-2022 والتي تقارن بشكل خاص بالورقة الأصلية لـ YOLOX.
- التخصيص المحدد: إذا كان لديك مسار عمل حالي مخصص بشكل كبير حول بنية YOLOX المحددة وكانت تكلفة الترحيل باهظة.
الخلاصة
بينما يظل YOLOX علامة فارقة مهمة في تاريخ كشف الكائنات الخالي من المراسي، يقدم YOLO26 حلاً أكثر شمولاً لتطبيقات الذكاء الاصطناعي الحديثة. بفضل بنيته الأصلية الشاملة، ونسبة الدقة إلى السرعة الفائقة، ودعم نظام Ultralytics البيئي، يُعد YOLO26 الخيار الموصى به لكل من المشاريع الجديدة وتحديث عمليات النشر الحالية.
يضمن الجمع بين استقرار تدريب MuSGD، كفاءة DFL-free، وتعدد المهام أن YOLO26 لا يكتشف الكائنات بشكل أسرع فحسب، بل يبسط أيضًا دورة حياة التعلم الآلي بأكملها من التدريب إلى النشر.
مزيد من القراءة
للمهتمين باستكشاف نماذج أخرى في عائلة YOLO، يُرجى مراجعة ما يلي:
- YOLO11: سلف YOLO26، يقدم أداءً ممتازًا وتوافقًا واسعًا.
- YOLOv10: التكرار الأول الذي قدم تدريب NMS-free، ممهدًا الطريق لتقدمات YOLO26.
- YOLO World: لمهام detect المفردات المفتوحة حيث تحتاج إلى detect الكائنات غير الموجودة في مجموعة التدريب.