YOLOX مقابل YOLO26: تحليل مقارن لبنى detect الكائنات
في المشهد المتطور بسرعة لـ detect الكائنات، يُعد تحديد النموذج المناسب لتطبيقك الخاص أمرًا بالغ الأهمية. يقارن هذا الدليل الشامل بين YOLOX، وهو كاشف عالي الأداء خالٍ من الـ anchor من Megvii، و Ultralytics YOLO26، أحدث نموذج متطور مصمم لكفاءة الحافة والنشر الشامل (end-to-end).
من خلال تحليل بنياتها ومقاييس أدائها ومنهجيات تدريبها، نهدف إلى مساعدة المطورين والباحثين على اتخاذ قرارات مستنيرة لمشاريع رؤية الكمبيوتر الواقعية.
ملخص تنفيذي
يمثل كلا النموذجين علامات فارقة مهمة في سلالة YOLO. YOLOX (2021) كان له دور فعال في تعميم detect الخالي من الـ anchor والرؤوس المفككة (decoupled heads)، مما سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. أما YOLO26 (2026)، فيدفع الحدود أبعد بتصميم شامل (end-to-end) أصيل يلغي قمع الحد الأقصى غير المتعدي (NMS)، مما يحقق استدلالًا أسرع على CPU ودقة فائقة على الكائنات الصغيرة.
بالنسبة لمعظم التطبيقات الحديثة، وخاصة تلك التي تُنشر على أجهزة الحافة أو تتطلب تكاملًا مبسطًا، يقدم YOLO26 نظامًا بيئيًا أكثر قوة، وزمن انتقال أقل، وسير عمل نشر أبسط.
YOLOX: الرائد الخالي من الـ Anchor
حوّل YOLOX سلسلة YOLO إلى آلية خالية من الـ anchor ودمج تقنيات detect متقدمة أخرى مثل الرأس المفكك (decoupled head) وتعيين التسميات SimOTA.
المواصفات الفنية
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- التاريخ: 18 يوليو 2021
- الروابط:Arxiv, GitHub, الوثائق
الميزات المعمارية الرئيسية
- آلية خالية من الـ anchor: على عكس النماذج السابقة مثل YOLOv4 أو YOLOv5 التي استخدمت مربعات anchor محددة مسبقًا، يتنبأ YOLOX بمربعات الإحاطة مباشرة. وهذا يقلل من عدد معلمات التصميم والضبط التجريبي المطلوب لمجموعات البيانات المختلفة.
- الرأس المفصول (Decoupled Head): يفصل YOLOX مهام التصنيف وتحديد المواقع إلى "رؤوس" مختلفة. يحل هذا الفصل التعارض بين ثقة التصنيف ودقة الانحدار، مما يؤدي إلى تقارب أسرع وأداء أفضل.
- SimOTA: استراتيجية مبسطة لتخصيص النقل الأمثل تقوم بتعيين العينات الإيجابية ديناميكيًا للحقائق الأساسية، مما يحسن استقرار التدريب ودقته.
- إيجابيات متعددة (Multi-positives): للتخفيف من عدم التوازن الشديد في العينات الإيجابية/السلبية في الكاشفات الخالية من المراسي (anchor-free detectors)، يخصص YOLOX المنطقة المركزية 3x3 كعينات إيجابية.
نقاط القوة القديمة
يظل YOLOX أساسًا قويًا للبحث الأكاديمي والسيناريوهات التي يُفضل فيها استخدام تطبيقات الكاشفات الخالية من المراسي القديمة. لقد أثر تصميم رأسه المفصول بشكل كبير على البنى اللاحقة.
Ultralytics YOLO26: المتخصص الشامل (End-to-End) في الحافة
YOLO26 مصمم من الألف إلى الياء لتحقيق الكفاءة، حيث يزيل الاختناقات في مسار الاستدلال لتقديم أقصى سرعة على كل من CPUs و GPUs.
المواصفات الفنية
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 14 يناير 2026
- الروابط:GitHub، الوثائق
الابتكارات المعمارية الرئيسية
- تصميم شامل خالٍ من NMS: YOLO26 هو تصميم شامل أصيل. من خلال توليد تنبؤات لا تتطلب معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإنه يقلل بشكل كبير من زمن الاستجابة والتعقيد أثناء النشر. هذا الإنجاز مستوحى من YOLOv10 وتم تحسينه لتحقيق استقرار الإنتاج.
- إزالة DFL: تمت إزالة وحدة Distribution Focal Loss (DFL) لتبسيط تصدير النموذج. وهذا يجعل النموذج أكثر توافقًا مع الأجهزة الطرفية/منخفضة الطاقة وسلاسل أدوات المسرعات مثل TensorRT و CoreML.
- مُحسِّن MuSGD: مُحسِّن هجين جديد يجمع بين SGD و Muon. مستوحى من تدريب نماذج اللغة الكبيرة (LLM) (تحديدًا Kimi K2 من Moonshot AI)، يعمل هذا المُحسِّن على استقرار التدريب وتسريع التقارب لمهام الرؤية.
- ProgLoss + STAL: إن الجمع بين موازنة الخسارة التدريجية (Progressive Loss Balancing) وتخصيص التسميات الواعي للأهداف الصغيرة (STAL) يحسن بشكل كبير detect الأجسام الصغيرة — وهو أمر بالغ الأهمية لصور الطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.
- تعدد استخدامات المهام: على عكس YOLOX، الذي هو في الأساس كاشف، يدعم YOLO26 مهام Instance Segmentation و Pose Estimation و Classification و Oriented Bounding Box (OBB) بشكل جاهز.
تحسين الأجهزة الطرفية
يتميز YOLO26 بسرعة استدلال على CPU أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة، مما يجعله الخيار الأمثل للنشر على Raspberry Pi والأجهزة المحمولة ووحدات Intel CPUs القياسية بدون GPUs مخصصة.
مقارنة الأداء
يسلط الجدول التالي الضوء على اختلافات الأداء بين النماذج. بينما كان YOLOX منافسًا في عام 2021، يُظهر YOLO26 التطورات التي تحققت على مدار خمس سنوات من التطور المعماري، خاصة في سرعة الاستدلال وكفاءة المعلمات.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
تحليل:
- الدقة: يتفوق YOLO26 باستمرار على YOLOX عبر جميع المقاييس. على سبيل المثال، فإن
YOLO26sيحقق 48.6% mAP، وهو أعلى بكثير منYOLOX-sبنسبة 40.5%، وينافس النموذج الأكبر بكثيرYOLOX-l(49.7%) مع استخدام جزء صغير من قوة المعالجة. - السرعة: يستغل YOLO26 بنيته الشاملة لتحقيق زمن استجابة منخفض للغاية. غالبًا ما تكون سرعات TensorRT لـ YOLO26 أسرع بمرتين من نماذج YOLOX المكافئة، ويرجع ذلك جزئيًا إلى إزالة الحمل الزائد لـ NMS.
- الكفاءة: نسبة FLOPs إلى الدقة متفوقة جدًا في YOLO26.
YOLO26nيحقق دقة مماثلة لـYOLOX-s(40.9% مقابل 40.5%) ولكن مع عدد أقل من عمليات FLOPs بحوالي 5 مرات (5.4 مليار مقابل 26.8 مليار).
التدريب والنظام البيئي
تُعد تجربة المطور عامل تمييز رئيسي بين هذين الإطارين.
سهولة الاستخدام والنظام البيئي
تُعطي Ultralytics الأولوية لتجربة مستخدم مبسطة. مع YOLO26، تحصل على حزمة python موحدة تتعامل مع التحقق من البيانات والتدريب والنشر بسلاسة.
- واجهة برمجة تطبيقات بسيطة: تدريب نموذج في 3 أسطر من كود python.
- أدوات متكاملة: دعم أصلي لـ تتبع التجارب، وإدارة مجموعات البيانات، وتصدير النماذج إلى تنسيقات مثل ONNX و TFLite و OpenVINO.
- الوثائق: وثائق Ultralytics الشاملة والمحدثة باستمرار تضمن لك عدم التعثر أبدًا.
في المقابل، يعتمد YOLOX على بنية قاعدة أكواد بحثية أكثر تقليدية قد تتطلب المزيد من التكوين اليدوي لمسارات مجموعات البيانات، والتحسينات، وسكربتات النشر.
منهجيات التدريب
- YOLO26: يستفيد من مُحسّن MuSGD لتحقيق الاستقرار ويستخدم التجميع التلقائي (auto-batching) والتثبيت التلقائي (auto-anchoring) (على الرغم من أنه أقل أهمية للتصميمات الخالية من المرساة، إلا أن التحجيم الداخلي لا يزال ساريًا). كما يدعم تحسينات Mosaic و Mixup المُحسّنة للتقارب السريع.
- YOLOX: قدم مسار تحسين قويًا يتضمن Mosaic و Mixup، والذي كان عاملًا رئيسيًا في أدائه العالي. يتطلب عادةً جداول تدريب أطول (300 حقبة) للوصول إلى ذروة الدقة.
متطلبات الذاكرة
تم تحسين YOLO26 لكفاءة الذاكرة. تؤدي وظائف الخسارة المبسطة (إزالة DFL) والهندسة المعمارية المحسّنة إلى استخدام أقل لذاكرة VRAM أثناء التدريب مقارنة بالهياكل القديمة الخالية من المرساة. وهذا يسمح بأحجام دفعات أكبر على وحدات GPU الاستهلاكية، مما يسرع التجارب.
حالات الاستخدام والتطبيقات
أين يتفوق YOLO26
- الحوسبة الطرفية: مع سرعة استدلال CPU أسرع بنسبة تصل إلى 43% وإزالة DFL، يُعد YOLO26 الخيار الأمثل لـ Raspberry Pi وعمليات النشر على الأجهزة المحمولة.
- تحليلات الفيديو في الوقت الفعلي: يضمن التصميم الخالي من NMS زمن استجابة حتميًا، وهو أمر بالغ الأهمية للتطبيقات الحساسة للسلامة مثل القيادة الذاتية أو أنظمة إنذار الأمان.
- المهام المعقدة: إذا كان مشروعك يتطلب التجزئة (segmentation) أو تقدير الوضعيات (pose estimation)، فإن YOLO26 يوفر هذه الإمكانيات ضمن نفس الإطار، بينما YOLOX هو في الأساس كاشف كائنات.
أين يُستخدم YOLOX
- أسس البحث: يُستخدم YOLOX بشكل متكرر كخط أساس مقارن في الأوراق الأكاديمية نظرًا لتنفيذه النظيف الخالي من المرساة.
- الأنظمة القديمة: قد تجد المشاريع التي بدأت في 2021-2022 والتي قامت بتخصيص قاعدة أكواد YOLOX بشكل كبير أن الترحيل يتطلب موارد مكثفة، على الرغم من أن مكاسب الأداء لـ YOLO26 عادةً ما تبرر هذا الجهد.
مثال على الكود: البدء مع YOLO26
الترحيل إلى YOLO26 مباشر. فيما يلي مثال كامل لكيفية تحميل نموذج مدرب مسبقًا وتشغيل الاستدلال.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (automatically downloads weights)
model = YOLO("yolo26n.pt")
# Run inference on a local image or URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
for result in results:
result.show() # Show image with bounding boxes
# Export to ONNX for deployment
model.export(format="onnx")
يحل هذا المقتطف البسيط محل مئات الأسطر من الكود النمطي الذي غالبًا ما تتطلبه مستودعات البحث القديمة.
الخلاصة
بينما لعب YOLOX دورًا محوريًا في تاريخ اكتشاف الكائنات من خلال التحقق من صحة التصميمات الخالية من المرساة، يمثل Ultralytics YOLO26 مستقبل الذكاء الاصطناعي الفعال والقابل للنشر.
بفضل هندسته المعمارية الشاملة الخالية من NMS، ونسبة الدقة إلى الحوسبة المتفوقة، والدعم القوي من نظام Ultralytics البيئي، يُعد YOLO26 الخيار الموصى به لكل من التطورات الجديدة وتحديث مسارات الرؤية الحالية.
مزيد من القراءة
- استكشف نماذج أخرى مثل YOLO11 وYOLOv8 للمقارنة.
- تعرف على تصدير النماذج لتحقيق أقصى سرعة.
- اطلع على مدونة Ultralytics للحصول على أحدث البرامج التعليمية وحالات الاستخدام.