YOLOX مقابل YOLO26: التطور من الكشف عن الكائنات بدون مرساة إلى الكشف عن الكائنات من البداية إلى النهاية
شهد مجال الرؤية الحاسوبية تحولات مذهلة خلال العقد الماضي. ومن بين المعالم البارزة في هذه الرحلة إطلاق YOLOX، الذي شاع استخدام البنى الخالية من المراسي، وإطلاق Ultralytics مؤخرًا، الذي أعاد تعريف الأداء في الوقت الفعلي تمامًا بتصميمه الأصلي الشامل NMS. تستكشف هذه المقارنة الشاملة بنياتهما ومقاييس أدائهما وسيناريوهات النشر المثالية لمساعدة المطورين على اتخاذ قرارات مستنيرة لمشروعهم التالي في مجال الذكاء الاصطناعي.
نظرات عامة على النموذج
إن فهم أصول كل نموذج وأهدافه التصميمية الأساسية يوفر سياقًا أساسيًا لإنجازاته التقنية.
YOLOX
المؤلفون: Zheng Ge، Songtao Liu، Feng Wang، Zeming Li، و Jian Sun
المنظمة: Megvii
التاريخ: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
المستندات: YOLOX ReadTheDocs
تم طرح YOLOX في منتصف عام 2021، ومثل تحولًا كبيرًا من خلال اعتماد تصميم بدون مرساة مقترن برأس منفصل واستراتيجية تخصيص علامات متقدمة تُعرف باسم SimOTA. من خلال الابتعاد عن آليات صندوق المرساة التقليدية التي كانت تهيمن على البنى السابقة، نجح YOLOX في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي، حيث قدم إطارًا أنيقًا وفعالًا للغاية لاكتشاف الكائنات.
YOLO26
المؤلفون: جلين جوشر وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: ultralytics
المنصة: Ultralytics
تم إصدار YOLO26 في أوائل عام 2026، وهو نتاج سنوات من التحسينات المتكررة، مع التركيز بشكل كبير على النشر المتطور وخطوط التدريب المبسطة. ويقدم تصميمًا شاملاً NMS، مما يلغي تمامًا خطوة المعالجة اللاحقة التقليدية لـ Non-Maximum Suppression. هذا الاختراق يبسط بشكل كبير نشر النموذج عبر أجهزة متنوعة. علاوة على ذلك، من خلال إزالة وحدة Distribution Focal Loss (DFL)، يحقق YOLO26 زمن انتقال أقل بكثير، مما يعزز مكانته كخيار متميز لتطبيقات الرؤية الحاسوبية الحديثة.
الابتكارات المعمارية
تسلط هندسة هذين النموذجين الضوء على التقدم السريع لمنهجيات التعلم العميق، لا سيما فيما يتعلق بوظائف الخسارة والمعالجة اللاحقة.
نهج YOLOX
فصل YOLOX مهام التصنيف والانحدار في رأس التنبؤ الخاص به، مما أدى إلى تسريع التقارب بشكل كبير أثناء التدريب. وقد قللت طبيعته الخالية من المراسي عدد معلمات التصميم، مما خفف من الحاجة إلى ضبط المراسي المعقدة قبل التدريب. إلى جانب خوارزمية تعيين التسميات SimOTA، حقق YOLOX نتائج متطورة في ذلك الوقت، لا سيما في المعايير القياسية مثل COCO .
ميزة YOLO26
يأخذ YOLO26 الكفاءة المعمارية إلى المستوى التالي. NMS يقلل إزالة NMS من زمن الاستدلال فحسب، بل يضمن أيضًا أوقات تنفيذ متسقة وحتمية — وهو عامل حاسم للمركبات ذاتية القيادة والروبوتات.
تشمل ابتكارات YOLO26 الرئيسية ما يلي:
- MuSGD Optimizer: مستوحى من تقنيات تدريب نموذج اللغة الكبيرة (LLM)، يضمن هذا المزيج من SGD Muon تشغيل تدريبات مستقرة بشكل استثنائي وتقارب أسرع.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال التخلص من DFL وتبسيط بنية الشبكة، تم تحسين YOLO26 بشكل كبير للأجهزة الطرفية المحدودة الموارد، من أجهزة استشعار إنترنت الأشياء البسيطة إلى لوحات Raspberry Pi.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليل الصور الجوية وإجراء مراقبة دقيقة للجودة في أتمتة التصنيع.
تحسين الحافة أولاً
إذا كان مشروعك يستهدف الأنظمة المدمجة أو التطبيقات المحمولة التي لا تحتوي على وحدات معالجة رسومات مخصصة، فإن CPU المُحسّن في YOLO26 يوفر ميزة كبيرة، حيث يتطلب حملًا حسابيًا أقل بكثير من طرز الجيل السابق.
الأداء والمعايير
عند تقييم النماذج لبيئات الإنتاج، من الأهمية بمكان تحليل التوازن بين الدقة والسرعة والتعقيد الحسابي. فيما يلي مقارنة مفصلة بين النماذج القياسية التي تم تقييمها بحجم صورة 640 بكسل (و 416 بكسل للمتغيرات النانوية/الصغيرة).
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
كما يوضح الجدول، توفر سلسلة YOLO26 توازنًا فائقًا في الأداء. على سبيل المثال، YOLO26x يحقق 57.5 mAP مثيرًا للإعجاب mAP استخدام ما يقرب من نصف معلمات YOLOXx نموذج، مما يؤدي مباشرة إلى أوقات GPU أسرع GPU (11.8 مللي ثانية مقابل 16.1 مللي ثانية) ومرونة نشر فائقة للغاية.
التدريب وتجربة النظام البيئي
يكمن أحد الاختلافات الأكثر عمقًا بين هذه البنى في قابليتها للاستخدام ودعمها للنظام البيئي.
بينما يظل YOLOX مستودعًا أساسيًا للباحثين الذين يدرسون تدفق التدرج والميكانيكا الخالية من المراسي، إلا أن إعداده قد يكون معقدًا، وغالبًا ما يتطلب تكوينًا يدويًا للتبعيات والمشغلات. على العكس من ذلك، فإن يحددUltralytics معيار الصناعة من حيث سهولة الاستخدام.
باستخدام Python الموحدة Python يمكن للمطورين تهيئة نماذج YOLO26 وتدريبها ونشرها ببساطة لا مثيل لها. يتولى النظام بشكل أساسي تنزيل مجموعات البيانات وضبط المعلمات الفائقة والتصدير السلس إلى تنسيقات مثل ONNXو TensorRTو OpenVINO.
from ultralytics import YOLO
# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance on the validation set
metrics = model.val()
# Export the optimized model for edge deployment
model.export(format="onnx")
علاوة على ذلك، تتميزYOLO Ultralytics YOLO بمتطلبات ذاكرة أقل بكثير أثناء التدريب مقارنة بالبدائل الثقيلة القائمة على المحولات، مما يسمح للمهندسين بتدريب أحجام دفعات أكبر حتى على الأجهزة الاستهلاكية.
تطبيقات عملية في أرض الواقع
يعتمد الاختيار بين YOLOX و YOLO26 في النهاية على قيود النشر ومتطلبات المهام المتعددة.
أين يتفوق YOLOX
يظل YOLOX مرشحًا قابلاً للتطبيق لمعايير أكاديمية محددة وأنظمة قديمة متكاملة بشكل كبير مع إطار عمل MegEngine. وأهميته التاريخية تجعله أساسًا شائعًا للبحث في أجهزة الكشف الخالية من المراسي واستراتيجيات التخصيص المخصصة.
أين يتفوق YOLO26
تم تصميم YOLO26 بشكل أساسي للتطبيقات الصناعية الحديثة. نظرًا لأنه يدعم بشكل أساسي تقسيم المثيلات وتقدير الوضع و Oriented Bounding Boxes (OBB)، فهو أكثر تنوعًا بكثير من محركات الكشف القياسية.
- التجزئة الذكية والمخزون: يضمن استخدام التصميم NMS أن تقوم أنظمة الدفع الآلي بمعالجة موجات الفيديو بزمن انتقال منخفض للغاية، مع التعرف على المنتجات دون حدوث اختناقات في حلقات المعالجة اللاحقة.
- تحليلات الطائرات بدون طيار والتحليلات الجوية: إن فقدان الزاوية المتخصص لـ OBB وتكامل ProgLoss + STAL يجعل YOLO26 لا مثيل له في الكشف عن الأجسام المدورة والأشياء الصغيرة في الصور الفضائية الشاسعة.
- أنظمة أمان الحافة: بفضل CPU الأسرع بنسبة 43٪، يتيح YOLO26 للشركات نشر تحليلات أمان قوية مباشرة على أجهزة محلية غير مكلفة دون الحاجة إلى حوسبة سحابية باهظة الثمن.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOX و YOLO26 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOX
YOLOX هو خيار قوي لـ:
- أبحاث الكشف بدون مرساة: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة طرفية فائقة الخفة: يتم نشرها على وحدات التحكم الدقيقة أو الأجهزة المحمولة القديمة حيث يكون الحجم الصغير للغاية (0.91 مليون معلمة) لنسخة YOLOX-Nano أمرًا بالغ الأهمية.
- دراسات تخصيص علامات SimOTA: مشاريع بحثية تبحث في الاستراتيجيات المثلى لتخصيص العلامات على أساس النقل وتأثيرها على تقارب التدريب.
متى تختار YOLO26
يوصى باستخدام YOLO26 في الحالات التالية:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
استكشاف Ultralytics الأخرى
إذا كنت تستكشف تطور الرؤية الحاسوبية، فهناك نماذج أخرى عالية الكفاءة ضمن Ultralytics تستحق الدراسة:
- YOLO11: السلف المباشر لـ YOLO26، يوفر أداءً قويًا ودعمًا واسعًا من المجتمع لبيئات الإنتاج المستقرة.
- YOLOv8: بنية تم اختبارها بشكل مكثف في الميدان ووضعت معايير سهولة الاستخدام والمرونة في آلاف من عمليات النشر في العالم الحقيقي.
في الختام، بينما قدم YOLOX مفاهيم أساسية في مجال الكشف عن الأجسام، فإن YOLO26 الجديد يوفر قفزة جيلية في السرعة والدقة وسهولة النشر، مما يجعله الخيار الأمثل للمطورين والشركات ذات التفكير المستقبلي.