تخطي إلى المحتوى

YOLOX مقابل YOLO26: التطور من الكشف عن الكائنات بدون مرساة إلى الكشف عن الكائنات من البداية إلى النهاية

شهد مجال الرؤية الحاسوبية تحولات مذهلة خلال العقد الماضي. ومن بين المعالم البارزة في هذه الرحلة إطلاق YOLOX، الذي شاع استخدام البنى الخالية من المراسي، وإطلاق Ultralytics مؤخرًا، الذي أعاد تعريف الأداء في الوقت الفعلي تمامًا بتصميمه الأصلي الشامل NMS. تستكشف هذه المقارنة الشاملة بنياتهما ومقاييس أدائهما وسيناريوهات النشر المثالية لمساعدة المطورين على اتخاذ قرارات مستنيرة لمشروعهم التالي في مجال الذكاء الاصطناعي.

نظرات عامة على النموذج

إن فهم أصول كل نموذج وأهدافه التصميمية الأساسية يوفر سياقًا أساسيًا لإنجازاته التقنية.

YOLOX

المؤلفون: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, و Jian Sun
المنظمة: Megvii
التاريخ: 2021-07-18
أركايف: 2107.08430
جيت هاب: Megvii-BaseDetection/YOLOX
الوثائق: YOLOX ReadTheDocs

تم طرح YOLOX في منتصف عام 2021، ومثل تحولًا كبيرًا من خلال اعتماد تصميم بدون مرساة مقترن برأس منفصل واستراتيجية تخصيص علامات متقدمة تُعرف باسم SimOTA. من خلال الابتعاد عن آليات صندوق المرساة التقليدية التي كانت تهيمن على البنى السابقة، نجح YOLOX في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي، حيث قدم إطارًا أنيقًا وفعالًا للغاية لاكتشاف الكائنات.

تعرف على المزيد حول YOLOX

YOLO26

المؤلفون: غلين جوشر وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2026-01-14
جيت هاب: ultralytics/ultralytics
المنصة: منصة Ultralytics

تم إصدار YOLO26 في أوائل عام 2026، وهو نتاج سنوات من التحسينات المتكررة، مع التركيز بشكل كبير على النشر المتطور وخطوط التدريب المبسطة. ويقدم تصميمًا شاملاً NMS، مما يلغي تمامًا خطوة المعالجة اللاحقة التقليدية لـ Non-Maximum Suppression. هذا الاختراق يبسط بشكل كبير نشر النموذج عبر أجهزة متنوعة. علاوة على ذلك، من خلال إزالة وحدة Distribution Focal Loss (DFL)، يحقق YOLO26 زمن انتقال أقل بكثير، مما يعزز مكانته كخيار متميز لتطبيقات الرؤية الحاسوبية الحديثة.

تعرف على المزيد حول YOLO26

الابتكارات المعمارية

تسلط هندسة هذين النموذجين الضوء على التقدم السريع لمنهجيات التعلم العميق، لا سيما فيما يتعلق بوظائف الخسارة والمعالجة اللاحقة.

نهج YOLOX

فصل YOLOX مهام التصنيف والانحدار في رأس التنبؤ الخاص به، مما أدى إلى تسريع التقارب بشكل كبير أثناء التدريب. وقد قللت طبيعته الخالية من المراسي عدد معلمات التصميم، مما خفف من الحاجة إلى ضبط المراسي المعقدة قبل التدريب. إلى جانب خوارزمية تعيين التسميات SimOTA، حقق YOLOX نتائج متطورة في ذلك الوقت، لا سيما في المعايير القياسية مثل COCO .

ميزة YOLO26

يأخذ YOLO26 الكفاءة المعمارية إلى المستوى التالي. NMS يقلل إزالة NMS من زمن الاستدلال فحسب، بل يضمن أيضًا أوقات تنفيذ متسقة وحتمية — وهو عامل حاسم للمركبات ذاتية القيادة والروبوتات.

تشمل ابتكارات YOLO26 الرئيسية ما يلي:

  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM)، يضمن هذا المزيج من SGD و Muon عمليات تدريب مستقرة بشكل استثنائي وتقاربًا أسرع.
  • سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%: عن طريق إزالة DFL وتبسيط بنية الشبكة، تم تحسين YOLO26 بشكل كبير للأجهزة الطرفية محدودة الموارد، من مستشعرات إنترنت الأشياء (IoT) البسيطة إلى لوحات Raspberry Pi.
  • ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتحليل الصور الجوية وإجراء مراقبة جودة دقيقة في أتمتة التصنيع.

تحسين الحافة أولاً

إذا كان مشروعك يستهدف الأنظمة المدمجة أو التطبيقات المحمولة التي لا تحتوي على وحدات معالجة رسومات مخصصة، فإن CPU المُحسّن في YOLO26 يوفر ميزة كبيرة، حيث يتطلب حملًا حسابيًا أقل بكثير من طرز الجيل السابق.

الأداء والمعايير

عند تقييم النماذج لبيئات الإنتاج، من الأهمية بمكان تحليل التوازن بين الدقة والسرعة والتعقيد الحسابي. فيما يلي مقارنة مفصلة بين النماذج القياسية التي تم تقييمها بحجم صورة 640 بكسل (و 416 بكسل للمتغيرات النانوية/الصغيرة).

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما يوضح الجدول، توفر سلسلة YOLO26 توازنًا فائقًا في الأداء. على سبيل المثال، YOLO26x يحقق 57.5 mAP مثيرًا للإعجاب بينما يستخدم ما يقرب من نصف معلمات الـ YOLOXx نموذج، مما يؤدي مباشرة إلى أوقات GPU أسرع GPU (11.8 مللي ثانية مقابل 16.1 مللي ثانية) ومرونة نشر فائقة للغاية.

التدريب وتجربة النظام البيئي

يكمن أحد الاختلافات الأكثر عمقًا بين هذه البنى في قابليتها للاستخدام ودعمها للنظام البيئي.

بينما يظل YOLOX مستودعًا أساسيًا للباحثين الذين يدرسون تدفق التدرج والميكانيكا الخالية من المراسي، إلا أن إعداده قد يكون معقدًا، وغالبًا ما يتطلب تكوينًا يدويًا للتبعيات والمشغلات. على العكس من ذلك، فإن يحددUltralytics معيار الصناعة من حيث سهولة الاستخدام.

باستخدام واجهة برمجة تطبيقات Python الموحدة، يمكن للمطورين تهيئة وتدريب ونشر نماذج YOLO26 ببساطة لا مثيل لها. يتعامل النظام بشكل طبيعي مع تنزيل مجموعات البيانات، وضبط المعلمات الفائقة (hyperparameter tuning)، والتصدير السلس إلى تنسيقات مثل ONNX وTensorRT وOpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

علاوة على ذلك، تتميزYOLO Ultralytics YOLO بمتطلبات ذاكرة أقل بكثير أثناء التدريب مقارنة بالبدائل الثقيلة القائمة على المحولات، مما يسمح للمهندسين بتدريب أحجام دفعات أكبر حتى على الأجهزة الاستهلاكية.

تطبيقات عملية في أرض الواقع

يعتمد الاختيار بين YOLOX و YOLO26 في النهاية على قيود النشر ومتطلبات المهام المتعددة.

أين يتفوق YOLOX

يظل YOLOX مرشحًا قابلاً للتطبيق لمعايير أكاديمية محددة وأنظمة قديمة متكاملة بشكل كبير مع إطار عمل MegEngine. وأهميته التاريخية تجعله أساسًا شائعًا للبحث في أجهزة الكشف الخالية من المراسي واستراتيجيات التخصيص المخصصة.

أين يتفوق YOLO26

تم تصميم YOLO26 بشكل أساسي للتطبيقات الصناعية الحديثة. نظرًا لأنه يدعم بشكل أساسي تقسيم المثيلات وتقدير الوضع و Oriented Bounding Boxes (OBB)، فهو أكثر تنوعًا بكثير من محركات الكشف القياسية.

  • تجارة التجزئة الذكية والمخزون: يضمن استخدام التصميم الخالي من NMS أن أنظمة الدفع الآلي تعالج خلاصات الفيديو بزمن انتقال منخفض للغاية، وتتعرف على المنتجات دون اختناق حلقات المعالجة اللاحقة.
  • تحليلات الطائرات بدون طيار والجوية: إن خسارة الزاوية المتخصصة لـ obb ودمج ProgLoss + STAL يجعلان YOLO26 لا مثيل له في اكتشاف الأجسام الدوارة والقطع الأثرية الصغيرة في صور الأقمار الصناعية الشاسعة.
  • أنظمة الأمن على الحافة: بفضل استدلالها الأسرع لوحدة المعالجة المركزية (CPU) بنسبة 43%، يسمح YOLO26 للشركات بنشر تحليلات أمنية قوية مباشرة على الأجهزة المحلية غير المكلفة دون الحاجة إلى حوسبة سحابية باهظة الثمن.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOX و YOLO26 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOX

YOLOX هو خيار قوي لـ:

  • أبحاث الكشف الخالي من المراسي: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على المتحكمات الدقيقة أو الأجهزة المحمولة القديمة حيث تعتبر البصمة الصغيرة للغاية لمتغير YOLOX-Nano (0.91 مليون معلمة) أمرًا بالغ الأهمية.
  • دراسات تعيين التسميات SimOTA: مشاريع بحثية تستكشف استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

متى تختار YOLO26

يوصى باستخدام YOLO26 في الحالات التالية:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

استكشاف Ultralytics الأخرى

إذا كنت تستكشف تطور الرؤية الحاسوبية، فهناك نماذج أخرى عالية الكفاءة ضمن Ultralytics تستحق الدراسة:

  • YOLO11: السلف المباشر لـ YOLO26، يقدم أداءً قويًا ودعمًا مجتمعيًا واسع النطاق لبيئات الإنتاج المستقرة.
  • YOLOv8: بنية معمارية خضعت لاختبارات مكثفة وأرست معايير سهولة الاستخدام والمرونة عبر آلاف عمليات النشر في العالم الحقيقي.

في الختام، بينما قدم YOLOX مفاهيم أساسية في مجال الكشف عن الأجسام، فإن YOLO26 الجديد يوفر قفزة جيلية في السرعة والدقة وسهولة النشر، مما يجعله الخيار الأمثل للمطورين والشركات ذات التفكير المستقبلي.


تعليقات