YOLOv10 مقابل YOLOX: تطور اكتشاف الأجسام بدون مراسٍ وبدون NMS

يتميز مجال الرؤية الحاسوبية بالتطورات المتسارعة في بنى اكتشاف الأجسام في الوقت الفعلي. يستكشف هذا المقارنة التقنية التفصيلية نموذجين مؤثرين دفعا حدود الكفاءة ونماذج التصميم: YOLOv10 وYOLOX. من خلال فحص اختلافات معماريتهما، ومقاييس الأداء، ومنهجيات التدريب، يمكن للمطورين والباحثين اتخاذ قرارات مدروسة لنشر أنظمة رؤية قوية.

خلفيات النماذج وأصولها

يوفر فهم أصول نماذج التعلم العميق هذه سياقاً قيماً فيما يتعلق بأهدافها المعمارية وحالات الاستخدام المستهدفة.

YOLOv10: القضاء على NMS للاكتشاف الشامل الحقيقي

تم تطوير YOLOv10 لحل اختناقات زمن الوصول طويلة الأمد، وقدم نهجاً شاملاً أصلياً لعائلة YOLO.

اعرف المزيد عن YOLOv10

YOLOX: سد الفجوة بين البحث والصناعة

ظهر YOLOX كنسخة بدون مراسٍ (anchor-free) من تصميم YOLO التقليدي، مما يوفر منهجية أبسط مع أداء تنافسي، ويستهدف بشكل خاص تسهيل النشر في المجتمعات الصناعية.

تعرف على المزيد حول YOLOX

أبرز المعالم المعمارية والابتكارات

كلا الإطارين يبتعدان عن كاشفات الأجسام التقليدية المعتمدة على المراسٍ، لكنهما يحلان مشاكل مختلفة في خط سير اكتشاف الأجسام.

معمارية YOLOX

قدم YOLOX العديد من التحديثات الحاسمة للنظام البيئي في عام 2021. كانت مساهمته الأساسية هي التحول إلى تصميم كاشف بدون مراسٍ (anchor-free detector). ومن خلال القضاء على صناديق المراسٍ المحددة مسبقاً، قلل YOLOX بشكل كبير من عدد معلمات التصميم والضبط الاستدلالي المطلوب لمجموعات البيانات المختلفة.

علاوة على ذلك، يستخدم YOLOX رأساً مفككاً (decoupled head)، يفصل بين مهام التصنيف والانحدار. وقد أدى ذلك إلى حل التعارض بين الهدفين، مما أدى إلى تسريع التقارب بشكل كبير أثناء التدريب. كما يستخدم SimOTA لتعيين التسميات المتقدم، مما يحسن التعامل مع المشاهد المزدحمة والانسدادات الشائعة في مجموعة بيانات COCO.

ميزة الخلو من المراسٍ

التصاميم الخالية من المراسٍ، مثل تلك التي رادها YOLOX، تقلل بشكل كبير من تعقيد ضبط النموذج. لم يعد المطورون بحاجة إلى إجراء تجميع k-means على مجموعات بيانات مخصصة لتحديد أحجام صناديق المراسٍ المثالية، مما يوفر وقت تحضير قيماً.

بنية YOLOv10

بينما قام YOLOX بتحسين رأس الاكتشاف، إلا أنه لا يزال يعتمد على كبت الحد الأقصى غير (NMS) أثناء الاستنتاج، مما يسبب تباين زمن الوصول. استهدف YOLOv10 هذا العيب تحديداً من خلال تقديم استراتيجية تعيين ثنائي متسق للتدريب الخالي من NMS. أثناء التدريب، يستخدم تعيينات تسميات واحد إلى متعدد وواحد إلى واحد، ولكن أثناء الاستنتاج، يتجاهل الرأس واحد إلى متعدد تماماً، مما يخرج تنبؤات نظيفة بدون معالجة لاحقة بواسطة NMS.

يتميز YOLOv10 أيضاً بتصميم نموذج كلي مدفوع بالكفاءة والدقة. فهو يدمج رؤوس تصنيف خفيفة الوزن وتقليل أخذ العينات المفكك مكانياً وقناتياً، مما يقلل بشكل كبير من عدد المعلمات و FLOPs دون التضحية بالدقة.

مقارنة الأداء

تقييم هذه النماذج على أجهزة مثل وحدة معالجة الرسومات NVIDIA T4 يكشف عن مزايا متميزة اعتماداً على الحجم. أدناه جدول المقارنة الشامل.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

كما رأينا أعلاه، يتوسع YOLOv10 بشكل استثنائي. يحقق متغير YOLOv10x أعلى دقة (54.4 mAP)، بينما يوفر متغير YOLOv10n أسرع استنتاج باستخدام تكامل TensorRT. على العكس من ذلك، يتميز نموذج YOLOX نانو القديم بأصغر بصمة إجمالية للبيئات المقيدة بشدة.

منهجيات التدريب ومتطلبات الموارد

عند تنفيذ النماذج للإنتاج، تكون بيئة التدريب ومتطلبات الموارد حاسمة تماماً مثل سرعة الاستنتاج الخام.

يعتمد YOLOX غالباً على تكوينات بيئة أقدم قد يكون من المرهق إدارتها. علاوة على ذلك، تتطلب قاعدة التعليمات البرمجية القديمة الخاصة به المزيد من التعليمات البرمجية القياسية لتحقيق تدريب موزع متعدد وحدات معالجة الرسومات أو تحسين الدقة المختلطة.

في المقابل، يتكامل YOLOv10 بسلاسة مع سير عمل PyTorch الحديث، ولكن النظام البيئي Ultralytics هو الذي يغير تجربة المطور حقاً. تتميز نماذج Ultralytics باستهلاك أقل بكثير لذاكرة CUDA أثناء التدريب مقارنة بالبنى المعتمدة على Transformer مثل RT-DETR.

مثال برمجي: تدريب مبسط

باستخدام واجهة برمجة تطبيقات Ultralytics الموحدة، يمكنك تدريب نماذج متطورة بسلاسة في بضعة أسطر فقط من Python. هذا يتجنب التجميع اليدوي لمشغلي C++ أو ملفات التكوين المعقدة.

from ultralytics import YOLO

# Initialize a pre-trained YOLOv10 model
model = YOLO("yolov10s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to ONNX format
model.export(format="onnx")

يوفر هذا البناء البسيط وصولاً فورياً إلى الدقة المختلطة التلقائية، وزيادة البيانات التلقائية، والتكامل مع أدوات مثل Weights & Biases خارج الصندوق.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv10 و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv10

يعد YOLOv10 خياراً قوياً لـ:

  • اكتشاف الوقت الفعلي الخالي من NMS: التطبيقات التي تستفيد من الاكتشاف الشامل دون Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • موازنة مقايضات السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الاكتشاف عبر مختلف مقاييس النماذج.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

متى تختار YOLOX

يُنصح بـ YOLOX من أجل:

  • أبحاث الاكتشاف الخالي من المراسي: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من المراسي كقاعدة لتجربة رؤوس اكتشاف جديدة أو دوال خسارة (loss functions).
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الهاتف المحمول القديمة حيث يعد البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91M معامل) أمراً بالغ الأهمية.
  • دراسات تعيين التسميات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

مستقبل رؤية الذكاء الاصطناعي: مرحباً بـ YOLO26

بينما يمثل YOLOv10 و YOLOX معالم رئيسية، فإن مشهد الرؤية الحاسوبية يتحرك بلا هوادة إلى الأمام. بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، فإن Ultralytics YOLO26 هو التوصية النهائية.

تم إصداره في يناير 2026، يبني Ultralytics YOLO26 على الاختراق التأسيسي لـ تصميم end-to-end الخالي من NMS الذي راده YOLOv10، مما يجعله أكثر دقة واستقراراً وسرعة.

يتميز YOLO26 بتقديم العديد من القفزات الهائلة إلى الأمام:

  • سرعة استنتاج على CPU أسرع بنسبة تصل إلى 43%: من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يحقق YOLO26 أداءً متفوقاً بشكل هائل على أجهزة الحافة بدون وحدات معالجة رسومات.
  • مُحسن MuSGD: مستوحى من استقرار تدريب LLM، يضمن هذا الهجين الجديد من SGD و Muon تقارباً أسرع وتشغيلات تدريب مستقرة للغاية.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو عامل حاسم للصور الجوية ومستشعرات IoT.
  • تعدد استخدامات لا مثيل له: على عكس YOLOX، الذي يعد كاشف أجسام بحت، يدعم YOLO26 أصلاً تجزئة المثيل، وتقدير الوضعية، وتصنيف الصور، واكتشاف OBB داخل مكتبة واحدة موحدة.

اعرف المزيد عن YOLO26

استفد من منصة Ultralytics

لأبسط طريق للإنتاج، يمكن للمطورين استخدام منصة Ultralytics لتعليق مجموعات البيانات، وتدريب نماذج YOLO26 في السحابة، والنشر على أي جهاز حافة مع عدم الحاجة إلى إعدادات.

تطبيقات العالم الحقيقي

اختيار النموذج الصحيح يحدد نجاح عمليات النشر في العالم الحقيقي عبر مختلف الصناعات.

تحليلات الفيديو عالية السرعة

لمعالجة تدفقات الفيديو الكثيفة، مثل إدارة حركة المرور في المدن الذكية، يوفر YOLOv10 ميزة كبيرة بسبب معالجته اللاحقة الخالية من NMS. القضاء على اختناق NMS يسمح بزمن وصول منخفض ومتسق، مما يجعله مثالياً للاقتران مع خوارزميات التتبع مثل BoT-SORT.

نشر الحافة القديم

بالنسبة للإعدادات الأكاديمية القديمة أو تطبيقات Android القديمة المحسنة بشدة لنماذج الالتفافية الخالصة، قد تظل النماذج الأصغر مثل YOLOX-Tiny تجد حالات استخدام متخصصة حيث يعتبر الحفاظ على بيئات PyTorch القديمة مقايضة مقبولة.

أجهزة الحافة و IoT الحديثة

لنشر الأجهزة من الجيل التالي، مثل الروبوتات والطائرات بدون طيار وتحليل أرفف التجزئة، فإن YOLO26 هو الحل النهائي. إن تقليل زمن وصول وحدة المعالجة المركزية بشكل كبير واكتشاف الأجسام الصغيرة المتفوق يجعله مؤهلاً بشكل فريد للملاحة الذاتية وإدارة المخزون الدقيقة.

للحصول على مقارنات إضافية لتوسيع مجموعة أدوات التعلم العميق الخاصة بك، يمكنك أيضاً استكشاف كيف تقارن هذه النماذج بالبدائل مثل YOLO11 المرن أو RT-DETR المدعوم بـ Transformer.

التعليقات