YOLOX مقابل YOLO11: ربط البحث والتطبيق في العالم الواقعي
في مجال الكشف عن الأجسام الذي يشهد تطوراً سريعاً، غالباً ما يتطلب اختيار النموذج المناسب تحقيق التوازن بين أحدث الأبحاث واحتياجات التطبيق العملي. تستكشف هذه المقارنة بين بنتيتين مهمتين: YOLOX، وهو كاشف عالي الأداء بدون مرساة تم إصداره في عام 2021، و YOLO11، وهو نموذج متعدد الاستخدامات وقوي من Ultralytics للتطبيقات المؤسسية الحديثة. على الرغم من أن كلا النموذجين يشتركان في YOLO إلا أنهما يختلفان بشكل كبير في فلسفاتهما المعمارية ودعمهما للنظام البيئي وسهولة استخدامهما.
مقارنة مقاييس الأداء
عند تقييم أجهزة الكشف عن الأجسام، تعتبر المقاييس الرئيسية مثل متوسط الدقة (mAP) وسرعة الاستدلال ذات أهمية قصوى. يوضح الجدول أدناه كيف YOLO11 البنية الأحدث لـ YOLO11 كفاءة فائقة، لا سيما في التوازن بين السرعة والدقة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOX: تطور بدون مرساة
تم طرح YOLOX من قبل Megvii في عام 2021 كإصدار خالٍ من المراسي من YOLO . وكان الهدف منه سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي من خلال تبسيط رأس الكشف وإزالة الحاجة إلى مربعات المراسي المحددة مسبقًا.
الميزات الرئيسية:
- تصميم بدون مثبتات: يلغي عملية تجميع الصناديق المثبتة المعقدة، مما يبسط عملية التدريب.
- رأس منفصل: يفصل مهام التصنيف والانحدار إلى فروع مختلفة، مما يحسن سرعة ودقة التقارب.
- SimOTA: استراتيجية متقدمة لتخصيص التسميات تعمل على تخصيص العينات الإيجابية بشكل ديناميكي، مما يعزز استقرار التدريب.
على الرغم من أن YOLOX يمثل خطوة مهمة إلى الأمام في عام 2021، إلا أن تنفيذه غالبًا ما يتطلب إعدادًا أكثر تعقيدًا ويفتقر إلى الدعم الموحد والمتعدد المهام الموجود في الأطر الأحدث.
تفاصيل YOLOX:
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- التاريخ: 2021-07-18
- أرشيف:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
YOLO11: التنوع وقوة النظام البيئي
يستند YOLO11 أطلقته Ultralytics، إلى نجاح سابقيه لتقديم نموذج ليس دقيقًا فحسب، بل سهل الاستخدام والتطبيق أيضًا. وقد تم تصميمه ليكون حلاً شاملاً لمجموعة واسعة من مهام الرؤية الحاسوبية.
نقاط القوة الرئيسية:
- سهولة الاستخدام: تشتهر واجهة Ultralytics ببساطتها. يمكن إجراء عمليات التحميل والتدريب والتنبؤ باستخدام بضع أسطر من التعليمات البرمجية فقط، مما يقلل بشكل كبير من العوائق التي تواجه المطورين.
- نظام بيئي جيد الصيانة: YOLO11 دعم YOLO11 من خلال الصيانة النشطة والتحديثات المتكررة والمجتمع النشط. وهذا يضمن التوافق مع أحدث PyTorch وإصلاح الأخطاء بسرعة.
- تعدد الاستخدامات: على عكس YOLOX، الذي يعتبر في المقام الأول أداة للكشف عن الأشياء، يدعم YOLO11 مهام متعددة بما في ذلك تقسيم المثيلات، وتقدير الوضع، والتصنيف، والكشف عن المربعات المحددة (OBB).
- كفاءة التدريب: YOLO11 تحسين YOLO11 من أجل الاستخدام الفعال للموارد، وغالبًا ما يتطلب ذاكرة أقل أثناء التدريب مقارنة بالبدائل القائمة على المحولات مثل RT-DETR.
YOLO11 :
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- الوثائق:https://docs.ultralytics.com/models/yolo11/
هل تعلم؟
للحصول على أحدث ما توصلت إليه التكنولوجيا في مجال الأداء المتطور، اطلع على YOLO26. تم إصداره في يناير 2026، ويتميز بتصميم أصلي شامل NMS، ومحسن MuSGD، CPU أسرع بنسبة تصل إلى 43٪، مما يجعله الخيار الأول للذكاء الاصطناعي المتطور.
مقارنة معمارية
YOLO11 الاختلافات المعمارية بين YOLOX و YOLO11 تطور استراتيجيات الكشف عن الكائنات بمرور الوقت.
بنية YOLOX
يستخدم YOLOX بنية أساسية CSPDarknet مشابهة لـ YOLOv5 يقدم بنية رأس منفصلة. في YOLO التقليدية، كان التصنيف والتحديد يتمان بطريقة مقترنة. يقسم YOLOX هذين الأمرين إلى فرعين منفصلين، مما يساعد على حل التضارب بين ثقة التصنيف ودقة التحديد. تعامل آليته الخالية من المراسي اكتشاف الأجسام على أنه مشكلة انحدار نقطي، مما يبسط تصميم النموذج ولكنه قد يواجه صعوبة في بعض الأحيان مع سيناريوهات الأجسام شديدة الكثافة مقارنة بالطرق القائمة على المراسي.
معمارية YOLO11
YOLO11 بنية أساسية ورقبة محسّنة تعزز قدرات استخراج الميزات عبر مستويات مختلفة. وهو يدمج وحدات متقدمة لتحسين الانتباه المكاني ودمج الميزات. ومن المزايا الهامة Ultralytics التكامل السلس للقابلية للتصدير. وقد صُممت البنية من الألف إلى الياء بحيث يمكن تصديرها بسهولة إلى تنسيقات مثل ONNXو TensorRTو OpenVINO، مما يضمن أن الدقة العالية التي لوحظت أثناء التدريب تترجم مباشرة إلى استنتاج فعال على الأجهزة الطرفية.
حالات الاستخدام المثالية
غالبًا ما يعتمد الاختيار بين هذه النماذج على المتطلبات المحددة لمشروعك.
متى تختار YOLOX
- أساسيات البحث: YOLOX هو نقطة مرجعية ممتازة للبحوث الأكاديمية التي تركز على طرق الكشف بدون مرساة أو تعديل الرؤوس المنفصلة.
- الأنظمة القديمة: إذا كان لديك خط أنابيب قائم مبني على قاعدة كود Megvii أو كنت بحاجة بشكل خاص إلى استراتيجية التخصيص SimOTA لمجموعة بيانات متخصصة.
متى تختار YOLO11
- التطوير السريع: إذا كنت بحاجة إلى الانتقال بسرعة من مجموعة البيانات إلى النموذج المطبق، فإن Ultralytics المبسطة وواجهة برمجة Python تجعلان YOLO11 الأفضل.
- متطلبات المهام المتعددة: تستفيد المشاريع التي قد تتوسع من الكشف البسيط إلى التجزئة أو التتبع من إطار عمل YOLO11 الموحد.
- نشر الإنتاج: بالنسبة للتطبيقات التجارية في مجال البيع بالتجزئة أو المدن الذكية أو الأمن، YOLO11 الدعم القوي للتصدير والموثوقية التي تم اختبارها من قبل المجتمع لـ YOLO11 مخاطر النشر.
- الحوسبة الطرفية: بفضل المتغيرات المحسّنة، YOLO11 أداءً استثنائيًا على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi أو NVIDIA .
مقارنة الكود: سهولة الاستخدام
الفرق في سهولة الاستخدام واضح عند مقارنة سير عمل التدريب.
التدريب باستخدام Ultralytics YOLO11: يعمل Ultralytics على إزالة التعقيدات، مما يتيح لك التركيز على بياناتك.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
التدريب باستخدام YOLOX: يتطلب YOLOX عادةً استنساخ المستودع، وإعداد بيئة محددة، وتشغيل التدريب عبر نصوص برمجية لسطر الأوامر مع العديد من الحجج، مما قد يكون أقل سهولة بالنسبة لعمليات سير العمل Python.
الخلاصة
كل من YOLOX و YOLO11 نموذجان قويان ساهما بشكل كبير في مجال الرؤية الحاسوبية. تحدى YOLOX هيمنة الأساليب القائمة على المراسي وقدم مفاهيم مهمة مثل الرؤوس المنفصلة. ومع ذلك، بالنسبة لمعظم المطورين والشركات اليوم، YOLO11 حزمة أكثر إقناعًا. إن الجمع بين الأداء العالي والتنوع ونظام بيئي لا مثيل له يجعله الخيار العملي لبناء حلول الذكاء الاصطناعي في العالم الحقيقي.
بالنسبة لأولئك الذين يتطلعون إلى تجاوز الحدود بشكل أكبر، لا سيما في عمليات النشر المتطورة، نوصي بشدة باستكشاف YOLO26. بفضل تصميمه الشامل NMS وإزالة فقدان بؤرة التوزيع (DFL)، يمثل YOLO26 قفزة جديدة في الكفاءة والسرعة.
نماذج أخرى للاستكشاف
- YOLO26: أحدث نموذج متطور من Ultralytics يناير 2026)، يتميز باستدلال NMS ووظائف خسارة متخصصة.
- YOLOv8: نموذج كلاسيكي شائع الاستخدام في YOLO يشتهر بتوازنه بين السرعة والدقة.
- RT-DETR: كاشف قائم على محول يوفر دقة عالية، وهو مثالي للسيناريوهات التي تكون فيها السرعة في الوقت الفعلي أقل أهمية من الدقة.
- SAM : نموذج Meta's Segment Anything Model، مثالي لمهام التجزئة بدون تدريب.