Link to this sectionمقارنة بين YOLOX وYOLOv5#
يعد اختيار نموذج اكتشاف الأجسام المناسب قراراً حاسماً يحدد نجاح أي مشروع للرؤية الحاسوبية. يقدم هذا الدليل مقارنة تقنية شاملة بين نموذجين محوريين في مشهد الذكاء الاصطناعي: نموذج YOLOX من Megvii وUltralytics YOLOv5. من خلال تحليل بنيتهما، ومقاييس الأداء، وأنظمة التدريب البيئية، نهدف إلى مساعدة المطورين والباحثين على اتخاذ خيار مستنير لبيئات النشر الخاصة بهم.
Link to this sectionمقدمة عن النماذج#
ظهر كلا النموذجين خلال فترة من التقدم السريع في اكتشاف الأجسام في الوقت الفعلي، ومع ذلك اتخذا فلسفات معمارية مختلفة لتحقيق أدائهما.
Link to this sectionYOLOX: نهج خالٍ من الصناديق المرجعية (Anchor-Free)#
أصدر باحثون وهم Zheng Ge وSongtao Liu وFeng Wang وZeming Li وJian Sun في Megvii نموذج YOLOX في 18 يوليو 2021، وقد أحدث تحولاً كبيراً بالابتعاد عن صناديق المرجع (anchor boxes) التقليدية. وكما هو موثق في تقريرهم التقني على Arxiv، دمج YOLOX تصميماً خالياً من الصناديق المرجعية مع رأس منفصل (decoupled head) واستراتيجية تعيين التسميات SimOTA. يهدف هذا التصميم إلى سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي، مع تقديم أداء قوي على مجموعات البيانات القياسية.
Link to this sectionYOLOv5: المعيار الذهبي لرؤية الذكاء الاصطناعي في الإنتاج#
قام Glenn Jocher بتأليف YOLOv5 وأصدرته Ultralytics في 26 يونيو 2020، وسرعان ما أصبح المعيار الصناعي للرؤية الحاسوبية المنشورة. بُني النموذج محلياً على إطار عمل PyTorch، مما أدى إلى ديمقراطية الذكاء الاصطناعي المتطور من خلال تقديم سهولة استخدام لا مثيل لها، وتدريب سريع للغاية، ومستودع مصقول للغاية. ركزت بنية YOLOv5 على تحقيق توازن مثالي بين السرعة والدقة وسهولة النشر، مما جعله المفضل لكل شيء بدءاً من أجهزة الحافة (edge devices) وصولاً إلى عمليات النشر الضخمة في السحابة.
Link to this sectionالاختلافات المعمارية#
يوضح فهم الاختلافات الميكانيكية الجوهرية بين هذه الشبكات سبب اختلاف أدائها عبر المهام المختلفة.
Link to this sectionخالٍ من الصناديق المرجعية مقابل قائم على الصناديق المرجعية#
أبرز تباين هو آلية YOLOX الخالية من الصناديق المرجعية. تعتمد النماذج التقليدية مثل YOLOv5 على صناديق مرجعية محددة مسبقاً للتنبؤ بصناديق الإحاطة (bounding boxes)، وهو ما يتطلب تحليل تجميعي على مجموعة بيانات التدريب لتحديد أحجام الصناديق المرجعية المثلى. يلغي YOLOX هذا، حيث يتنبأ بإحداثيات صندوق الإحاطة مباشرة في كل موقع مكاني. في حين أن النهج الخالي من الصناديق المرجعية يقلل من عدد معلمات التصميم والضبط التجريبي، فإن نهج YOLOv5 القائم على الصناديق المرجعية والمُحسّن، مدعوماً بوظيفة الصناديق المرجعية التلقائية (auto-anchor)، يضمن تقارباً مستقراً وقابلاً للتنبؤ به في التدريب منذ البداية.
Link to this sectionرأس منفصل (Decoupled Head) مقابل رأس مزدوج (Coupled Head)#
يستخدم YOLOX رأساً منفصلاً، مما يعني فصل مهام التصنيف والانحدار إلى فروع شبكة عصبية متميزة. جادل المؤلفون بأن هذا يحل النزاعات بين تعلم الميزات المكانية والدلالية. على العكس من ذلك، استخدم YOLOv5 رأساً مزدوجاً عالي الكفاءة (في إصداراته السابقة) والذي حقق أقصى قدر من الكفاءة الحسابية وقلل من زمن انتقال الاستدلال، وهو أمر بالغ الأهمية للحوسبة الطرفية في الوقت الفعلي.
Link to this sectionاستراتيجية تعيين التسميات#
يستخدم YOLOX استراتيجية SimOTA لتعيين التسميات، والتي تصيغ اقتران الكائنات الحقيقية بالتنبؤات كمسألة نقل أمثل. هذا التعيين الديناميكي يحسن التعامل مع المشاهد المزدحمة. يستخدم YOLOv5 تعييناً قوياً يعتمد على قواعد الشكل، مما يضمن تغذية عينات إيجابية عالية الجودة باستمرار إلى دالة الخسارة، وهو ما يساهم في استقراره الأسطوري في التدريب.
Link to this sectionالأداء والمعايير القياسية#
المقايضة بين السرعة والدقة هي الاختبار النهائي لهذه البنى. يوضح الجدول أدناه أداء أحجام النماذج المختلفة على المعايير القياسية.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
بينما يحقق YOLOX درجات mAP تنافسية، خاصة في إصداراته الأكبر، يحافظ YOLOv5 على ميزة ملحوظة في سرعة استدلال TensorRT عبر جميع المستويات. يوفر نموذج YOLOv5s، على سبيل المثال، نسب سرعة إلى دقة استثنائية، مما يجعله مرغوباً للغاية للتطبيقات في الوقت الفعلي حيث يكون كل جزء من الثانية مهماً.
Link to this sectionميزة Ultralytics: التدريب وسهولة الاستخدام#
عند الانتقال من البحث إلى الإنتاج، غالباً ما يكون النظام البيئي المحيط بالنموذج بنفس أهمية النموذج نفسه. وهنا، تصبح مزايا نظام Ultralytics البيئي واضحة بشكل جلي.
Link to this sectionتجربة مستخدم انسيابية#
يُشاد بـ YOLOv5 عالمياً لتجربة المطورين "من الصفر إلى الاحتراف". تسمح لك واجهة برمجة تطبيقات Python من Ultralytics وCLI بتحميل النماذج وتدريبها ونشرها بأسطر برمجية قليلة. في المقابل، يتطلب تشغيل YOLOX من مستودع GitHub الخاص بـ Megvii مزيداً من التكوين اليدوي لمتغيرات البيئة، وإعدادات مسارات Python المعقدة، ومنحنى تعلم أكثر حدة يتسم به عادةً كود البحث الأكاديمي.
Link to this sectionكفاءة التدريب ومتطلبات الذاكرة#
تم هندسة نماذج Ultralytics بدقة لتقليل استخدام الذاكرة أثناء التدريب. يتطلب YOLOv5 ذاكرة CUDA أقل بكثير مقارنة بنماذج المحولات (transformer) ذات المعلمات المكثفة مثل RT-DETR أو نماذج البحث غير المُحسّنة. وهذا يسمح للمطورين بتدريب أحجام دفعات (batch sizes) أكبر على الأجهزة الاستهلاكية، مما يسرع دورة التطوير التكراري.
Link to this sectionتعدد الاستخدامات عبر المهام#
بينما يقتصر YOLOX على كونه إطار عمل لاكتشاف الأجسام، فقد طور نظام Ultralytics البيئي نموذج YOLOv5 لدعم مهام رؤية متعددة. يمكنك مباشرةً إجراء تصنيف الصور وتقسيم المثيلات واكتشاف الأجسام باستخدام نفس صيغة واجهة البرمجة.
إذا كنت بحاجة إلى مهام أكثر تقدماً مثل تقدير الوضعية أو اكتشاف صناديق الإحاطة الموجهة (OBB)، فإننا نوصي بشدة بالترقية إلى أحدث بنية Ultralytics YOLO26، والتي تدعم كل هذا محلياً وبدقة متطورة.
Link to this sectionمقارنة الكود#
يتم إثبات الفرق في سهولة الاستخدام بشكل أفضل من خلال الكود.
التدريب باستخدام YOLOv5:
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display results
results[0].show()التدريب باستخدام YOLOX: (يتطلب استنساخ المستودع يدوياً، وتثبيت setup.py، ووسائط CLI معقدة)
# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -oيزيل نهج Ultralytics الاحتكاك، مما يسمح لك بالتركيز على مجموعة البيانات الخاصة بك ومنطق التطبيق بدلاً من تصحيح ملفات التكوين. علاوة على ذلك، فإن تتبع تجاربك سلس مع تكاملات مدمجة لـ Weights & Biases وComet ML.
Link to this sectionحالات الاستخدام المثالية والتطبيقات الواقعية#
يعتمد الاختيار بين هذه النماذج على بيئة التشغيل الخاصة بمشروعك.
Link to this sectionأين يتفوق YOLOX#
يظل YOLOX مرشحاً قوياً في الأوساط الأكاديمية حيث يدرس الباحثون صراحةً نماذج خالية من الصناديق المرجعية أو استراتيجيات تعيين التسميات. كما أنه مفيد في السيناريوهات التي يكون فيها اكتشاف المشاهد المزدحمة هو المقياس الأساسي المطلق وتكون سرعات النشر على الحافة ثانوية.
Link to this sectionأين يتفوق YOLOv5#
YOLOv5 هو البطل بلا منازع للنشر العملي.
- التصنيع عالي السرعة: بالنسبة لـ اكتشاف العيوب في خطوط التجميع، يضمن الحد الأدنى من زمن انتقال استدلال YOLOv5 على وحدات معالجة الرسومات الطرفية فحص المنتجات دون إبطاء حزام النقل.
- الطائرات بدون طيار والتصوير الجوي: تسمح بصمة الذاكرة الفعالة له بالعمل على أجهزة كمبيوتر مرافقة خفيفة الوزن على الطائرات بدون طيار لمهام مثل مراقبة الزراعة وتتبع الحياة البرية.
- تجار التجزئة الأذكياء: من الدفع الآلي إلى إدارة المخزون، يمكن تصدير YOLOv5 بسهولة إلى TensorRT وONNX للنشر الشامل عبر آلاف كاميرات المتاجر.
Link to this sectionنتطلع للمستقبل: ميزة YOLO26#
بينما يعد YOLOv5 نموذجاً أسطورياً، فإن مجال الذكاء الاصطناعي يتقدم بسرعة. إذا كنت تبدأ مشروعاً جديداً اليوم، فإننا ننصح بشدة بالنظر إلى الجيل الأحدث من نماذج Ultralytics.
تم إصدار Ultralytics YOLO26 في عام 2026، ويمثل قفزة هائلة إلى الأمام. يتميز بتصميم شامل خالٍ من NMS، مما يزيل تماماً الحاجة إلى معالجة لاحقة بقمع غير الأعظم (Non-Maximum Suppression)، وهو ما يبسط منطق النشر بشكل كبير. من خلال إزالة خسارة التوزيع البؤري (DFL) واستخدام محسن MuSGD المتطور، يحقق YOLO26 استدلالاً على وحدة المعالجة المركزية أسرع بنسبة تصل إلى 43% من الأجيال السابقة مع الحفاظ على دقة أعلى، خاصة على الأجسام الصغيرة بفضل وظائف خسارة ProgLoss + STAL الجديدة.
سواء اخترت الموثوقية التي أثبتت كفاءتها في YOLOv5 أو الأداء المتطور لـ YOLO26، تضمن لك منصة Ultralytics امتلاك أفضل الأدوات المتاحة لنقل حلول الرؤية الحاسوبية الخاصة بك من المفهوم إلى الإنتاج بسلاسة. تأكد من استكشاف وثائق Ultralytics الشاملة لإطلاق العنان للإمكانات الكاملة لخط أنابيب الذكاء الاصطناعي الخاص بك.