YOLOv5 YOLOX: مقارنة تقنية شاملة
شهد تطور الرؤية الحاسوبية في الوقت الفعلي العديد من الإنجازات الهامة، حيث دفعت البنى المختلفة حدود السرعة والدقة إلى آفاق جديدة. ومن النماذج المؤثرة للغاية في هذا المجال نموذج YOLOv5 و YOLOX. ورغم أن كلاهما يشتهران بأدائهما العالي في اكتشاف الأجسام، إلا أنهما يتبعان نهجين معماريين مختلفين تمامًا.
يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين، ويقارن بين هياكلهما ومقاييس أدائهما ومنهجيات التدريب وسيناريوهات النشر المثالية لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لمشاريع الرؤية الاصطناعية الخاصة بهم.
نظرة عامة على النماذج والاختلافات المعمارية
Ultralytics YOLOv5
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:YOLOv5 Ultralytics YOLOv5
- الوثائق:الوثائقYOLOv5
قدمته شركة UltralyticsYOLOv5 أصبح بسرعة معيارًا صناعيًا بفضل توازنه الاستثنائي بين الأداء وسهولة الاستخدام وكفاءة الذاكرة. تم بناؤه أصلاً على PyTorch ، YOLOv5 بنية قائمة على المراسي. يعتمد على أشكال مربعات تحديد محددة مسبقًا للتنبؤ بمواقع الكائنات، مما يجعله فعالًا للغاية في مهام الكشف عن الكائنات القياسية.
YOLOv5 إحدى أكبر نقاط قوة YOLOv5 نظامها البيئي الذي يتم صيانته جيدًا. فهي تفتخر بوثائقها الشاملة Python البسيطة للغاية والتكامل الأصلي مع Ultralytics . وهذا يتيح للمطورين الانتقال بسلاسة من تسمية مجموعات البيانات إلى التدريب والتصدير إلى تنسيقات مثل ONNX و TensorRT.
ميزة النظام البيئي
تتطلبYOLO Ultralytics YOLO عادةً GPU أقل بكثير أثناء التدريب مقارنة بالبدائل المعقدة القائمة على المحولات. هذا الاستهلاك المنخفض للذاكرة يجعل YOLOv5 الوصول للباحثين الذين يعملون بأجهزة من فئة المستهلكين.
Megvii YOLOX
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- التاريخ: 2021-07-18
- Arxiv:YOLOX: Exceeding YOLO Series in 2021
- GitHub:مستودع Megvii YOLOX
- الوثائق:YOLOX ReadTheDocs
طور باحثون في Megvii نظام YOLOX الذي اتخذ مسارًا مختلفًا من خلال إدخال تصميم خالٍ من المراسي إلى YOLO . من خلال التخلص من مربعات المراسي، يبسط YOLOX رأس الكشف ويقلل بشكل كبير من عدد المعلمات الاستدلالية التي تحتاج إلى ضبط يدوي أثناء التدريب.
يضم YOLOX أيضًا رأسًا منفصلًا - يفصل مهام التصنيف والانحدار إلى فروع شبكة مختلفة - ويستخدم استراتيجية تعيين التسميات SimOTA. تعمل هذه الابتكارات على سد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية، مما يجعل YOLOX فعالًا بشكل خاص في البيئات التي تتنوع فيها أحجام الكائنات بشكل كبير.
الأداء والمقاييس
عند تقييم نماذج الرؤية الحاسوبية، فإن المفاضلة بين متوسط الدقة (mAP) وسرعة الاستدلال أمر بالغ الأهمية. يوفر كلا النموذجين مجموعة من الأحجام (من Nano إلى Extra-Large) لتناسب مختلف قيود الأجهزة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
بينما يحقق YOLOXx دقة قصوى أعلى قليلاً (51.1 mAP)، YOLOv5 خط أنابيب نشر أكثر قوة واختباراً شاملاً عبر GPU CPU GPU . YOLOv5 TensorRT لـ YOLOv5 تحسينه العميق لأجهزة الحوسبة المتطورة، مما يجعله خياراً موثوقاً للغاية لتحليلات الفيديو في الوقت الفعلي.
منهجيات التدريب وسهولة الاستخدام
تختلف تجربة المطور بشكل كبير بين هاتين البنيتين.
نهج YOLOX
يتطلب تدريب YOLOX عادةً استنساخ المستودع الأصلي وإدارة التبعيات المحددة وتنفيذ نصوص برمجية معقدة لسطر الأوامر. على الرغم من أنه يدعم ميزات متقدمة مثل التدريب ذي الدقة المختلطة والإعدادات متعددة العقد عبر MegEngine، إلا أن منحنى التعلم قد يكون صعبًا للمطورين الذين يحتاجون إلى نماذج أولية سريعة.
ميزة Ultralytics
في المقابل، Ultralytics لتجربة مستخدم مبسطة للغاية. مع ultralytics Python يمكن للمطورين تحميل النموذج وتدريبه والتحقق من صحته باستخدام الحد الأدنى من التعليمات البرمجية النمطية. تتعامل Ultralytics مع عمليات زيادة البيانات المعقدة وتطور المعلمات الفائقة وجدولة معدل التعلم.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
علاوة على ذلك، تتجاوز تعددية استخدامات YOLOv5 حدود الكشف القياسي عن الكائنات، حيث توفر دعماً قوياً لتصنيف الصور وتقسيم الحالات ضمن نفس واجهة برمجة التطبيقات المتماسكة.
نشر مبسط
عند الانتهاء من التدريب، OpenVINO تصدير YOLOv5 إلى CoreML أو TFLite أو OpenVINO بسيطًا مثل تشغيل model.export(format="onnx"). وهذا يلغي الحاجة إلى برامج التحويل الخارجية التي عادة ما تتطلبها مستودعات البيانات التي تركز على الأبحاث.
تطبيقات عملية في أرض الواقع
يعتمد الاختيار بين هذه النماذج على بيئة النشر والمتطلبات الفنية لديك:
- إدارة البيع بالتجزئة والمخزون: بالنسبة للتطبيقات التي تتطلب التعرف على المنتجات في الوقت الفعلي على الأجهزة المتطورة مثل NVIDIA YOLOv5 مناسب بشكل استثنائي. تتيح مساحة الذاكرة الصغيرة وسرعات TensorRT السريعة إمكانية التتبع متعدد الكاميرات دون فقدان الإطارات.
- البحوث الأكاديمية والبنى المخصصة: يحظىYOLOX بتقدير كبير في أوساط الباحثين. فطبيعته المنفصلة عن الرأس والخالية من المراسي تجعله أساسًا ممتازًا للمهندسين الذين يسعون إلى تجربة استراتيجيات جديدة لتعيين العلامات أو أولئك الذين يعملون على مجموعات بيانات لا يمكن تعميمها باستخدام المربعات التقليدية.
- الذكاء الاصطناعي في الزراعة: بالنسبة لمهام الزراعة الدقيقة مثل اكتشاف الفاكهة أو تحديد الأعشاب الضارة باستخدام الطائرات بدون طيار، فإن سهولة تدريب ونشر YOLOv5 باستخدام Ultralytics تتيح للخبراء في هذا المجال تنفيذ حلول الذكاء الاصطناعي دون الحاجة إلى خلفيات هندسية عميقة في مجال التعلم الآلي.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 YOLOX على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 خيار قوي لـ:
- أنظمة إنتاج مجربة: عمليات النشر الحالية التي تُقدّر فيها track YOLOv5 الطويل في الاستقرار، والوثائق الشاملة، والدعم المجتمعي الهائل.
- التدريب المحدود الموارد: البيئات ذات GPU المحدودة حيث يكون خط التدريب الفعال YOLOv5 ومتطلبات الذاكرة المنخفضة ميزة.
- دعم واسع النطاق لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNXو TensorRTو CoreMLو TFLite.
متى تختار YOLOX
يوصى باستخدام YOLOX في الحالات التالية:
- أبحاث الكشف بدون مرساة: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة طرفية فائقة الخفة: يتم نشرها على وحدات التحكم الدقيقة أو الأجهزة المحمولة القديمة حيث يكون الحجم الصغير للغاية (0.91 مليون معلمة) لنسخة YOLOX-Nano أمرًا بالغ الأهمية.
- دراسات تخصيص علامات SimOTA: مشاريع بحثية تبحث في الاستراتيجيات المثلى لتخصيص العلامات على أساس النقل وتأثيرها على تقارب التدريب.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
مستقبل الذكاء الاصطناعي في مجال الرؤية: دخول YOLO26
في حين أن كلا من YOLOv5 YOLOX قد رسخا مكانتيهما في تاريخ الرؤية الحاسوبية، فإن هذا المجال يشهد تطوراً سريعاً. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، توصي Ultralytics باستكشاف أحدث نماذجها الرائدة، YOLO26.
صدر YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام في كل من الأداء وسهولة الاستخدام. ويقدم تصميمًا متطورًا شاملاً NMS، مما يلغي تمامًا المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يقلل بشكل كبير من تقلب زمن الاستجابة ويبسط منطق النشر على الأجهزة منخفضة الطاقة.
علاوة على ذلك، يستخدم YOLO26 مُحسّن MuSGDالجديد — وهو مزيج من SGD Muon مستوحى من ابتكارات تدريب LLM — لتحقيق تقارب مستقر وسريع بشكل لا يصدق. مع إزالة DFL (إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع الأجهزة المتطورة/منخفضة الطاقة)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يعزز مكانته كنموذج مثالي لتطبيقات الحوسبة المتطورة والروبوتات وإنترنت الأشياء الحديثة. بالإضافة إلى ذلك، يوفر ProgLoss + STAL وظائف خسارة محسنة مع تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لإنترنت الأشياء والروبوتات والصور الجوية. يمكن للمستخدمين المهتمين بالأجيال السابقة الاطلاع أيضًا على YOLO11، على الرغم من أن YOLO26 هو الخيار الأحدث بلا منازع.
الخلاصة
يوفر كل من YOLOv5 YOLOX قدرات مذهلة في مجال اكتشاف الأجسام. وقد دفع YOLOX حدود الهندسة المعمارية إلى الأمام من خلال إثبات أن التصميمات الخالية من المراسي يمكن أن تنافس الطرق التقليدية وتتفوق عليها في عام 2021. ومع ذلك، YOLOv5 قوة مهيمنة بسبب سهولة استخدامه التي لا مثيل لها، ونظامه البيئي الشامل، ومتطلباته المنخفضة من الذاكرة أثناء التدريب.
بالنسبة للغالبية العظمى من التطبيقات التجارية، يوفر Ultralytics أسرع مسار من مجموعة البيانات الأولية إلى نموذج الإنتاج المطبق. سواء باستخدام YOLOv5 المجرب والمثبت YOLOv5 الترقية إلى YOLO26 المتطور، يستفيد المطورون من إطار عمل مصمم لجعل الذكاء الاصطناعي البصري سهل الوصول وفعال وعالي الأداء.