YOLOv5 YOLOX: مقارنة تقنية شاملة
شهد تطور الرؤية الحاسوبية في الوقت الفعلي العديد من الإنجازات الهامة، حيث دفعت البنى المختلفة حدود السرعة والدقة إلى آفاق جديدة. ومن النماذج المؤثرة للغاية في هذا المجال نموذج YOLOv5 و YOLOX. ورغم أن كلاهما يشتهران بأدائهما العالي في اكتشاف الأجسام، إلا أنهما يتبعان نهجين معماريين مختلفين تمامًا.
يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين، ويقارن بين هياكلهما ومقاييس أدائهما ومنهجيات التدريب وسيناريوهات النشر المثالية لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لمشاريع الرؤية الاصطناعية الخاصة بهم.
نظرة عامة على النماذج والاختلافات المعمارية
Ultralytics YOLOv5
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:YOLOv5 Ultralytics YOLOv5
- التوثيق:وثائق YOLOv5 الرسمية
قدمته شركة UltralyticsYOLOv5 أصبح بسرعة معيارًا صناعيًا بفضل توازنه الاستثنائي بين الأداء وسهولة الاستخدام وكفاءة الذاكرة. تم بناؤه أصلاً على PyTorch ، YOLOv5 بنية قائمة على المراسي. يعتمد على أشكال مربعات تحديد محددة مسبقًا للتنبؤ بمواقع الكائنات، مما يجعله فعالًا للغاية في مهام الكشف عن الكائنات القياسية.
YOLOv5 إحدى أكبر نقاط قوة YOLOv5 نظامها البيئي الذي يتم صيانته جيدًا. فهي تفتخر بوثائقها الشاملة Python البسيطة للغاية والتكامل الأصلي مع Ultralytics . وهذا يتيح للمطورين الانتقال بسلاسة من تسمية مجموعات البيانات إلى التدريب والتصدير إلى تنسيقات مثل ONNX و TensorRT.
ميزة النظام البيئي
تتطلبYOLO Ultralytics YOLO عادةً GPU أقل بكثير أثناء التدريب مقارنة بالبدائل المعقدة القائمة على المحولات. هذا الاستهلاك المنخفض للذاكرة يجعل YOLOv5 الوصول للباحثين الذين يعملون بأجهزة من فئة المستهلكين.
Megvii YOLOX
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- التاريخ: 2021-07-18
- Arxiv:YOLOX: Exceeding YOLO Series in 2021
- GitHub:مستودع Megvii YOLOX
- التوثيق:YOLOX ReadTheDocs
طور باحثون في Megvii نظام YOLOX الذي اتخذ مسارًا مختلفًا من خلال إدخال تصميم خالٍ من المراسي إلى YOLO . من خلال التخلص من مربعات المراسي، يبسط YOLOX رأس الكشف ويقلل بشكل كبير من عدد المعلمات الاستدلالية التي تحتاج إلى ضبط يدوي أثناء التدريب.
يضم YOLOX أيضًا رأسًا منفصلًا - يفصل مهام التصنيف والانحدار إلى فروع شبكة مختلفة - ويستخدم استراتيجية تعيين التسميات SimOTA. تعمل هذه الابتكارات على سد الفجوة بين البحث الأكاديمي والتطبيقات الصناعية، مما يجعل YOLOX فعالًا بشكل خاص في البيئات التي تتنوع فيها أحجام الكائنات بشكل كبير.
الأداء والمقاييس
عند تقييم نماذج الرؤية الحاسوبية، فإن المفاضلة بين متوسط الدقة (mAP) وسرعة الاستدلال أمر بالغ الأهمية. يوفر كلا النموذجين مجموعة من الأحجام (من Nano إلى Extra-Large) لتناسب مختلف قيود الأجهزة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
بينما يحقق YOLOXx دقة قصوى أعلى قليلاً (51.1 mAP)، YOLOv5 خط أنابيب نشر أكثر قوة واختباراً شاملاً عبر GPU CPU GPU . YOLOv5 TensorRT لـ YOLOv5 تحسينه العميق لأجهزة الحوسبة المتطورة، مما يجعله خياراً موثوقاً للغاية لتحليلات الفيديو في الوقت الفعلي.
منهجيات التدريب وسهولة الاستخدام
تختلف تجربة المطور بشكل كبير بين هاتين البنيتين.
نهج YOLOX
يتطلب تدريب YOLOX عادةً استنساخ المستودع الأصلي وإدارة التبعيات المحددة وتنفيذ نصوص برمجية معقدة لسطر الأوامر. على الرغم من أنه يدعم ميزات متقدمة مثل التدريب ذي الدقة المختلطة والإعدادات متعددة العقد عبر MegEngine، إلا أن منحنى التعلم قد يكون صعبًا للمطورين الذين يحتاجون إلى نماذج أولية سريعة.
ميزة Ultralytics
في المقابل، Ultralytics لتجربة مستخدم مبسطة للغاية. مع ultralytics Python يمكن للمطورين تحميل النموذج وتدريبه والتحقق من صحته باستخدام الحد الأدنى من التعليمات البرمجية النمطية. تتعامل Ultralytics مع عمليات زيادة البيانات المعقدة وتطور المعلمات الفائقة وجدولة معدل التعلم.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
علاوة على ذلك، تتجاوز تعددية استخدامات YOLOv5 حدود الكشف القياسي عن الكائنات، حيث توفر دعماً قوياً لتصنيف الصور وتقسيم الحالات ضمن نفس واجهة برمجة التطبيقات المتماسكة.
نشر مبسط
عند الانتهاء من التدريب، OpenVINO تصدير YOLOv5 إلى CoreML أو TFLite أو OpenVINO بسيطًا مثل تشغيل model.export(format="onnx")هذا يلغي الحاجة إلى نصوص تحويل من طرف ثالث المطلوبة عادة بواسطة المستودعات التي تركز على البحث.
تطبيقات عملية في أرض الواقع
يعتمد الاختيار بين هذه النماذج على بيئة النشر والمتطلبات التقنية الخاصة بك:
- إدارة التجزئة والمخزون: للتطبيقات التي تتطلب التعرف على المنتجات في الوقت الفعلي على أجهزة الحافة مثل NVIDIA Jetson، يعد YOLOv5 مناسبًا بشكل استثنائي. فبصمته الذاكرية الضئيلة وسرعات استدلال TensorRT السريعة تمكن من تتبع الكاميرات المتعددة دون إسقاط إطارات.
- البحث الأكاديمي والبنى المخصصة:YOLOX يُعتبر ذا قيمة عالية في مجتمع البحث. إن رأسه المفصول وطبيعته الخالية من نقاط الارتكاز (anchor-free) تجعله خط أساس ممتازًا للمهندسين الذين يتطلعون إلى تجربة استراتيجيات جديدة لتخصيص التسميات أو أولئك الذين يعملون على مجموعات بيانات تفشل فيها مربعات الارتكاز التقليدية في التعميم.
- الذكاء الاصطناعي الزراعي: لمهام الزراعة الدقيقة مثل الكشف عن الفاكهة أو تحديد الأعشاب الضارة عبر الطائرات بدون طيار، تتيح سهولة تدريب ونشر نماذج YOLOv5 باستخدام منصة Ultralytics لخبراء المجال تطبيق حلول الذكاء الاصطناعي دون الحاجة إلى خلفيات هندسة تعلم آلة عميقة.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 خيار قوي لـ:
- أنظمة الإنتاج المثبتة: العمليات المنشورة الحالية حيث تُقدر سجل YOLOv5 الطويل في الاستقرار، والتوثيق الشامل، والدعم المجتمعي الهائل.
- التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خطة تدريب YOLOv5 الفعالة ومتطلبات الذاكرة الأقل مفيدة.
- دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.
متى تختار YOLOX
يوصى باستخدام YOLOX في الحالات التالية:
- أبحاث الكشف الخالي من المراسي: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة الحافة خفيفة الوزن للغاية: النشر على المتحكمات الدقيقة أو الأجهزة المحمولة القديمة حيث تعتبر البصمة الصغيرة للغاية لمتغير YOLOX-Nano (0.91 مليون معلمة) أمرًا بالغ الأهمية.
- دراسات تعيين التسميات SimOTA: مشاريع بحثية تستكشف استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
مستقبل الذكاء الاصطناعي في مجال الرؤية: دخول YOLO26
في حين أن كلا من YOLOv5 YOLOX قد رسخا مكانتيهما في تاريخ الرؤية الحاسوبية، فإن هذا المجال يشهد تطوراً سريعاً. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، توصي Ultralytics باستكشاف أحدث نماذجها الرائدة، YOLO26.
صدر YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام في كل من الأداء وسهولة الاستخدام. ويقدم تصميمًا متطورًا شاملاً NMS، مما يلغي تمامًا المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يقلل بشكل كبير من تقلب زمن الاستجابة ويبسط منطق النشر على الأجهزة منخفضة الطاقة.
علاوة على ذلك، يستخدم YOLO26 مُحسّن MuSGDالجديد — وهو مزيج من SGD Muon مستوحى من ابتكارات تدريب LLM — لتحقيق تقارب مستقر وسريع بشكل لا يصدق. مع إزالة DFL (إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع الأجهزة المتطورة/منخفضة الطاقة)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يعزز مكانته كنموذج مثالي لتطبيقات الحوسبة المتطورة والروبوتات وإنترنت الأشياء الحديثة. بالإضافة إلى ذلك، يوفر ProgLoss + STAL وظائف خسارة محسنة مع تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لإنترنت الأشياء والروبوتات والصور الجوية. يمكن للمستخدمين المهتمين بالأجيال السابقة الاطلاع أيضًا على YOLO11، على الرغم من أن YOLO26 هو الخيار الأحدث بلا منازع.
الخلاصة
يوفر كل من YOLOv5 YOLOX قدرات مذهلة في مجال اكتشاف الأجسام. وقد دفع YOLOX حدود الهندسة المعمارية إلى الأمام من خلال إثبات أن التصميمات الخالية من المراسي يمكن أن تنافس الطرق التقليدية وتتفوق عليها في عام 2021. ومع ذلك، YOLOv5 قوة مهيمنة بسبب سهولة استخدامه التي لا مثيل لها، ونظامه البيئي الشامل، ومتطلباته المنخفضة من الذاكرة أثناء التدريب.
بالنسبة للغالبية العظمى من التطبيقات التجارية، يوفر Ultralytics أسرع مسار من مجموعة البيانات الأولية إلى نموذج الإنتاج المطبق. سواء باستخدام YOLOv5 المجرب والمثبت YOLOv5 الترقية إلى YOLO26 المتطور، يستفيد المطورون من إطار عمل مصمم لجعل الذكاء الاصطناعي البصري سهل الوصول وفعال وعالي الأداء.