تخطي إلى المحتوى

YOLOv5 YOLOv10: مقارنة تقنية بين أجهزة الكشف عن الأجسام في الوقت الفعلي

كان تطور بنية You Only Look Once (YOLO) بمثابة قصة حاسمة في تاريخ الرؤية الحاسوبية. وهناك معلمان بارزان في هذا الخط الزمني هما YOLOv5، المعيار الصناعي للموثوقية وسهولة الاستخدام، و YOLOv10، وهو إنجاز أكاديمي يركز على القضاء على اختناقات ما بعد المعالجة. يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين على اختيار الأداة المناسبة لتطبيقاتهم، مع استكشاف كيفية توحيد أحدث إصدار من YOLO26 بين نقاط القوة في كلا الإصدارين.

أصول الطراز والمواصفات

قبل الخوض في مقاييس الأداء، من الضروري فهم خلفية كل نموذج.

YOLOv5
المؤلف: جلين جوشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: yolov5
المستندات: YOLOv5

YOLOv10
المؤلفون: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المنظمة: جامعة تسينغهوا
التاريخ: 2024-05-23
Arxiv: arXiv:2405.14458
GitHub: THU-MIG/yolov10
المستندات: YOLOv10

تعرف على المزيد حول YOLOv5

تحليل الأداء

يقارن الجدول التالي النماذج على COCO وهي معيار قياسي لاكتشاف الأجسام.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

يحقق YOLOv10 متوسط دقة أعلى (mAP) مع عدد أقل من المعلمات، مما يسلط الضوء على مكاسب الكفاءة من بنيته الأحدث. ومع ذلك، YOLOv5 قادرًا على المنافسة في سرعات GPU لا سيما على الأجهزة القديمة، بفضل CUDA المُحسّنة للغاية.

تعرف على المزيد حول YOLOv10

الهندسة المعمارية والتصميم

YOLOv5: المعيار الموثوق

YOLOv5 بناء YOLOv5 على أساس شبكة CSPNet المعدلة و PANet neck. ويستخدم رؤوس كشف قياسية قائمة على المراسي، والتي تتطلب قمع غير أقصى (NMS) أثناء المعالجة اللاحقة لتصفية المربعات المحددة المكررة.

  • نقاط القوة: قاعدة برمجية ناضجة للغاية، مدعومة على نطاق واسع بأدوات طرف ثالث، ونشر مستقر على أجهزة حديثة مثل Raspberry Pi.
  • نقاط الضعف: يعتمد على NMS، مما قد يؤدي إلى تباين في زمن الاستجابة اعتمادًا على عدد الكائنات في المشهد.

YOLOv10: الرائد NMS

YOLOv10 تغييرًا جذريًا من خلال استخدام التعيينات المزدوجة المتسقة للتدريب NMS. وهذا يسمح للنموذج بالتنبؤ بمربع واحد فقط لكل كائن، مما يلغي الحاجة إلى خطوات NMS .

  • نقاط القوة: انخفاض زمن الاستدلال في المشاهد عالية الكثافة بفضل NMS تصميم الكتل الموجه بالرتبة الفعال يقلل من التكرار الحسابي.
  • نقاط الضعف: قد تتطلب البنية الأحدث إعدادات تصدير محددة لبعض المجمعين؛ دعم مجتمعي أقل مقارنة بالإصدار 5.

NMS الشبكات ( NMS

القمع غير الأقصى (NMS) هو خطوة معالجة لاحقة تقوم بتصفية المربعات المحيطة المتداخلة. على الرغم من فعاليتها، إلا أنها متسلسلة وتستهلك الكثير من موارد وحدة المعالجة المركزية. إزالتها، كما هو الحال في YOLOv10 YOLO26، أمر بالغ الأهمية للتطبيقات في الوقت الفعلي على الأجهزة الطرفية.

النظام البيئي وسهولة الاستخدام

أحد العوامل الأكثر أهمية للمطورين هو النظام البيئي المحيط بالنموذج. وهنا يتضح الفرق بين مستودع الأبحاث ومنصة الإنتاج.

ميزة Ultralytics

يمكن تشغيل كلا النموذجين عبر ultralytics Python ، مما يمنحهم إمكانية الوصول إلى مجموعة قوية من الأدوات.

  • Ultralytics : يمكن للمستخدمين إدارة مجموعات البيانات والتدريب في السحابة ونشر النماذج بسلاسة باستخدام Ultralytics .
  • كفاءة التدريب: تم تحسين Ultralytics من أجل كفاءة الذاكرة أثناء التدريب، وغالبًا ما تتطلب ذاكرة VRAM أقل بكثير من البدائل القائمة على المحولات.
  • تعدد الاستخدامات: في حين أن YOLOv10 في الأساس نموذج للكشف، فإن Ultralytics يدعم تقسيم الصور وتقدير الوضع وكشف الكائنات الموجهة (OBB) عبر نماذجه الأساسية.

مثال على التعليمات البرمجية

التبديل بين النماذج سهل مثل تغيير سلسلة اسم النموذج.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)

# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")

حالات الاستخدام المثالية

متى تختار YOLOv5

  • الأنظمة القديمة: إذا كان لديك خط أنابيب قائم مبني على تنسيقات YOLOv5 .
  • أوسع نطاق من التوافق: للنشر على الأنظمة المدمجة القديمة التي قد لا تدعم المشغلات الأحدث.
  • موارد المجتمع: عندما تحتاج إلى الوصول إلى آلاف البرامج التعليمية والتكاملات الخارجية التي تم إنشاؤها على مدار السنوات الخمس الماضية.

متى تختار YOLOv10

  • الكشف عالي الكثافة: سيناريوهات مثل حساب عدد الحشود أو تحليل حركة المرور حيث NMS عملية المعالجة.
  • قيود صارمة على زمن الاستجابة: الروبوتات في الوقت الحقيقي أو القيادة الذاتية حيث كل مللي ثانية من زمن الاستجابة للاستدلال مهمة.
  • البحث: تجربة أحدث التطورات في استراتيجيات التخصيص والتشذيب المعماري.

التوصية النهائية: YOLO26

بينما YOLOv5 الاستقرار YOLOv10 استنتاجًا NMS، فإن Ultralytics الذي تم إصداره مؤخرًا يجمع بين هذه المزايا في إطار عمل واحد فائق.

لماذا الترقية إلى YOLO26؟ YOLO26 هو نظام شامل أصلاً، يعتمد التصميمNMS الذي ابتكره YOLOv10 يعززه بخط أنابيب Ultralytics القوي Ultralytics .

  1. MuSGD Optimizer: مستوحى من تدريب LLM (على وجه التحديد Moonshot AI's Kimi K2)، يضمن هذا المحسن تقاربًا مستقرًا وتدريبًا أسرع.
  2. الأداء: مُحسّن للحوسبة الطرفية، ويوفر CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة.
  3. الدقة: يتميز بـ ProgLoss و STAL (Semantic-Token Alignment Loss)، مما يحسن بشكل كبير من اكتشاف الأجسام الصغيرة، وهو ما كان يمثل نقطة ضعف في النماذج السابقة.
  4. تنوع كامل: على عكس YOLOv10 يركز على الكشف، يقدم YOLO26 نماذج متطورة للتقسيم والتصنيف والتصنيف و OBB.

بالنسبة لأي مشروع جديد يبدأ في عام 2026، يُعد YOLO26 هو الخيار الموصى به، حيث يوفر أسهل مسار من تعليق مجموعة البيانات إلى تصدير النموذج.

تعرف على المزيد حول YOLO26

الخلاصة

YOLOv10 كل من YOLOv5 YOLOv10 لحظات محورية في مجال الرؤية الحاسوبية. YOLOv5 الذكاء الاصطناعي من خلال جعله متاحًا وموثوقًا، بينما YOLOv10 دفعت الحدود التقنية للمعالجة الشاملة. ومع ذلك، فإن هذا المجال يتطور بسرعة. مع إصدار YOLO26، لم يعد المطورون بحاجة إلى الاختيار بين موثوقية نظام Ultralytics وسرعة البنى NMS، حيث يوفر YOLO26 كلاهما.

للحصول على بدائل حديثة أخرى، يمكنك أيضًا استكشاف YOLO11 للمهام البصرية العامة أو Real-Time DETR (RT-DETR) للكشف القائم على المحولات.


تعليقات