تخطي إلى المحتوى

YOLOv5 مقابل YOLOv10: تطور اكتشاف الأجسام في الوقت الحقيقي

تم تشكيل مشهد اكتشاف الأجسام بشكل كبير من خلال سلسلة You Only Look Only OneYOLO). منذ إنشائها، وازنت YOLO بين السرعة والدقة، لتصبح البنية الأساسية لمطوري الرؤية الحاسوبية. تستكشف هذه المقارنة لحظتين محوريتين في هذا التاريخ: Ultralytics YOLOv5معيار الصناعة من حيث الموثوقية وتعدد الاستخدامات، و YOLOv10، وهو إصدار أكاديمي حديث من جامعة تسينغهوا يقدم الكشف NMS لتعزيز الكفاءة.

نظرة عامة على النموذج

Ultralytics YOLOv5

صدر في يونيو 2020 بواسطة جلين جوشر و Ultralytics, YOLOv5 تغييرًا جذريًا في كيفية نشر نماذج الذكاء الاصطناعي. فقد أعطت الأولوية لسهولة الاستخدام والتصدير إلى تنسيقات متنوعةCoreML ONNX TFLite) والأداء القوي على الأجهزة المتطورة. لا يزال أحد أكثر نماذج الرؤية شيوعًا وانتشارًا على مستوى العالم نظرًا لفلسفة "إنه يعمل فقط" والدعم المجتمعي الواسع النطاق.

المؤلفون الرئيسيون: جلين جوشر
المنظمة:Ultralytics
تاريخ الإصدار: 2020-06-26
GitHub:yolov5

تعرف على المزيد حول YOLOv5

YOLOv10

يهدف YOLOv10 الذي أطلقه باحثون من جامعة تسينغهوا في مايو 2024، إلى القضاء على اختناقات ما بعد المعالجة الموجودة في الإصدارات السابقة. من خلال تقديم تعيينات مزدوجة متسقة للتدريب NMS فإنه يعمل على تحسين خط أنابيب الاستدلال، مما يقلل من زمن الاستجابة والنفقات الحسابية.

المؤلفون الرئيسيون: Ao Wang, Hui Chen, et al.
منظمة جامعة تسينغهوا
تاريخ الإصدار: 2024-05-23
arXiv:YOLOv10: الكشف عن الكائنات في الوقت الحقيقي من النهاية إلى النهايةarXiv:YOLOv10: الكشف عن الكائنات في الوقت الحقيقي

اعرف المزيد عن YOLOv10

أحدث الابتكارات

وأثناء المقارنة بين هذه البنى القوية، يجب على المطورين الذين يبدأون مشاريع جديدة تقييم YOLO11. فهو يعتمد على نقاط القوة في كلتا البنيتين، حيث يقدم دقة متطورة واستخراج ميزات محسّنة ودعمًا أصليًا لمهام متنوعة مثل تقدير الوضعية واكتشاف الأجسام الموجهة.

الهندسة المعمارية والابتكار التقني

تسلط الاختلافات المعمارية بين YOLOv5 و YOLOv10 الضوء على التحول من الموثوقية الناضجة القائمة على المرساة إلى الكفاءة المتطورة الخالية من المرساة.

YOLOv5: المعيار المستند إلى المرساة

يستخدم YOLOv5 العمود الفقري للشبكة الجزئية المتقاطعة (CSPNet) الذي يوازن بين عمق النموذج وعرضه لتقليل عدد وحدات فلوبس مع الحفاظ على الدقة. ويعتمد على مربعات الارتكاز - وهيأشكال محددة مسبقًاتساعد النموذج على التنبؤ بأبعاد الكائن.

  • العمود الفقري: ركزت CSP-Darknet53 على التدفق المتدرج.
  • الرأس: الرأس المقترن بالتنبؤ القائم على المرساة.
  • المعالجة اللاحقة: يتطلب كبتًا غير أقصى (NMS) لتصفية الاكتشافات المكررة.

YOLOv10: كفاءة NMS

يقدم YOLOv10 تصميماً شاملاً مدفوعاً بالكفاءة والدقة. ميزته البارزة هي استراتيجية التدريبNMS باستخدام تعيينات مزدوجة متسقة. يسمح ذلك للنموذج بالتنبؤ بمربع محدد واحد فقط لكل كائن أثناء الاستدلال، مما يزيل خطوة NMS التي تسبب زمن الاستجابة السريع تمامًا.

  • العمود الفقري: معزز بالتفافات ذات النواة الكبيرة والانتباه الذاتي الجزئي.
  • الرأس: رأس موحد يجمع بين تعيينات التسمية من واحد إلى متعدد ومن واحد إلى واحد.
  • التحسين: تصميم الكتلة الموجهة حسب الرتبة لتقليل التكرار.

تحليل الأداء

يقارن الجدول التالي مقاييس الأداء على مجموعة بياناتCOCO . بينما يظل YOLOv5 قادرًا على المنافسة، لا سيما من حيث سرعة CPU لمتغيره النانوي، يُظهر YOLOv10 كفاءة أعلى من حيث المعلمات والدقةmAP).

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

التقسيم المتري

  • الدقة (mAP): يُظهر YOLOv10 قفزة كبيرة في متوسط الدقة المتوسطة. على سبيل المثال، يحقق YOLOv10n دقة 39.5 mAP مقارنةً بـ 28.0 mAP في YOLOv5n، مما يجعله أكثر قدرة على اكتشاف الأجسام الصعبة.
  • الكفاءة: يحقق YOLOv10 هذه النتائج مع عدد أقل من المعلمات (2.3 مليون مقابل 2.6 مليون لطراز Nano)، مما يعرض فوائد تصميمه المعماري المحسّن.
  • سرعة الاستدلال: يظل YOLOv5n سريعًا للغاية على وحدات المعالجة المركزية(73.6 مللي ثانية)، وهو أمر بالغ الأهمية للأجهزة التي GPU تعتمد على وحدة معالجة الرسومات مثل وحدات Raspberry Pi القديمة. ومع ذلك، على أجهزة GPU TensorRT)، يحافظ YOLOv10 على سرعات تنافسية على الرغم من دقته الأعلى.

نقاط القوة والضعف

Ultralytics YOLOv5

  • نظام بيئي لا مثيل له: مدعوم بسنوات من التطوير، ولديه واحد من أكبر المجتمعات النشطة. يتم حل المشكلات بسرعة، والموارد وفيرة.
  • تعدد الاستخدامات: بالإضافة إلى الكشف، فهو يدعم في الأصل تجزئة الصور وتصنيفها.
  • سهولة الاستخدام: واجهة برمجة التطبيقات مصممة للبساطة. يستغرق تحميل نموذج من PyTorch Hub سطرًا واحدًا من التعليمات البرمجية.
  • النشر: دعم واسع النطاق لتنسيقات التصدير يضمن تشغيله على كل شيء من الهواتف المحمولة إلى الخوادم السحابية.

YOLOv10

  • زمن انتقال منخفض: تقلل إزالة NMS بشكل كبير من وقت ما بعد المعالجة، وهو أمر حيوي للتطبيقات في الوقت الحقيقي حيث يكون لكل جزء من الثانية أهمية.
  • كفاءة المعلمة: يوفر دقة أعلى لكل معلمة، مما يجعله مرشحًا قويًا للأجهزة ذات التخزين أو الذاكرة المحدودة.
  • التركيز: على الرغم من قوتها، إلا أنها متخصصة في المقام الأول في اكتشاف الأجسام، وتفتقر إلى اتساع نطاق المهام المتعددة الأصلية (مثل تقدير الوضعية) الموجودة في سلسلة Ultralytics YOLO (الإصدار 8، 11).

متطلبات الذاكرة

تم تصميم كلا النموذجين ليكونا خفيفي الوزن. على عكس نماذج المحولات الكبيرة التي تستهلك كميات هائلة من ذاكرة CUDA أثناء التدريب، تم تحسين نماذج Ultralytics YOLO لتحقيق كفاءة الذاكرة، مما يسمح بتدريبها على وحدات معالجة رسومات من فئة المستهلكين مع ذاكرة وصول عشوائي افتراضية متواضعة.

حالات الاستخدام في العالم الحقيقي

متى تختار YOLOv5

YOLOv5 هو الخيار العملي لأنظمة الإنتاج التي تتطلب استقرارًا ودعمًا واسعًا للمنصة.

  • الأتمتة الصناعية: تُستخدم على نطاق واسع في التصنيع لمراقبة الجودة حيث تكون الموثوقية أمرًا بالغ الأهمية.
  • تطبيقات الأجهزة المحمولة: إن توافقه المثبت مع iOS CoreML) Android TFLite) يجعله مثاليًا لتكامل التطبيقات على الأجهزة.
  • النماذج الأولية السريعة: يسمح الحجم الهائل من البرامج التعليمية والوثائق للمطورين بالانتقال من المفهوم إلى النماذج الأولية في ساعات.

متى تختار YOLOv10

YOLOv10 ممتاز للسيناريوهات التي تتطلب أعلى نسبة دقة إلى كفاءة.

  • روبوتات عالية السرعة: تقلل البنية NMS من تباين زمن الوصول، وهو أمر بالغ الأهمية لحلقات التحكم في الروبوتات المستقلة.
  • البحث الأكاديمي: سيجد الباحثون الذين يتطلعون إلى قياس أحدث نماذج الكشف المتكاملة أن بنية YOLOv10 جديدة وفعالة.
  • المراقبة عن بُعد: يناسب mAP العالي مع عدد معلمات منخفض أنظمة الأمان التي تعمل على نطاق ترددي أو تخزين محدود.

التدريب وسهولة الاستخدام

تعطي Ultralytics الأولوية لتجربة مطورين مبسطة. سواء كنت تستخدم مستودع YOLOv5 الكلاسيكي أو مستودع YOLOv5 الحديث ultralytics الحزمة للموديلات الأحدث، فالعملية بديهية.

استخدام YOLOv5

يشتهر YOLOv5 بسهولة تحميله عبر PyTorch Hub للاستدلال الفوري.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image
img = "https://ultralytics.com/images/zidane.jpg"
results = model(img)

# Display results
results.show()

استخدام YOLOv10

يمكن دمج YOLOv10 باستخدام ultralytics Python مستفيدًا من نفس واجهة برمجة التطبيقات القوية.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on COCO data
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
model.predict("https://ultralytics.com/images/bus.jpg", save=True)

الخلاصة

تمثل كلتا البنائين معالم بارزة في مجال الرؤية الحاسوبية. YOLOv5 لا يزال هو العمود الفقري الموثوق به في هذه الصناعة - فهو قوي ومتعدد الاستخدامات ومدعوم بنظام بيئي ضخم. إنه الخيار الآمن "المفضل" لتلبية احتياجات النشر المتنوعة. YOLOv10 يتخطى حدود الكفاءة من خلال تصميمه NMS)، مما يوفر ترقية مقنعة للمستخدمين الذين يركزون بشكل خاص على مهام الكشف الذين يحتاجون إلى زيادة الدقة إلى أقصى حد على الأجهزة المقيدة.

بالنسبة للمطورين الذين يبحثون عن أفضل ما في العالمين - الجمع بين نضج النظام الإيكولوجي لـ Ultralytics مع أحدث ما توصلت إليه التكنولوجيا من دقة وسرعة - نوصي باستكشاف YOLO11. فهو يوحّد هذه التطورات في إطار عمل واحد وقوي وجاهز لأي مهمة رؤية.

لاستكشاف المزيد من المقارنات، راجع YOLOv5 مقابل YOLOv8 أو YOLOv10 مقابل YOLO11.


تعليقات