تخطي إلى المحتوى

YOLOv5 ضد YOLOv10: تطور كشف الأجسام في الوقت الفعلي

لقد تم تشكيل مشهد object detection بشكل كبير من خلال سلسلة You Only Look Once (YOLO). منذ إنشائها، حققت YOLO توازنًا بين السرعة والدقة، لتصبح البنية المفضلة لمطوري رؤية الكمبيوتر. تستكشف هذه المقارنة لحظتين محوريتين في هذا التاريخ: Ultralytics YOLOv5، المعيار الصناعي للموثوقية والتنوع، و YOLOv10، وهو إصدار أكاديمي حديث من جامعة Tsinghua يقدم object detection خاليًا من NMS لتحسين الكفاءة.

نظرة عامة على النموذج

Ultralytics YOLOv5

قام YOLOv5، الذي تم إصداره في يونيو 2020 بواسطة Glenn Jocher و Ultralytics، بتغيير الطريقة التي تم بها نشر نماذج الذكاء الاصطناعي بشكل أساسي. لقد أعطى الأولوية لقابلية الاستخدام والتصدير إلى تنسيقات متنوعة (CoreML، ONNX، TFLite) والأداء القوي على الأجهزة الطرفية. لا يزال أحد نماذج الرؤية الأكثر شيوعًا وانتشارًا على نطاق عالمي نظرًا لفلسفة "أنه يعمل فقط" ودعم المجتمع الواسع.

المؤلف الرئيسي: جلين جوتشر
المنظمة:Ultralytics
تاريخ الإصدار: 2020-06-26
GitHub:ultralytics/yolov5

تعرف على المزيد حول YOLOv5

YOLOv10

يهدف YOLOv10، الذي تم إصداره في مايو 2024 بواسطة باحثين من جامعة تسينغ هوا، إلى إزالة الاختناقات في المعالجة اللاحقة الموجودة في الإصدارات السابقة. من خلال تقديم تعيينات مزدوجة متسقة للتدريب الخالي من NMS، فإنه يحسن خط أنابيب الاستدلال، مما يقلل من زمن الانتقال والنفقات الحسابية.

المؤلفون الرئيسيون: آو وانغ، هوي تشن، وآخرون.
المنظمة: جامعة تسينغ هوا
تاريخ الإصدار: 2024-05-23
arXiv:YOLOv10: الكشف عن الكائنات في الوقت الفعلي من النهاية إلى النهاية

تعرف على المزيد حول YOLOv10

أحدث الابتكارات

أثناء مقارنة هذه الهياكل القوية، يجب على المطورين الذين يبدأون مشاريع جديدة أيضًا تقييم YOLO11. إنه يعتمد على نقاط القوة في كليهما، ويقدم دقة حديثة، واستخراج محسّن للميزات، ودعم أصلي للمهام المتنوعة مثل تقدير الوضعية و الكشف عن الكائنات الموجهة.

الهيكلة والابتكار التقني

تسلط الاختلافات المعمارية بين YOLOv5 و YOLOv10 الضوء على التحول من الموثوقية القائمة على المرساة والناضجة إلى الكفاءة المتطورة والخالية من المرساة.

YOLOv5: المعيار القائم على المرساة

يستخدم YOLOv5 عمودًا فقريًا CSPNet (شبكة جزئية متقاطعة المراحل) يوازن بين عمق النموذج وعرضه لتقليل FLOPS مع الحفاظ على الدقة. يعتمد على مربعات الارتساء - وهي أشكال محددة مسبقًا تساعد النموذج على التنبؤ بأبعاد الكائن.

  • العمود الفقري: CSP-Darknet53 يركز على تدفق التدرج.
  • الرأس: رأس مقترن مع تنبؤ قائم على المرساة.
  • المعالجة اللاحقة: تتطلب تثبيط غير الأعظمية (NMS) لفلترة الاكتشافات المكررة.

YOLOv10: كفاءة خالية من NMS

يقدم YOLOv10 تصميمًا شاملاً يعتمد على الكفاءة والدقة. السمة البارزة فيه هي استراتيجية التدريب الخالي من NMS باستخدام تعيينات مزدوجة متسقة. يتيح ذلك للنموذج التنبؤ بمربع إحاطة واحد بالضبط لكل كائن أثناء الاستدلال، مما يزيل خطوة NMS التي تؤدي إلى زمن الوصول تمامًا.

  • العمود الفقري: مُحسَّن بالتفافات ذات النواة الكبيرة والانتباه الذاتي الجزئي.
  • الرأس: رأس موحد يجمع بين تعيينات التسميات من واحد إلى متعدد ومن واحد إلى واحد.
  • التحسين: تصميم كتلة موجه بالرتبة لتقليل التكرار.

تحليل الأداء

يقارن الجدول التالي مقاييس الأداء على مجموعة بيانات COCO. بينما يظل YOLOv5 منافسًا، لا سيما في سرعة وحدة المعالجة المركزية (CPU) لمتغير Nano الخاص به، يُظهر YOLOv10 كفاءة فائقة من حيث المعلمات والدقة (mAP).

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

تفصيل المقاييس

  • الدقة (mAP): يُظهر YOLOv10 قفزة كبيرة في متوسط الدقة المتوسطة. على سبيل المثال، يحقق YOLOv10n قيمة 39.5 mAP مقارنة بـ 28.0 mAP لـ YOLOv5n، مما يجعله أكثر قدرة على اكتشاف الأجسام الصعبة.
  • الكفاءة: يحقق YOLOv10 هذه النتائج بعدد أقل من المعلمات (2.3 مليون مقابل 2.6 مليون للنموذج Nano)، مما يدل على فوائد تصميمه المعماري المحسّن.
  • سرعة الاستدلال: يظل YOLOv5n سريعًا بشكل لا يصدق على وحدات المعالجة المركزية CPUs (73.6 مللي ثانية)، وهو أمر بالغ الأهمية للأجهزة الطرفية غير المزودة بوحدة معالجة الرسوميات GPU مثل وحدات Raspberry Pi الأقدم. ومع ذلك، على أجهزة GPU (TensorRT)، يحافظ YOLOv10 على سرعات تنافسية على الرغم من دقته الأعلى.

نقاط القوة والضعف

Ultralytics YOLOv5

  • نظام بيئي لا مثيل له: مدعوم بسنوات من التطوير، ولديه واحد من أكبر المجتمعات النشطة. يتم حل المشكلات بسرعة، والموارد وفيرة.
  • Versatility: بالإضافة إلى الـ detect، فإنه يدعم أصلاً image segmentation و classification.
  • سهولة الاستخدام: تم تصميم API من أجل البساطة. يستغرق تحميل نموذج من PyTorch Hub سطرًا واحدًا من التعليمات البرمجية.
  • النشر: يضمن الدعم المكثف لتنسيقات التصدير تشغيله على كل شيء بدءًا من الهواتف المحمولة وحتى الخوادم السحابية.

YOLOv10

  • زمن انتقال منخفض: يقلل إزالة NMS بشكل كبير من وقت ما بعد المعالجة، وهو أمر حيوي لتطبيقات الوقت الفعلي حيث يهم كل جزء من الثانية.
  • كفاءة المعلمات: إنها توفر دقة أعلى لكل معلمة، مما يجعلها مرشحًا قويًا للأجهزة ذات التخزين أو الذاكرة المحدودة.
  • التركيز: على الرغم من قوتها، إلا أنها متخصصة بشكل أساسي في اكتشاف الكائنات، وتفتقر إلى اتساع المهام المتعددة الأصلي (مثل تقدير الوضع) الموجود في سلسلة Ultralytics YOLO (v8، 11).

متطلبات الذاكرة

تم تصميم كلا النموذجين ليكونان خفيفي الوزن. على عكس نماذج المحولات الكبيرة التي تستهلك كميات هائلة من ذاكرة CUDA أثناء التدريب، تم تحسين نماذج Ultralytics YOLO لتحقيق كفاءة الذاكرة، مما يسمح بتدريبها على وحدات معالجة الرسومات من الدرجة الاستهلاكية مع VRAM متواضع.

حالات الاستخدام في العالم الحقيقي

متى تختار YOLOv5

YOLOv5 هو الخيار العملي لأنظمة الإنتاج التي تتطلب الاستقرار ودعمًا واسعًا للنظام الأساسي.

  • الأتمتة الصناعية: تستخدم على نطاق واسع في التصنيع لمراقبة الجودة حيث تكون الموثوقية في غاية الأهمية.
  • تطبيقات الهاتف المحمول: إن توافقه المثبت مع iOS (CoreML) و Android (TFLite) يجعله مثاليًا للتكامل مع التطبيقات على الجهاز.
  • النماذج الأولية السريعة: يتيح الحجم الهائل من البرامج التعليمية والوثائق للمطورين الانتقال من المفهوم إلى إثبات المفهوم في غضون ساعات.

متى تختار YOLOv10

يعتبر YOLOv10 ممتازًا للسيناريوهات التي تتطلب أعلى نسبة دقة إلى كفاءة.

  • الروبوتات عالية السرعة: تقلل بنية NMS-free من تباين زمن الوصول، وهو أمر بالغ الأهمية لحلقات التحكم في الروبوتات المستقلة.
  • البحث الأكاديمي: سيجد الباحثون الذين يتطلعون إلى القياس المعياري مقابل أحدث نماذج الكشف الشاملة، أن بنية YOLOv10 جديدة وفعالة.
  • المراقبة عن بعد: إن mAP العالي مع عدد قليل من المعلمات يناسب أنظمة الأمان التي تعمل على نطاق ترددي أو تخزين محدود.

التدريب وسهولة الاستخدام

تعطي Ultralytics الأولوية لتجربة مطور مبسطة. سواء كنت تستخدم مستودع YOLOv5 الكلاسيكي أو الحديث ultralytics للحزمة للنماذج الأحدث، العملية بديهية.

استخدام YOLOv5

من السهل تحميل YOLOv5 بشكل مشهور عبر PyTorch Hub للاستدلال الفوري.

import torch

# Load YOLOv5s from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image
img = "https://ultralytics.com/images/zidane.jpg"
results = model(img)

# Display results
results.show()

استخدام YOLOv10

يمكن دمج YOLOv10 باستخدام ultralytics حزمة Python، مستفيدة من نفس واجهة برمجة التطبيقات (API) القوية.

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Train the model on COCO data
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
model.predict("https://ultralytics.com/images/bus.jpg", save=True)

الخلاصة

تمثل كلتا البنيتين علامات بارزة في رؤية الكمبيوتر. يظل YOLOv5 هو حصان العمل الموثوق به في الصناعة - قوي ومتعدد الاستخدامات ومدعوم بنظام بيئي ضخم. إنه الخيار الآمن و"الأساسي" لتلبية احتياجات النشر المتنوعة. يدفع YOLOv10 حدود الكفاءة بتصميمه الخالي من NMS، مما يوفر ترقية مقنعة للمستخدمين الذين يركزون تحديدًا على مهام detect الذين يحتاجون إلى زيادة الدقة إلى أقصى حد على الأجهزة المقيدة.

بالنسبة للمطورين الباحثين عن الأفضل على الإطلاق في كلا المجالين—الجمع بين نضج النظام البيئي لـ Ultralytics والدقة والسرعة المتطورة—نوصي باستكشاف YOLO11. فهو يوحد هذه التطورات في إطار عمل واحد قوي وجاهز لأي مهمة رؤية.

لاستكشاف المزيد من المقارنات، تحقق من YOLOv5 مقابل YOLOv8 أو YOLOv10 مقابل YOLO11.


تعليقات