تخطي إلى المحتوى

YOLOv5 مقابل PP-YOLOE+: مقارنة تقنية لاكتشاف الأجسام

يعد اختيار النموذج الأمثل لاكتشاف الأجسام قرارًا محوريًا يؤثر على كفاءة مشاريع الرؤية الحاسوبية ودقتها وقابليتها للتطوير. يقارن هذا الدليل الشامل بين Ultralytics YOLOv5وهو نموذج أسطوري يشتهر بقابليته للاستخدام وسرعته، مقابل نموذج PP-YOLOE+، وهو نموذج عالي الدقة من نظام PaddlePaddle من بايدو. من خلال تحليل بنيتيهما ومقاييس أدائهما وسير عمل النشر، نهدف إلى مساعدة المطورين والباحثين على اختيار الحل الأفضل لاحتياجاتهم الخاصة.

Ultralytics YOLOv5: معيار سهولة الاستخدام والسرعة

أحدث YOLOv5 الذي أصدرته شركة Ultralytics في عام 2020، تغييراً جذرياً في مجال الذكاء الاصطناعي للرؤية من خلال إتاحة أحدث ما توصلت إليه التكنولوجيا في مجال اكتشاف الأجسام للجميع. على عكس سابقاتها، كان أول نموذج YOLO يتم تنفيذه محليًا في PyTorchلتبسيط عملية التدريب والنشر لمجتمع علوم البيانات العالمي. وتعطي فلسفة تصميمه الأولوية لتحقيق التوازن بين سرعة الاستدلال في الوقت الحقيقي والدقة العالية، مع تجميعها في نظام بيئي سهل الاستخدام بشكل لا يصدق.

المؤلفون: جلين جوشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5yolov5
المستنداتyolov5

نقاط القوة الرئيسية

  • سهولة الاستخدام: يشتهر YOLOv5 بتجربته "الجاهزة". بفضل واجهة برمجة تطبيقاتPython API المبسطة وأوامرCLI البديهية، يمكن للمطورين بدء التدريب على مجموعات البيانات المخصصة في دقائق.
  • نظام بيئي جيد الصيانة: مدعوم من Ultralytics ويتمتع بتحديثات متكررة ومجتمع ضخم ونشط. وهذا يضمن دعمًا طويل الأجل وثروة من المعرفة المشتركة على منصات مثل GitHub Issues.
  • توازن الأداء: يوفر سرعات استثنائية في الاستدلال في الوقت الحقيقي، خاصةً على الأجهزة المتطورة مثل Raspberry Pi، دون التضحية بدقة كبيرة.
  • تعدد الاستخدامات: بالإضافة إلى الاكتشاف القياسي، يدعم YOLOv5 تجزئة النماذج وتصنيف الصور، مما يجعله أداة مرنة لمهام الرؤية المتنوعة.

تعرف على المزيد حول YOLOv5

PP-YOLOE+: دقة عالية في نظام التجديف البيئي

PP-YOLOE+ هو تطوير لسلسلة YOLO التي طورها باحثون في Baidu. تم إصداره في عام 2022، وهو بمثابة نموذج رئيسي ضمن مجموعة أدوات PaddleDetection. وهو يعتمد على بنية خالية من الارتكاز واستراتيجيات تدريب متقدمة لتخطي حدود الدقة على مجموعات البيانات المعيارية مثل COCO.

المؤلفون: PaddlePaddle المؤلفون
المنظمة:بايدو
التاريخ: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:PaddlePaddle
المستندات:PaddlePaddle

البنية والميزات

يستخدم PP-YOLOE+ العمود الفقري لشبكة CSPRepResNet ورأس كشف فريد خالٍ من النماذج الأولية. نظرًا لكونه كاشفًا خاليًا من النماذج الأولية، فإنه يقلل من تعقيد ضبط المعلمة الفائقة المتعلقة بمربعات الارتكاز. وهو يتفوق في السيناريوهات التي يكون فيها تعظيم متوسط الدقة المتوسطة (mAP) هو الهدف الأساسي، وغالبًا ما يحقق درجات أعلى قليلاً من النماذج المماثلة القائمة على المرساة على حساب زيادة التعقيد الحسابي. ومع ذلك، فإن اعتمادها على إطار عمل PaddlePaddle يمكن أن يمثل منحنى تعليمي للفرق التي تعتمد على PyTorch أو TensorFlow.

تعرف على المزيد حول PP-YOLOE+

تحليل الأداء: المقاييس والكفاءة

عند المقارنة بين YOLOv5 وPP-YOLOE+، عادةً ما تكمن المفاضلة بين الدقة الأولية والكفاءة التشغيلية (السرعة وسهولة النشر).

السرعة مقابل الدقة

تنشر نماذج PP-YOLOE+ بشكل عام نسبة أعلى mAP أعلىالتحقق درجات على مجموعة بيانات COCO مما يدل على قوتها في القدرة على الاكتشاف الخالص. على سبيل المثال، فإن PP-YOLOE+l يحقق سرعة 52.9 mAP رائعة. ومع ذلك، يأتي ذلك غالبًا مع زمن انتقال أعلى على الأجهزة القياسية مقارنةً بـ YOLOv5.

يتألق Ultralytics YOLOv5 في سرعة الاستدلال. إن YOLOv5n نموذج (Nano) خفيف الوزن بشكل لا يصدق، حيث يحقق 28.0 mAP مع زمن استدلال سريع للغاية يبلغ 1.12 مللي ثانية على GPU T4 باستخدام TensorRT. وهذا يجعل من YOLOv5 الخيار الأفضل لـ تطبيقات الذكاء الاصطناعي المتطورة حيث يكون التأخير بالمللي ثانية أمرًا بالغ الأهمية.

الكفاءة الحسابية

تم تصميم نماذج YOLOv5 مع وضع قيود الذاكرة في الاعتبار. فهي عادةً ما تتطلب ذاكرة CUDA أقل أثناء التدريب والاستدلال مقارنةً بالبنى المعقدة الخالية من الارتكاز أو النماذج القائمة على المحولات. تسهّل هذه الكفاءة النشر الأكثر سلاسة على الأجهزة ذات الموارد المحدودة، مثل وحدات NVIDIA Jetson، دون بذل جهود تحسين واسعة النطاق.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

النظام البيئي للتدريب وسهولة الاستخدام

غالبًا ما تحدد المقاييس "الناعمة" لتجربة المطورين نجاح المشروع. وهنا يكون الفرق بين النموذجين أكثر وضوحاً.

نظام Ultralytics البيئي

يستفيد YOLOv5 من نظامUltralytics البيئي المتكامل، الذي يعمل على تبسيط خط أنابيب عمليات التشغيل الآلي بالكامل.

  • PyTorch Native: كونه مبني على PyTorch يضمن التوافق مع الغالبية العظمى من الأدوات والمكتبات مفتوحة المصدر.
  • تكامل سلس: دعم مدمج لـ Weights & Biases, Cometو ClearML يجعل تتبع التجارب أمرًا سهلاً.
  • كفاءة التدريب: تتوفر الأوزان المدربة مسبقًا بسهولة ويتم تنزيلها تلقائيًا، مما يسمح بالتعلم السريع للنقل.
  • النشر: يدعم وضع التصدير التحويل بنقرة واحدة إلى ONNX, CoreML, TFLiteوغيرها.

تبسيط سير العمل باستخدام Ultralytics HUB

يمكنك تدريب نماذج YOLOv5 ومعاينتها ونشرها دون كتابة سطر واحد من التعليمات البرمجية باستخدام Ultralytics HUB. تدير هذه المنصة المستندة إلى الويب مجموعات البيانات الخاصة بك وعمليات التدريب، مما يجعل الذكاء الاصطناعي للرؤية في متناول الفرق من جميع مستويات المهارة.

نظام PaddlePaddle البيئي

يعتمد PP-YOLOE+ على PaddlePaddle وهو إطار التعلم العميق الخاص ببايدو. على الرغم من قوته وشهرته في آسيا، إلا أن له بصمة أصغر في مجتمع البحث الغربي مقارنةً ب PyTorch. غالبًا ما يتطلب اعتماد PP-YOLOE+ إعداد بيئة منفصلة وتعلم بناء الجملة الخاص ب Paddle (paddle.io, paddle.nn). في حين أن الوثائق شامل، فإن النظام البيئي لأدوات الطرف الثالث والدعم المجتمعي أقل شمولاً من نظام YOLOv5.

مثال على الكود: بساطة YOLOv5

توضّح شيفرة Python التالية مدى سهولة تحميل نموذج YOLOv5 المدرّب مسبقًا وإجراء الاستدلال باستخدام PyTorch Hub.

import torch

# Load a YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image source
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to console
results.print()

# Show the image with bounding boxes
results.show()

حالات الاستخدام في العالم الحقيقي

أين يتفوق YOLOv5

  • الأتمتة الصناعية: تسمح سرعتها العالية باكتشاف العيوب في الوقت الحقيقي على خطوط التجميع سريعة الحركة.
  • الروبوتات المستقلة: تجعلها الذاكرة المنخفضة مثالية للروبوتات ذات الحوسبة المحدودة على متن الروبوتات، مثل تلك المستخدمة في الخدمات اللوجستية.
  • تطبيقات المدن الذكية: يتيح الأداء الفعال CPU إمكانية النشر على نطاق واسع لمراقبة حركة المرور على البنية التحتية الحالية.

أين يناسب PP-YOLOE+

  • الأبحاث عالية الدقة: المشاريع الأكاديمية حيث يكون الضغط على آخر 1% من mAP أكثر أهمية من سرعة الاستدلال.
  • البيئات المتمحورة حول المجذاف: بيئات المؤسسات المستثمرة بالفعل بكثافة في البنية التحتية لنظام بايدو البيئي.

الخلاصة: ما هو النموذج المناسب لك؟

بالنسبة للغالبية العظمى من المطورين والتطبيقات التجارية, Ultralytics YOLOv5 يظل الخيار الموصى به. سهولة الاستخدام التي لا مثيل لها، والدعم المجتمعي القوي، ومرونة النشر، تجعل منه حلاً منخفض المخاطر وعالي المردود. كما أن القدرة على النشر على أي منصة تقريبًا - من الهواتف المحمولة إلى الخوادم السحابية - بأقل قدر من الاحتكاك يمنحها ميزة حاسمة في بيئات الإنتاج.

يعد PP-YOLOE+ بديلًا قويًا للمستخدمين الذين يحتاجون على وجه التحديد إلى بنية خالية من المرساة أو أولئك الذين تم دمجهم بالفعل في سير عمل PaddlePaddle . إن دقته العالية جديرة بالثناء، لكن تجزئة النظام البيئي يمكن أن يبطئ التطوير بالنسبة لأولئك الذين اعتادوا على سير عمل PyTorch القياسي.

استكشف نماذج أخرى

رؤية الكمبيوتر تتحرك بسرعة. في حين أن المقارنة بين هذه النماذج الراسخة أمر قيّم، فإننا نشجعك على استكشاف أحدث التطورات في عائلة Ultralytics YOLO والتي تقدم أداءً وميزات أكبر.

  • YOLO11: أحدث نموذج متطور يوفر دقة وكفاءة فائقة في الكشف والتجزئة وتقدير الوضعية.
  • YOLOv8: إطار عمل موحّد شائع للغاية يدعم مهام OBB والتصنيف.
  • RT-DETR: كاشف قائم على محول مُحسَّن للأداء في الوقت الحقيقي.

للحصول على عرض أوسع، راجع صفحة مقارنة النماذج الرئيسية الخاصة بنا لقياس البنى المختلفة وفقاً لمتطلباتك الخاصة.


تعليقات