PP-YOLOE+ مقابل YOLOv5: مقارنة فنية مفصلة
يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يوازن بين الدقة والسرعة وسهولة التنفيذ. تقدم هذه الصفحة مقارنة فنية متعمقة بين PP-YOLOE+، وهو نموذج فعال من Baidu، و Ultralytics YOLOv5، وهو نموذج معتمد على نطاق واسع ومثبت صناعيًا. سوف نستكشف بنيتهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ خيار مستنير لمشاريع الرؤية الحاسوبية الخاصة بك.
PP-YOLOE+: دقة عالية في نظام PaddlePaddle البيئي
PP-YOLOE+ هو كاشف خالٍ من المرساة أحادي المرحلة تم تطويره بواسطة Baidu. تم إصداره في عام 2022، وهو يعتمد على نموذج PP-YOLOE مع التركيز على تحقيق توازن فائق بين الدقة والسرعة، خاصة داخل إطار التعلم العميق PaddlePaddle.
تفاصيل فنية:
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
البنية والميزات الرئيسية
يقدم PP-YOLOE+ العديد من التحسينات المعمارية لتحسين الأداء:
- تصميم بدون مربعات ارتكاز (Anchor-Free): من خلال إلغاء مربعات الارتكاز المحددة مسبقًا، يبسط PP-YOLOE+ مسار الكشف ويقلل عدد المعلمات الفائقة التي تحتاج إلى ضبط.
- عمود فقري ورقبة فعالان: يستخدم عمودًا فقريًا فعالًا مثل CSPRepResNet وشبكة تجميع المسار (PAN) لدمج الميزات بشكل فعال عبر نطاقات متعددة.
- رأس منفصل: يستخدم النموذج رأسًا منفصلاً (ET-Head) يفصل مهام التصنيف والانحدار، مما يؤدي غالبًا إلى تحسين الدقة.
- دالة فقدان متقدمة: تستخدم تعلم محاذاة المهام (TAL) وفقدان VariFocal لتحسين مواءمة نتائج التصنيف ودقة التوطين، مما يؤدي إلى عمليات كشف أكثر دقة. يمكنك استكشاف دوال فقدان أخرى في وثائق Ultralytics.
نقاط القوة والضعف
- نقاط القوة:
- إمكانية الحصول على دقة عالية، غالبًا ما تتفوق على النماذج الأخرى في متوسط الدقة (mAP) على مجموعات البيانات المعيارية.
- سرعات استدلال فعالة، خاصة عند التحسين باستخدام TensorRT على وحدات معالجة الرسومات.
- يمكن لنهج عدم وجود نقاط ارتكاز تبسيط مسار التدريب في سيناريوهات معينة.
- نقاط الضعف:
- التقيد بالنظام البيئي: مصمم ومحسن بشكل أساسي ضمن إطار عمل PaddlePaddle، الأمر الذي قد يخلق حاجزًا كبيرًا للمطورين المعتادين على PyTorch أو الأنظمة البيئية الأخرى.
- مجتمع أصغر: المجتمع والموارد المتاحة أقل شمولاً مقارنة بالنظام البيئي الواسع المحيط بنماذج Ultralytics YOLO.
- التعقيد: يمكن أن يكون التكامل في مهام سير العمل غير PaddlePaddle معقدًا ويستغرق وقتًا طويلاً.
حالات الاستخدام
PP-YOLOE+ هو خيار قوي للتطبيقات التي يكون فيها تحقيق أعلى دقة ممكنة أولوية، خاصة للفرق التي تعمل بالفعل داخل نظام PaddlePaddle البيئي.
- فحص الجودة الصناعية: دقتها العالية مفيدة لاكتشاف العيوب الطفيفة في التصنيع.
- البيع بالتجزئة الذكي: يمكن استخدامه في إدارة المخزون الدقيقة وتحليلات العملاء.
- الأبحاث: نموذج قيّم للباحثين الذين يستكشفون التصميمات المعمارية الخالية من المرساة ووظائف الخسارة المتقدمة.
Ultralytics YOLOv5: معيار الصناعة المعمول به
سرعان ما أصبح Ultralytics YOLOv5، الذي أطلقه Glenn Jocher في عام 2020، معيارًا صناعيًا نظرًا لمزيجه الاستثنائي من السرعة والدقة وسهولة الاستخدام للمطورين. تم إنشاؤه في PyTorch، وهو مشهور بعملية التدريب والنشر المباشرة، مما يجعله في متناول المبتدئين والخبراء على حد سواء.
تفاصيل فنية:
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- المستندات: https://docs.ultralytics.com/models/yolov5/
البنية والميزات الرئيسية
تم تحسين هيكل YOLOv5 بشكل كبير لتحقيق الكفاءة والأداء:
- Backbone: يستخدم CSPDarknet53 backbone، الذي يوازن بشكل فعال بين الحمل الحسابي وقدرات استخلاص الميزات.
- الرقبة: تعمل أداة تجميع ميزات PANet على تحسين قدرة النموذج على اكتشاف الكائنات بمقاييس مختلفة.
- الرأس: يستخدم رأس كشف قائم على المرساة، وهو قوي وثبتت فعاليته في نطاق واسع من مهام الكشف عن الكائنات.
- قابلية التوسع: يتوفر YOLOv5 بأحجام مختلفة (n, s, m, l, x)، مما يسمح للمطورين باختيار المفاضلة المثالية بين السرعة والدقة لتلبية احتياجاتهم الخاصة، بدءًا من الأجهزة الطرفية خفيفة الوزن وحتى الخوادم السحابية القوية.
نقاط القوة والضعف
- نقاط القوة:
- سهولة الاستخدام: تشتهر YOLOv5 بتجربة المستخدم المبسطة، مع واجهة برمجة تطبيقات Python بسيطة و CLI سهلة الاستخدام ووثائق شاملة.
- نظام بيئي مُدار بشكل جيد: مدعوم من قبل النظام البيئي الشامل لـ Ultralytics، والذي يتضمن التطوير النشط، ومجتمع كبير ومفيد، وتحديثات متكررة، وأدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
- موازنة الأداء: يوفر توازنًا رائعًا بين سرعة الاستدلال والدقة، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي.
- كفاءة التدريب: يتميز YOLOv5 بعملية تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة، مما يتيح تقاربًا أسرع ويقلل من وقت التطوير.
- تنوع الاستخدامات: بالإضافة إلى اكتشاف الكائنات، يدعم YOLOv5 أيضًا تقسيم الحالات وتصنيف الصور، مما يوفر حلاً مرنًا لمهام الرؤية المتعددة.
- نقاط الضعف:
- في حين أنها عالية الدقة، قد تحقق أكبر نماذج PP-YOLOE+ درجة mAP أعلى قليلاً في بعض المعايير القياسية.
- قد يتطلب نهجها القائم على المرساة بعض الضبط لمجموعات البيانات ذات نسب العرض إلى الارتفاع غير التقليدية للكائنات.
حالات الاستخدام
إن سرعة وكفاءة وسهولة نشر YOLOv5 تجعله الخيار الأفضل لمجموعة واسعة من التطبيقات:
- تحليلات الفيديو في الوقت الفعلي: مثالية للأنظمة الأمنية، ومراقبة حركة المرور، والمراقبة.
- النشر على الحافة: النماذج الأصغر (YOLOv5n، YOLOv5s) مُحسَّنة للغاية للأجهزة ذات الموارد المحدودة مثل Raspberry Pi و NVIDIA Jetson.
- الأتمتة الصناعية: تستخدم على نطاق واسع في مراقبة الجودة، واكتشاف العيوب، و الروبوتات في البيئات الآلية.
تحليل الأداء: PP-YOLOE+ مقابل YOLOv5
يسلط أداء PP-YOLOE+ و YOLOv5 الضوء على فلسفات التصميم المختلفة الخاصة بهما. تحقق نماذج PP-YOLOE+ بشكل عام درجات mAP أعلى، مما يدل على قوتها في الدقة. على سبيل المثال، تصل PP-YOLOE+l إلى 52.9 mAP، متجاوزة 49.0 mAP لـ YOLOv5l. ومع ذلك، تأتي هذه الدقة على حساب.
من ناحية أخرى، يعتبر YOLOv5 رائدًا واضحًا في سرعة وكفاءة الاستدلال. نماذجه الأصغر سريعة بشكل استثنائي، مما يجعلها مثالية للتطبيقات في الوقت الفعلي على كل من CPU و GPU. يوضح الجدول أدناه أنه في حين أن PP-YOLOE+ سريع جدًا على GPU مع TensorRT، فإن YOLOv5 يوفر حلاً أكثر سهولة وغالبًا ما يكون أسرع، خاصة للمطورين الذين يحتاجون إلى النشر على مجموعة متنوعة من الأجهزة دون تحسين مكثف.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
الخلاصة: أي نموذج يجب أن تختاره؟
يعتمد الاختيار بين PP-YOLOE+ و YOLOv5 بشكل كبير على أولويات مشروعك ومجموعة التقنيات الحالية.
-
PP-YOLOE+ هو خيار ممتاز إذا كان هدفك الأساسي هو زيادة دقة الكشف إلى أقصى حد وكنت تعمل بالفعل داخل نظام Baidu PaddlePaddle البيئي أو كنت على استعداد لتبنيه. يدفع تصميمه الحديث الخالي من المراسي ووظائف الخسارة المتقدمة حدود الأداء.
-
Ultralytics YOLOv5 هو الخيار الموصى به للغالبية العظمى من المطورين والتطبيقات. إن سهولة الاستخدام التي لا تضاهى، و توازن الأداء الاستثنائي، و مرونة النشر المذهلة تجعله حلاً أكثر عملية وكفاءة. يوفر النظام البيئي Ultralytics القوي والذي تتم صيانته جيدًا دعمًا لا مثيل له، من التدريب إلى الإنتاج، مما يضمن دورة تطوير أكثر سلاسة وأسرع. بالنسبة للمشاريع التي تتطلب سرعة في الوقت الفعلي، وتنفيذًا مباشرًا، ودعمًا مجتمعيًا قويًا، يظل YOLOv5 هو الخيار الأفضل.
استكشف نماذج أخرى
في حين أن YOLOv5 هو نموذج قوي وناضج، إلا أن Ultralytics تواصل الابتكار. بالنسبة لأولئك الذين يبحثون عن أحدث التطورات، ضع في اعتبارك استكشاف نماذج أحدث مثل YOLOv8 و YOLOv10 و YOLO11 المتطور. تعتمد هذه النماذج على نقاط قوة YOLOv5، مما يوفر أداءً أفضل وميزات أكثر. لمزيد من التحليلات التفصيلية، قم بزيارة صفحة مقارنة النماذج الخاصة بـ Ultralytics.