مقارنة فنية تفصيلية بين YOLOv6-3.0 و PP-YOLOE+
يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية، حيث يوازن بين الدقة والسرعة والتكلفة الحسابية لأي مشروع رؤية حاسوبية. تقدم هذه الصفحة مقارنة فنية شاملة بين نموذجين قويين: YOLOv6-3.0، المصمم للتطبيقات الصناعية، و PP-YOLOE+، وهو نموذج متعدد الاستخدامات من نظام PaddlePaddle البيئي. سنقوم بتحليل بنيتيهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدة المطورين على اتخاذ خيار مستنير.
YOLOv6-3.0: مصمم للسرعة الصناعية
تم تطوير YOLOv6-3.0 بواسطة باحثين في Meituan وتم إصداره في أوائل عام 2023. وقد تم تصميمه خصيصًا للتطبيقات الصناعية حيث تكون سرعة الاستدلال على رأس الأولويات دون المساس بالدقة بشكل كبير. يعتمد النموذج على معمارية YOLO السابقة مع التركيز على التصميم المدرك للأجهزة وتحسينات التدريب.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: ميتوان
- التاريخ: 2023-01-13
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- الوثائق: https://docs.ultralytics.com/models/yolov6/
البنية والميزات الرئيسية
يقدم YOLOv6-3.0 العديد من الابتكارات المعمارية التي تهدف إلى زيادة الكفاءة. يتمحور تصميمه حول Efficient Reparameterization Backbone، والذي يسمح بتحسين هيكل الشبكة بعد التدريب للحصول على استدلال أسرع. كما أنه يشتمل على Hybrid Blocks التي توازن بين قدرات استخراج الميزات والكفاءة الحسابية. يستخدم النموذج التقطير الذاتي أثناء التدريب لزيادة الأداء، وهي تقنية تساعد النماذج الأصغر على التعلم من النماذج الأكبر والأكثر قدرة.
نقاط القوة والضعف
نقاط القوة:
- سرعة استدلال استثنائية: يُعد YOLOv6 أحد أسرع كاشفات الكائنات المتاحة، وخاصةً المتغيرات الأصغر منه، مما يجعله مثاليًا للاستدلال في الوقت الفعلي.
- تصميم يراعي الأجهزة: تم تحسين النموذج ليعمل بكفاءة على مختلف منصات الأجهزة، بما في ذلك وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسوميات (GPUs).
- دعم تحديد الكمية: يوفر دعمًا قويًا لـ تحديد كمية النموذج، وهو أمر بالغ الأهمية للنشر على الأجهزة الطرفية ذات الموارد المحدودة.
نقاط الضعف:
- تنوع محدود: YOLOv6 هو في الأساس نموذج لاكتشاف الكائنات. يفتقر إلى إمكانيات المهام المتعددة الأصلية (مثل التجزئة، وتقدير الوضعية) الموجودة في أطر عمل أكثر شمولاً مثل Ultralytics YOLOv8.
- تكامل النظام البيئي: على الرغم من أنه مفتوح المصدر، إلا أن نظامه البيئي ليس واسع النطاق أو يتم صيانته بنشاط مثل منصة Ultralytics. يمكن أن يؤدي هذا إلى تقليل دعم المجتمع وتباطؤ تكامل الميزات الجديدة.
حالات الاستخدام المثالية
يتفوق YOLOv6-3.0 في السيناريوهات التي تكون فيها السرعة هي العامل الأكثر أهمية:
- الأتمتة الصناعية: مثالي لمراقبة الجودة عالية السرعة على خطوط الإنتاج، كما هو الحال في التصنيع.
- المراقبة في الوقت الفعلي: فعالة للتطبيقات مثل مراقبة حركة المرور وأنظمة الأمان التي تتطلب تحليلًا فوريًا.
- الحوسبة الطرفية: كفاءته ومتغيراته المحسّنة للأجهزة المحمولة (YOLOv6Lite) تجعله مناسبًا للنشر على أجهزة مثل NVIDIA Jetson.
تعرف على المزيد حول YOLOv6-3.0
PP-YOLOE+: تنوع بدون نقاط ارتكاز
PP-YOLOE+، الذي تم تطويره بواسطة Baidu كجزء من مجموعة PaddleDetection الخاصة بهم، هو كاشف للأجسام بدون نقاط ارتكاز تم إصداره في عام 2022. يهدف إلى توفير توازن قوي بين الدقة والكفاءة، مع التركيز على تبسيط خط أنابيب الكشف وتحسين الأداء من خلال استراتيجيات التدريب المتقدمة.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- الوثائق: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
البنية والميزات الرئيسية
يكمن الابتكار الأساسي في PP-YOLOE+ في تصميمه الخالي من المرساة، والذي يلغي الحاجة إلى مربعات الارتساء المحددة مسبقًا ويبسط رأس النموذج. هذا يقلل من المعلمات الفائقة ويمكن أن يحسن التعميم. تتميز البنية بـ CSPRepResNet backbone، وشبكة هرم الميزات لتجميع المسارات (PAFPN) لدمج الميزات الفعال، ورأس منفصل للتصنيف والتوطين. كما أنه يستخدم Task Alignment Learning (TAL)، وهي دالة خسارة متخصصة تعمل على محاذاة المهام الفرعية بشكل أفضل.
نقاط القوة والضعف
نقاط القوة:
- توازن قوي بين الدقة والسرعة: تقدم نماذج PP-YOLOE+ دقة تنافسية عبر أحجام مختلفة، وغالبًا ما تحقق درجات mAP عالية مع الحفاظ على سرعات استدلال معقولة.
- بساطة بدون مرساة: يبسط التصميم عملية التدريب ويزيل التعقيد المرتبط بضبط مربعات الإرساء.
- نظام PaddlePaddle البيئي: إنه مدمج بعمق في إطار عمل PaddlePaddle، مما يوفر تجربة سلسة للمطورين الذين يستخدمون هذا النظام البيئي بالفعل.
نقاط الضعف:
- الاعتماد على إطار عمل: يمكن أن يؤدي تحسينه الأساسي لـ PaddlePaddle إلى خلق حاجز للمستخدمين الذين يعملون مع أطر عمل أكثر شيوعًا مثل PyTorch. قد يكون نقل النماذج والاستفادة من أدوات المجتمع أكثر صعوبة.
- المجتمع والدعم: قد يكون المجتمع والموارد المتاحة أقل شمولاً مقارنة بالنماذج الشائعة عالميًا داخل نظام Ultralytics البيئي، مما قد يؤدي إلى إبطاء التطوير واستكشاف الأخطاء وإصلاحها.
حالات الاستخدام المثالية
PP-YOLOE+ هو كاشف قوي للأغراض العامة ومناسب لمجموعة واسعة من التطبيقات:
- فحص الجودة الصناعية: دقته العالية قيمة للكشف عن العيوب الطفيفة في المنتجات.
- البيع بالتجزئة الذكي: يمكن استخدامه لتطبيقات مثل إدارة المخزون ومراقبة الرفوف.
- أتمتة إعادة التدوير: فعالة في تحديد المواد المختلفة لـ أنظمة الفرز الآلية.
مقارنة الأداء: YOLOv6-3.0 مقابل PP-YOLOE+
يكشف أداء YOLOv6-3.0 و PP-YOLOE+ على مجموعة بيانات COCO عن فلسفات التصميم المتميزة الخاصة بهما.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
ملاحظة: يمكن أن تختلف معايير السرعة بناءً على الأجهزة والبرامج (TensorRT، ONNX، OpenVINO) وحجم الدفعة والتكوينات المحددة. يتم الإبلاغ عن قيم mAP على مجموعة بيانات COCO val.
من الجدول، تعطي YOLOv6-3.0 الأولوية بوضوح للسرعة والكفاءة. يحقق نموذج YOLOv6-3.0n أسرع وقت استدلال مع أقل عدد من المعلمات وعمليات الفلوبس (FLOPs)، مما يجعله خيارًا متميزًا للتطبيقات عالية الإنتاجية. في المقابل، تُظهر PP-YOLOE+ تركيزًا قويًا على الدقة، حيث يصل نموذج PP-YOLOE+x إلى أعلى mAP يبلغ 54.7. عند مقارنة النماذج ذات الأحجام المماثلة مثل YOLOv6-3.0l و PP-YOLOE+l، فإنها تقدم أداءً متقاربًا جدًا في كل من السرعة والدقة، على الرغم من أن PP-YOLOE+l أكثر كفاءة قليلاً من حيث المعلمات وعمليات الفلوبس (FLOPs).
الخلاصة والتوصية
يعتبر كل من YOLOv6-3.0 و PP-YOLOE+ من نماذج الكشف عن الأجسام ذات القدرات العالية، لكنهما يلبيان أولويات مختلفة. YOLOv6-3.0 هو الخيار الأمثل للتطبيقات التي تكون فيها السرعة والكفاءة القصوى غير قابلة للتفاوض، خاصة في البيئات الصناعية. PP-YOLOE+ هو خيار ممتاز للمستخدمين الذين يحتاجون إلى نموذج كشف متوازن وعالي الدقة ومرتاحين للعمل داخل إطار عمل PaddlePaddle.
ومع ذلك، بالنسبة للمطورين والباحثين الذين يبحثون عن نموذج حديث يجمع بين الأداء العالي وسهولة الاستخدام وتعدد الاستخدامات الذي لا مثيل له، تقدم Ultralytics YOLOv8 وأحدث YOLO11 بديلاً فائقًا.
إليك سبب تميز نماذج Ultralytics:
- نظام بيئي مُدار بشكل جيد: توفر Ultralytics نظامًا بيئيًا شاملاً مع تطوير نشط ووثائق شاملة ودعم مجتمعي قوي. تعمل أدوات مثل Ultralytics HUB على تبسيط دورة حياة ML بأكملها، من التدريب إلى النشر.
- تنوع الاستخدامات: على عكس YOLOv6 و PP-YOLOE+، فإن نماذج Ultralytics هي أطر عمل متعددة المهام تدعم الكشف، والتجزئة، وتقدير الوضعية، والتصنيف، والتتبع ضمن بنية موحدة واحدة.
- سهولة الاستخدام: بفضل واجهة برمجة تطبيقات بسيطة ودروس تعليمية واضحة، فإن البدء في استخدام نماذج Ultralytics YOLO أمر مباشر، مما يقلل بشكل كبير من وقت التطوير.
- الأداء والكفاءة: تم تصميم نماذج Ultralytics لتحقيق توازن مثالي بين السرعة والدقة، وهي عالية الكفاءة من حيث استخدام الذاكرة أثناء التدريب والاستدلال.
بالنسبة لأولئك الذين يستكشفون architectures أخرى، قد يكون من المفيد أيضًا مقارنة هذه النماذج بنماذج أخرى مثل YOLOX أو RT-DETR المستندة إلى المحولات.