EfficientDet ضد PP-YOLOE+: مقارنة فنية
يعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية يوازن بين الدقة وسرعة الاستدلال والتكلفة الحسابية. توفر هذه الصفحة مقارنة فنية مفصلة بين EfficientDet و PP-YOLOE+، وهما نموذجان مؤثران للغاية تم تطويرهما بواسطة Google و Baidu، على التوالي. سوف نستكشف فلسفاتهم المعمارية ومعايير الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لمشروعك.
EfficientDet: قابلية التوسع والكفاءة
EfficientDet، الذي قدمه فريق Google Brain، هي عائلة من نماذج الكشف عن الكائنات المصممة لتحقيق كفاءة استثنائية في المعلمات والحساب. وهو يحقق ذلك عن طريق توسيع نطاق عمق النموذج وعرضه ودقته بشكل منهجي باستخدام طريقة توسيع نطاق مركبة جديدة.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- المستندات: https://github.com/google/automl/tree/master/efficientdet#readme
البنية والميزات الرئيسية
تعتمد بنية EfficientDet على ثلاثة ابتكارات أساسية:
- EfficientNet Backbone: تستخدم EfficientNet عالية الكفاءة كعمود فقري لها لاستخراج الميزات، والتي تم تطويرها أيضًا باستخدام نهج توسيع نطاق مركب.
- BiFPN (شبكة الهرم المميز ثنائية الاتجاه): لدمج الميزات، يقدم EfficientDet شبكة BiFPN، وهي شبكة هرم مميز ثنائية الاتجاه مرجحة تتيح دمج الميزات متعددة المقاييس ببساطة وسرعة. وهي تتعلم أهمية ميزات الإدخال المختلفة وتطبق اتصالات من أعلى إلى أسفل ومن أسفل إلى أعلى بشكل أكثر فعالية من شبكات FPN التقليدية.
- التحجيم المركب: أحد المبادئ الأساسية في EfficientDet هو طريقة التحجيم المركب الخاصة به، والتي تعمل على توسيع نطاق العمود الفقري و BiFPN ودقة رأس الاكتشاف وعمقه وعرضه بشكل موحد. وهذا يضمن تخصيصًا متوازنًا للموارد عبر النموذج بأكمله، مما يؤدي إلى مكاسب كبيرة في الكفاءة.
نقاط القوة والضعف
-
نقاط القوة:
- كفاءة عالية في استخدام البارامترات: يقدم دقة قوية مع عدد أقل بكثير من البارامترات وعمليات الفلوبس (FLOPs) مقارنة بالعديد من البنى الأخرى.
- قابلية التوسع: توفر عائلة النماذج (D0 إلى D7) طريقة واضحة وفعالة لتوسيع النموذج أو تقليصه بناءً على قيود الموارد، بدءًا من الأجهزة المحمولة ووصولاً إلى الخوادم السحابية واسعة النطاق.
- دقة قوية: تحقق درجات mAP تنافسية، خاصة عند النظر إلى حجمها الحسابي الصغير.
-
نقاط الضعف:
- سرعة الاستدلال: على الرغم من كفاءتها الحاسوبية، إلا أن زمن انتقال الاستدلال الخام الخاص بها يمكن أن يكون أعلى من النماذج المحسّنة خصيصًا للأداء في الوقت الفعلي، مثل سلسلة Ultralytics YOLO.
- الاعتماد على إطار عمل: التنفيذ الأصلي والدعم الأساسي مخصصان لـ TensorFlow، الأمر الذي قد يتطلب جهدًا إضافيًا للمطورين الذين يعملون داخل نظام PyTorch البيئي.
حالات الاستخدام
EfficientDet هو خيار ممتاز للتطبيقات التي تكون فيها الموارد الحسابية وحجم النموذج من القيود الأساسية. إنه يتفوق في سيناريوهات مثل:
- Edge AI: النشر على الأجهزة ذات الموارد المحدودة مثل الهواتف الذكية أو الأنظمة المدمجة.
- تطبيقات السحابة: نشر فعال من حيث التكلفة في البيئات السحابية حيث يكون تقليل النفقات الحسابية أمرًا بالغ الأهمية.
- الرؤية المحمولة: تشغيل ميزات رؤية الكمبيوتر على الجهاز في تطبيقات الهواتف المحمولة.
تعرف على المزيد حول EfficientDet
PP-YOLOE+: مُحسَّن للدقة والسرعة
PP-YOLOE+، الذي تم تطويره بواسطة Baidu، هو كاشف للأجسام عالي الأداء ومرحلة واحدة من مجموعة PaddleDetection. وهو يركز على تحقيق توازن مثالي بين الدقة والسرعة، بالاعتماد على بنية YOLO مع العديد من التحسينات الرئيسية.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
البنية والميزات الرئيسية
PP-YOLOE+ هو كاشف خالٍ من المرساة، مما يبسط مسار الاكتشاف عن طريق إزالة الحاجة إلى مربعات مرساة محددة مسبقًا. تشمل ميزاته الرئيسية ما يلي:
- رأس مُحاذى للمهام بكفاءة: يستخدم رأسًا منفصلًا لمهام التصنيف والتوطين ويستخدم Task Alignment Learning (TAL) لمحاذاتها، مما يحسن دقة الكشف.
- هيكل أساسي ورقبة محسّنة: يشتمل النموذج على هيكل أساسي مُحسَّن وشبكة تجميع المسار (PAN) لدمج الميزات بشكل فعال عبر نطاقات متعددة.
- نظام PaddlePaddle البيئي: إنه مدمج بعمق داخل إطار عمل التعلم العميق PaddlePaddle، ويستفيد من التحسينات المتاحة في هذا النظام البيئي.
نقاط القوة والضعف
-
نقاط القوة:
- توازن ممتاز بين السرعة والدقة: يقدم درجات mAP عالية مع الحفاظ على سرعات استدلال سريعة جدًا، خاصة على وحدات معالجة الرسومات (GPUs) مع تحسين TensorRT.
- تصميم بدون مربعات ارتكاز (Anchor-Free): يبسط هيكل النموذج ويقلل عدد المعلمات الفائقة التي تحتاج إلى ضبط.
- أداء قوي: غالبًا ما يتفوق على النماذج الأخرى في كل من السرعة والدقة لحجمه.
-
نقاط الضعف:
- التقيد بالنظام البيئي: يتمثل التحسين والدعم الأساسي له في إطار عمل PaddlePaddle، الأمر الذي قد يشكل تحديًا للمستخدمين خارج هذا النظام البيئي.
- المجتمع والموارد: قد يكون لديه مجتمع عالمي أصغر وعدد أقل من موارد الطرف الثالث مقارنة بالنماذج الأكثر اعتمادًا على نطاق واسع مثل تلك الخاصة بـ Ultralytics.
حالات الاستخدام
يُعد PP-YOLOE+ مناسبًا تمامًا للتطبيقات التي تتطلب دقة عالية وأداءً سريعًا وفي الوقت الفعلي.
- الأتمتة الصناعية: لمهام مثل مراقبة الجودة في التصنيع واكتشاف العيوب.
- البيع بالتجزئة الذكي: تشغيل تطبيقات مثل الذكاء الاصطناعي لإدارة المخزون وتحليلات العملاء.
- أتمتة إعادة التدوير: تحسين كفاءة إعادة التدوير عن طريق تحديد المواد للفرز الآلي.
وجهاً لوجه: الأداء والتدريب
عند مقارنة النموذجين، تتضح فلسفات التصميم المختلفة لكل منهما. يعطي EfficientDet الأولوية لكفاءة المعلمات، بينما يركز PP-YOLOE+ على تحقيق أفضل توازن بين السرعة والدقة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT (مللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
من الجدول، يمكننا أن نرى أن نماذج PP-YOLOE+ تحقق باستمرار سرعات استدلال أسرع على وحدة معالجة الرسوميات (GPU) (T4 TensorRT) وغالبًا ما تحقق درجات mAP أعلى من نماذج EfficientDet ذات الأحجام المماثلة أو حتى الأكبر. على سبيل المثال، تحقق PP-YOLOE+l معدل 52.9 mAP عند 8.36 مللي ثانية، متفوقة على EfficientDet-d6، التي لديها عدد مماثل من المعلمات ولكن وقت استدلال أبطأ بكثير ودقة أقل قليلاً.
ميزة Ultralytics: لماذا تبرز نماذج YOLO؟
في حين أن كلاً من EfficientDet و PP-YOLOE+ هما نموذجان قويان، غالبًا ما يجد المطورون الذين يبحثون عن إطار عمل حديث ومتعدد الاستخدامات وسهل الاستخدام خيارًا أكثر إقناعًا في نماذج Ultralytics YOLO مثل YOLOv8 وأحدث Ultralytics YOLO11.
- سهولة الاستخدام: تم تصميم نماذج Ultralytics لتجربة مستخدم مبسطة، وتتميز بواجهة برمجة تطبيقات Python بسيطة و توثيق شامل و أوامر CLI مباشرة تعمل على تبسيط التدريب والتحقق والنشر.
- نظام بيئي مُدار بشكل جيد: يستفيد نظام Ultralytics البيئي من التطوير النشط ومجتمع قوي مفتوح المصدر وتحديثات متكررة وتكامل سلس مع أدوات مثل Ultralytics HUB لـ MLOps شامل.
- موازنة الأداء: تشتهر نماذج Ultralytics بتحقيقها توازنًا ممتازًا بين السرعة والدقة، مما يجعلها مناسبة لمجموعة واسعة من السيناريوهات الواقعية، بدءًا من الأجهزة الطرفية وصولًا إلى الخوادم السحابية.
- كفاءة الذاكرة: تم تصميم نماذج Ultralytics YOLO لتحقيق كفاءة في استخدام الذاكرة أثناء التدريب والاستدلال، وغالبًا ما تتطلب ذاكرة CUDA أقل من البنى الأخرى. وهذا يجعلها في متناول المستخدمين ذوي الموارد المحدودة للأجهزة.
- تنوع الاستخدامات: على عكس التركيز أحادي المهمة لـ EfficientDet و PP-YOLOE+، فإن نماذج مثل YOLO11 متعددة المهام، وتدعم الكشف عن الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، والكشف عن الكائنات الموجهة (OBB) ضمن إطار عمل موحد واحد.
- كفاءة التدريب: يستفيد المستخدمون من عمليات التدريب الفعالة، والأوزان المُدرَّبة مسبقًا المتاحة بسهولة على مجموعات البيانات مثل COCO، وأوقات التقارب الأسرع.
الخلاصة
تتفوق EfficientDet في التطبيقات التي تكون فيها كفاءة المعلمات و FLOP هي الأولويات القصوى، مما يوفر مجموعة قابلة للتطوير من النماذج المناسبة للبيئات محدودة الموارد. يوفر PP-YOLOE+ مزيجًا قويًا من الدقة العالية والسرعة في الوقت الفعلي، خاصةً للمستخدمين المستثمرين في نظام PaddlePaddle البيئي.
ومع ذلك، بالنسبة لمعظم المطورين والباحثين اليوم، تقدم نماذج Ultralytics مثل YOLOv10 و YOLO11 خيارًا فائقًا. إنها توفر توازنًا حديثًا في الأداء ونظامًا بيئيًا سهل الاستخدام ويتم صيانته جيدًا وتنوعًا لا مثيل له عبر مهام رؤية الكمبيوتر المتعددة، مما يجعلها الحل الأمثل لمجموعة واسعة من التطبيقات من البحث إلى الإنتاج.
مقارنات النماذج الأخرى
للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات التي تتضمن EfficientDet و PP-YOLOE+ ونماذج أخرى ذات صلة:
- EfficientDet ضد YOLOv8
- PP-YOLOE+ مقابل YOLOv10
- YOLO11 ضد EfficientDet
- YOLO11 ضد PP-YOLOE+
- RT-DETR مقابل EfficientDet