PP-YOLOE+ مقابل EfficientDet: نظرة متعمقة على بنى الكشف عن الكائنات
غالبًا ما يتطلب استكشاف نماذج الكشف عن الأشياء الاختيار بين البنى القديمة الراسخة والأطر الجديدة المحسّنة. تستكشف هذه المقارنة الفروق الفنية الدقيقة بين PP-YOLOE+، وهو كاشف محسّن خالٍ من المراسي من Baidu، و EfficientDet، وهي بنية قابلة للتطوير Google أدخلت التدرج المركب. ورغم أن كلاهما قدّم مساهمات مهمة في مجال الرؤية الحاسوبية، فإن نهجهما في الكفاءة والدقة يختلفان اختلافًا جوهريًا.
تحليل الأداء والمعايير
التوازن بين سرعة الاستدلال ودقة الكشف — الذي يُقاس غالبًا بمتوسط الدقة المتوسط (mAP)— هو المقياس الأساسي لتقييم هذه النماذج.
يوضح الجدول أدناه أن PP-YOLOE+ يوفر بشكل عام زمن انتقال أعلى على GPU بفضل تصميمه TensorRT، في حين أن EfficientDet، على الرغم من كفاءته من حيث المعلمات، غالبًا ما يعاني من زمن انتقال أعلى بسبب اتصالات هرم الميزات المعقدة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
الهندسة المعمارية وفلسفة التصميم
يكمن الاختلاف الأساسي بين هذين النموذجين في كيفية تعاملهما مع دمج الميزات والتحجيم.
EfficientDet: التحجيم المركب و BiFPN
طور فريق Google تقنية EfficientDet التي أدخلت مفهوم التوسع المركب، الذي يعمل على توسيع الدقة والعمق والعرض للشبكة بشكل موحد.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Research
- التاريخ: 2019-11-20
- Arxiv:EfficientDet: كشف الأجسام القابل للتطوير والفعال
السمة المميزة لـ EfficientDet هي BiFPN (شبكة هرمية ثنائية الاتجاه مرجحة). على عكس FPN القياسية، تسمح BiFPN بدمج السمات متعددة المستويات من أعلى إلى أسفل ومن أسفل إلى أعلى. في حين أن هذا يؤدي إلى كفاءة عالية في المعلمات ( FLOPs منخفضة)، فإن أنماط الوصول غير المنتظمة إلى الذاكرة في BiFPN يمكن أن تبطئ بشكل كبير الاستدلال على وحدات معالجة الرسومات (GPUs)، مما يجعلها أقل مثالية للتطبيقات في الوقت الفعلي على الرغم من كفاءتها النظرية.
PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز
PP-YOLOE+ هو تطور لهيكل PP-YOLOE، صممه فريق Baidu ليعمل بشكل خاص على PaddlePaddle .
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:PP-YOLOE: نسخة متطورة من YOLO
يستخدم هذا النموذج نموذجًا بدون مرساة ، مما يلغي الحاجة إلى مربعات مرساة محددة مسبقًا. ويستخدم هيكل CSPRepResStage واستراتيجية تعلم محاذاة المهام (TAL) لتحسين محاذاة التصنيف والتوطين. تقدم النسخة "+" على وجه التحديد هيكلًا مصغرًا (مضاعف العرض 0.75) واستراتيجيات تدريب محسنة، مما يجعلها أكثر تنافسية في نظام المعلمات المنخفضة.
التطور المعماري
يمثل PP-YOLOE+ تحولًا نحو بنى "معاد تحديد معلماتها" حيث يتم دمج الهياكل المعقدة لوقت التدريب في كتل أبسط لوقت الاستدلال. وهذا يتناقض مع تعقيد الرسم البياني الثابت لـ EfficientDet، مما يوفر سرعات نشر أفضل على أجهزة مثل NVIDIA TensorRT.
منهجيات التدريب والنظام البيئي
غالبًا ما يحدد اختيار الإطار سهولة التطوير.
- PP-YOLOE+ مرتبط ارتباطًا وثيقًا بـ PaddlePaddle . على الرغم من قوته، قد يواجه المستخدمون خارج هذا النظام البيئي صعوبات عند التكامل مع أدوات MLOps القياسية أو تحويل النماذج لأهداف نشر غير أصلية.
- يعتمد EfficientDet على TensorFlow (وبالتحديد مكتبة AutoML). على الرغم من الدعم الواسع الذي يحظى به، إلا أن المستودع يشهد تحديثات أقل تواتراً مقارنة YOLO الحديثة، وقد يتطلب إعادة إنتاج النتائج في بعض الأحيان التنقل بين سلاسل التبعية القديمة.
في المقابل، غالبًا ما يلجأ المطورون الذين يولون الأولوية لسهولة الاستخدام والنظام البيئي الجيد الصيانة إلى Ultralytics. يتيح Ultralytics تدريبًا سلسًا على PyTorch ويوفر تكاملًا قويًا مع أدوات مثل Weights & Biases ومسارات واضحة لنشر النماذج.
حالات الاستخدام المثالية
متى تختار EfficientDet
يظل EfficientDet خيارًا مناسبًا للبحوث الأكاديمية التي تعتمد على كفاءة المعلمات كقيود صارمة بدلاً من زمن الاستجابة. كما أنه موجود في التطبيقات المحمولة القديمة (حوالي عام 2020) حيث تم تحسين مسرعات الأجهزة المحددة لكتل من نوع MobileNet.
متى تختار PP-YOLOE+
يتميز PP-YOLOE+ في البيئات التي يكون فيها GPU أمرًا بالغ الأهمية، مثل مراقبة الجودة الصناعية أو معالجة الفيديو من جانب الخادم. ويبسط رأسه الخالي من المثبتات مساحة البحث عن المعلمات الفائقة مقارنة بالطرق القديمة القائمة على المثبتات.
متى تختار Ultralytics
بالنسبة للمطورين الذين يبحثون عن توازن في الأداء بين السرعة والدقة مع الحد الأدنى من التكاليف الهندسية، فإن Ultralytics مثل YOLO11 و YOLO26 الجديدة. توفر هذه النماذج متطلبات ذاكرة أقل أثناء التدريب مقارنة بالكاشفات القائمة على المحولات وتوفر تنوعًاواسعًا — تدعم مهام مثل تقدير الوضع والتجزئة بشكل فوري.
بالإضافة إلى ذلك، يتم تعزيز كفاءة تدريب Ultralytics من خلال الأوزان المعدة مسبقًا والمتاحة بسهولة وواجهة برمجة تطبيقات بسيطة تعمل على تجريد الكود النمطي المعقد.
from ultralytics import YOLO
# Load the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Perform inference on an image
results = model("path/to/image.jpg")
المعيار الحديث: Ultralytics
في حين أن PP-YOLOE+ و EfficientDet كانا بمثابة معالم بارزة، إلا أن هذا المجال قد تطور. تم إصدار Ultralytics في عام 2026، وهو يقدم ميزات ثورية تعالج قيود البنى السابقة.
تصميم شامل خالٍ من NMS
على عكس EfficientDet ومعظم YOLO التي تتطلب معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 هي بطبيعتها شاملة من البداية إلى النهاية. هذا التصميم، الذي تم ابتكاره لأول مرة في YOLOv10 يزيل التأخير والتعقيد المرتبطين بـ NMS مما يضمن سرعات استدلال أسرع وحتمية، وهي أمور أساسية للذكاء الاصطناعي المتطور.
مُحسّن لـ Edge و CPU
تم تصميم YOLO26 للاستخدام على نطاق واسع. ويتميز بإزالة DFL (Distribution Focal Loss)، مما يبسط الرسم البياني للنموذج لتنسيقات التصدير مثل ONNX CoreML. إلى جانب التحسينات التي توفر CPU أسرع بنسبة تصل إلى 43٪ CPU فهو الخيار الأمثل للأجهزة التي تتراوح من Raspberry Pis إلى الهواتف المحمولة.
تدريب متقدم مع MuSGD و ProgLoss
باستعارة الابتكارات من تدريب نموذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّن MuSGD— وهو مزيج من SGD Muon. وينتج عن ذلك ديناميكيات تدريب أكثر استقرارًا وتقاربًا أسرع. علاوة على ذلك، أدى إدخال ProgLoss و STAL (Soft Task Alignment Learning) إلى تحسين كبير في اكتشاف الأجسام الصغيرة، وهي نقطة ضعف شائعة في أجهزة الكشف السابقة مثل EfficientDet-d0.
خصوصية المهمة
YOLO26 ليس مخصصًا فقط للمربعات المحددة. فهو يتضمن تحسينات خاصة بالمهام مثل تقدير الاحتمالية المتبقية (RLE) لتقدير الوضع بدقة عالية وفقدان الزاوية المتخصص لمهام المربعات المحددة الموجهة (OBB) ، مما يضمن الكشف الدقيق عن الأجسام المدورة في الصور الجوية.
الخلاصة
يقدم كل من PP-YOLOE+ و EfficientDet مزايا فريدة اعتمادًا على القيود المحددة للأجهزة وتفضيلات إطار العمل. يثبت EfficientDet أن التوسع المركب هو مفهوم نظري قوي، بينما يوضح PP-YOLOE+ المزايا العملية للسرعة التي توفرها البنى غير المرتبطة بمرساة والمعاد معايرتها على وحدات معالجة الرسومات.
ومع ذلك، بالنسبة للحل الشامل الذي يجمع بين الدقة المتطورة وسهولة النشر والمجتمع المزدهر، فإن Ultralytics يبرز كخيار متميز. بفضل بنيته الشاملة NMS ودعمه الأصلي Ultralytics فإنه يمكّن المطورين من الانتقال من المفهوم إلى الإنتاج بكفاءة لا مثيل لها.
لاستكشاف خيارات أخرى عالية الأداء، يرجى مراجعة الوثائق الخاصة بـ YOLO11 أو YOLOv10.