Link to this sectionPP-YOLOE+ مقابل EfficientDet#
يعد اختيار البنية الصحيحة خطوة حاسمة في بناء تطبيقات رؤية حاسوبية قوية. يستعرض هذا الدليل التقني المفاضلات بين نموذجين معروفين في مجال اكتشاف الأجسام: PP-YOLOE+ و EfficientDet. سنقوم بتفكيك بنيتهما، وتحليل مقاييس الأداء، واستكشاف سيناريوهات النشر المثالية لكل منهما.
على الرغم من أن كلا النموذجين قدما مساهمات كبيرة في هذا المجال، سنناقش أيضًا كيف توفر البدائل الحديثة مثل Ultralytics YOLO26 كفاءة ذاكرة متفوقة بشكل كبير، واستنتاجًا أسرع، وتجربة مطور مبسطة للغاية.
Link to this sectionنظرة عامة على البنية: PP-YOLOE+#
يعد PP-YOLOE+ نسخة مطورة من نموذج PP-YOLO الأصلي، وقد تم بناؤه خصيصًا لتحسين الأداء على وحدات معالجة الرسومات (GPUs) في جانب الخادم ضمن نظام PaddlePaddle البيئي. يقدم النموذج العديد من التحسينات على البنية الأساسية، مع التركيز على نموذج خالٍ من المراسيات (anchor-free).
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- التوثيق: PaddleDetection README
يتميز PP-YOLOE+ بهيكل فقري CSPRepResNet، ورأس موجه للمهام بكفاءة (ET-head)، ويعتمد بشكل كبير على varifocal loss للتصنيف إلى جانب distribution focal loss لانحدار مربعات الإحاطة. ساعد انتقاله إلى تصميم كاشف خالٍ من المراسيات في تبسيط خط أنابيب المعالجة اللاحقة، مما جعله منافسًا قويًا في وقت إصداره.
غالبًا ما يجد المطورون المستثمرون بعمق في إطار عمل PaddlePaddle من Baidu أن PP-YOLOE+ أسهل في الاعتماد لمهام مثل تجزئة الأجسام، على الرغم من أنه يفتقر إلى الدعم الواسع متعدد الأطر الموجود في الأدوات الأحدث.
Link to this sectionنظرة عامة على البنية: EfficientDet#
يتبنى EfficientDet نهجًا مختلفًا جذريًا في اكتشاف الأجسام، حيث يعتمد بشكل كبير على البحث في البنية العصبية ومبادئ القياس المركب.
- المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
- المنظمة: Google
- التاريخ: 2019-11-20
- Arxiv: 1911.09070
- التوثيق: Brain AutoML README
حجر الزاوية في EfficientDet هو شبكة الهرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، يسمح BiFPN بدمج ميزات متعددة المقاييس بسهولة وسرعة عن طريق إدخال أوزان قابلة للتعلم لمعرفة أهمية ميزات الإدخال المختلفة. إلى جانب هيكل Backbone من نوع EfficientNet، يقوم EfficientDet بتوسيع عرض الشبكة وعمقها ودقتها بشكل منهجي ومتزامن.
على الرغم من كفاءة EfficientDet نظريًا من حيث عمليات الفاصلة العائمة (FLOPs)، إلا أن نماذجه قد تواجه أحيانًا صعوبة في ترجمة الكفاءة النظرية إلى سرعة واقعية على أجهزة الحافة بسبب أنماط الوصول إلى الذاكرة المعقدة، وهو ما يتناقض بشكل حاد مع متطلبات الذاكرة المنخفضة لنماذج YOLO.
Link to this sectionتحليل الأداء والمقاييس المعيارية#
يقارن الجدول أدناه المقاييس الرئيسية على مجموعات بيانات قياسية مثل COCO. توفر مقارنة متوسط دقة متوسط (mAP) مقابل سرعة الاستنتاج صورة واضحة لحد باريتو.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
كما هو موضح، يتوسع PP-YOLOE+ بشكل عام بشكل أفضل في mAP الخام لوحدات معالجة الرسومات عالية الأداء، بينما يحاول EfficientDet تقليل المعلمات. ومع ذلك، يتخلف كلاهما عن قدرات الوقت الفعلي الحديثة المطلوبة لـ Edge AI المتطورة.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين PP-YOLOE+ و EfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار PP-YOLOE+#
يعد PP-YOLOE+ خياراً قوياً في الحالات التالية:
- التكامل مع نظام PaddlePaddle البيئي: للمؤسسات التي لديها بنية تحتية موجودة مبنية على إطار عمل Baidu's PaddlePaddle.
- النشر على أجهزة الحافة (Paddle Lite): عند النشر على أجهزة ذات أنوية استنتاج محسّنة خصيصاً لمحرك Paddle Lite أو محرك استنتاج Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار عمل معين مصدر قلق.
Link to this sectionمتى تختار EfficientDet#
يُنصح باستخدام EfficientDet في الحالات التالية:
- خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
- النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionالبديل الحديث: Ultralytics YOLO26#
بينما يمثل PP-YOLOE+ و EfficientDet معالم تاريخية مهمة، يجب على المطورين الذين يسعون للحصول على أحدث دقة، واستهلاك أقل للذاكرة، وتجربة مستخدم مبسطة النظر إلى Ultralytics YOLO26.
يمثل YOLO26 قفزة نوعية في اكتشاف الأجسام، حيث يقدم العديد من الابتكارات الحاسمة:
- تصميم من طرف إلى طرف خالٍ من NMS: بالبناء على اختراقات YOLOv10، يلغي YOLO26 محليًا كبت غير الأقصى (NMS) أثناء الاستنتاج. يؤدي هذا إلى تقليل زمن الاستجابة بشكل ملحوظ وإزالة اختناقات المعالجة اللاحقة المعقدة.
- محسن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM)، يستخدم YOLO26 محسنًا هجينًا يجمع بين SGD و Muon. هذا يحسن بشكل كبير من استقرار التدريب ويقلل من وقت التقارب.
- سرعة فائقة: يوفر YOLO26 سرعة استنتاج على المعالج (CPU) أسرع بنسبة تصل إلى 43% مقارنة بالأجيال الأقدم مثل YOLO11، مما يجعله الخيار الأفضل على الإطلاق للأجهزة التي تعمل بالبطارية أو التي تعتمد على المعالج فقط.
- وظائف خسارة متقدمة: يؤدي دمج ProgLoss وSTAL إلى تحسين التعرف على الأشياء الصغيرة بشكل كبير، وهو أمر ضروري لمهام مثل تحليلات الطائرات بدون طيار والروبوتات.
على عكس EfficientDet الذي يركز فقط على الاكتشاف، يتعامل YOLO26 محليًا مع تقدير الوضعية، و تصنيف الصور، و صناديق الإحاطة الموجهة (OBB)، كل ذلك ضمن نفس النظام البيئي المدار جيدًا.
Link to this sectionسهولة الاستخدام وتكامل النظام البيئي#
أحد أكبر عيوب النماذج القديمة مثل EfficientDet هو تعقيد خطوط أنابيب التدريب وإعدادات التعلم الآلي المؤتمت. في المقابل، توفر منصة Ultralytics تجربة مطور لا مثيل لها.
يتطلب نشر نموذج باستخدام Ultralytics بضعة أسطر فقط من التعليمات البرمجية، مما يوفر تباينًا صارخًا مع التكوينات المطولة التي تتطلبها الأطر القديمة.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)
# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")بالنسبة لأولئك الذين يستكشفون بدائل أخرى، تتوفر أيضًا بنيات مثل RT-DETR أو النموذج القديم YOLOv8 ضمن نظام Ultralytics البيئي، مما يسمح بالتبديل والاختبار بسلاسة.
Link to this sectionالخلاصة#
يظل PP-YOLOE+ خياراً قوياً لنشر خوادم معينة داخل نظام Paddle البيئي، ويستمر EfficientDet في كونه دراسة مثيرة للاهتمام في تصميم الهندسة المعمارية الآلي. ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب استنتاجاً في الوقت الفعلي، وسهولة النشر، والحد الأدنى من متطلبات الذاكرة، يوفر Ultralytics YOLO26 توازناً مقنعاً في الأداء. إن تصميمه الذي لا يعتمد على NMS وأداء CPU فائق السرعة يجعله الخيار الأمثل لضمان مستقبل البنية التحتية للذكاء الاصطناعي الخاصة بك.