PP-YOLOE+ مقابل EfficientDet: مقارنة تقنية شاملة
يعد اختيار البنية المناسبة خطوة حاسمة في بناء تطبيقات رؤية حاسوبية قوية. يستكشف هذا الدليل الفني المفاضلات بين نموذجين معروفين للكشف عن الكائنات: PP-YOLOE+ و EfficientDet. سنقوم بتحليل بنيتيهما، وتحليل مقاييس أدائهما، واستكشاف سيناريوهات النشر المثالية لهما.
في حين أن كلا النموذجين قد قدما مساهمات كبيرة في هذا المجال، سنناقش أيضًا كيف توفر البدائل الحديثة مثل Ultralytics كفاءة ذاكرة فائقة، واستنتاجًا أسرع، وتجربة مطور مبسطة للغاية.
نظرة عامة على الهندسة المعمارية: PP-YOLOE+
PP-YOLOE+ هو نسخة مطورة منYOLO الأصلي، تم تصميمه خصيصًا لتحسين الأداء على وحدات معالجة الرسومات (GPU) من جانب الخادم داخل PaddlePaddle . ويقدم العديد من التحسينات على البنية الأساسية، مع التركيز على نموذج بدون مرساة.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:2203.16250
- الوثائق:ملف PaddleDetection README
يتميز PP-YOLOE+ بوجود عمود فقري CSPRepResNet، ورأس متوافق مع المهام الفعالة (ET-head)، ويعتمد بشكل كبير على الخسارة متغيرة البؤرة للتصنيف إلى جانب الخسارة البؤرية التوزيعية لانحدار مربع الحدود. ساعد انتقاله إلى تصميم كاشف خالٍ من المراسي على تبسيط خط أنابيب المعالجة اللاحقة، مما جعله شديد التنافسية في وقت إصداره.
فوائد التكامل
غالبًا ما تجد الفرق التي استثمرت بالفعل بشكل كبير في PaddlePaddle من Baidu أن PP-YOLOE+ أسهل في الاستخدام لمهام مثل تقسيم المثيلات، على الرغم من أنه يفتقر إلى الدعم الواسع النطاق لأطر العمل المتعددة الذي نراه في الأدوات الأحدث.
نظرة عامة على الهندسة المعمارية: EfficientDet
يتبع EfficientDet نهجًا مختلفًا تمامًا في اكتشاف الكائنات، حيث يعتمد بشكل كبير على البحث في البنية العصبية ومبادئ القياس المركب.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google
- التاريخ: 2019-11-20
- Arxiv:1911.09070
- المستندات:Brain AutoML README
تعرف على المزيد حول EfficientDet
حجر الأساس في EfficientDet هو شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تسمح شبكة BiFPN بدمج الميزات متعددة النطاقات بسهولة وسرعة من خلال إدخال أوزان قابلة للتعلم لتعلم أهمية الميزات المختلفة المدخلة. إلى جانب العمود الفقري EfficientNet، تعمل EfficientDet على توسيع نطاق عرض الشبكة وعمقها ودقتها بشكل منهجي في وقت واحد.
على الرغم من كفاءتها العالية من الناحية النظرية من حيث FLOPs، إلا أن نماذج EfficientDet قد تواجه أحيانًا صعوبة في ترجمة الكفاءة النظرية إلى سرعة فعلية على الأجهزة الطرفية بسبب أنماط الوصول المعقدة إلى الذاكرة، وهو ما يتناقض بشكل حاد مع متطلبات الذاكرة المنخفضة للنماذج YOLO.
تحليل الأداء والمعايير
يُقارن الجدول أدناه المقاييس الرئيسية في مجموعات البيانات القياسية مثل COCO. توفر مقارنة متوسط الدقة (mAP) مع سرعة الاستدلال صورة واضحة عن حدود باريتو.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
كما هو موضح، فإن PP-YOLOE+ عمومًا يتناسب بشكل أفضل مع mAP الخام mAP لوحدات معالجة الرسومات (GPU) المتطورة، بينما يحاول EfficientDet تقليل المعلمات إلى الحد الأدنى. ومع ذلك، فإن كلاهما يتخلف عن القدرات الحديثة في الوقت الفعلي المطلوبة للذكاء الاصطناعي المتطور.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين PP-YOLOE+ و EfficientDet على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
PP-YOLOE+ هو خيار قوي لـ:
- تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.
متى تختار EfficientDet
يوصى باستخدام EfficientDet في الحالات التالية:
- Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
- النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
البديل الحديث: Ultralytics
في حين أن PP-YOLOE+ و EfficientDet يمثلان معالم تاريخية مهمة، فإن المطورين الذين يسعون إلى الحصول على دقة متطورة واستهلاك أقل للذاكرة وتجربة مستخدم مبسطة يجب أن يبحثوا عن Ultralytics .
يمثل YOLO26 قفزة هائلة إلى الأمام في مجال اكتشاف الأجسام، حيث يقدم العديد من الابتكارات الهامة:
- تصميم شامل NMS: بناءً على الإنجازات الرائدة لـ YOLOv10، يزيل YOLO26 بشكل أساسي تقنية Non-Maximum Suppression (NMS) أثناء الاستدلال. وينتج عن ذلك انخفاض كبير في زمن الاستجابة وإزالة معوقات المعالجة اللاحقة المعقدة.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب LLM، يستخدم YOLO26 مُحسِّنًا هجينًا SGD Muon. وهذا يحسّن بشكل كبير من استقرار التدريب ويقلل من وقت التقارب.
- سرعة فائقة: يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال القديمة مثل YOLO11، مما يجعله الخيار الأفضل على الإطلاق للأجهزة الطرفية التي تعمل بالبطارية أو CPU
- وظائف الخسارة المتقدمة: يؤدي دمج ProgLoss و STAL إلى تحسين كبير في التعرف على الأجسام الصغيرة، وهو أمر ضروري لمهام مثل تحليل الطائرات بدون طيار والروبوتات.
تعدد المهام وتعدد الاستخدامات
على عكس EfficientDet الذي يركز فقط على الكشف، يتعامل YOLO26 بشكل أساسي مع تقدير الوضع وتصنيف الصور ومربعات الحدود الموجهة (OBB)، كل ذلك ضمن نفس النظام البيئي الذي يتم صيانته جيدًا.
سهولة الاستخدام وتكامل النظام البيئي
أحد أكبر عيوب النماذج القديمة مثل EfficientDet هو تعقيد مسارات التدريب وإعدادات التعلم الآلي. في المقابل، توفر Ultralytics تجربة مطورين لا مثيل لها.
Ultralytics نشر نموذج باستخدام Ultralytics سوى بضع أسطر من التعليمات البرمجية، مما يشكل تباينًا واضحًا مع التكوينات المطولة التي تتطلبها الأطر القديمة.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)
# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")
بالنسبة لأولئك الذين يستكشفون بدائل أخرى، فإن بنى مثل RT-DETR أو YOLOv8 متاحة أيضًا في Ultralytics ، مما يتيح إمكانية التبديل والاختبار بسلاسة.
الخلاصة
يظل PP-YOLOE+ خيارًا قويًا لنشر خوادم محددة داخل نظام Paddle البيئي، ويظل EfficientDet دراسة مثيرة للاهتمام في تصميم البنية الآلية. ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب استنتاجًا في الوقت الفعلي وسهولة في النشر ومتطلبات ذاكرة دنيا، يوفر Ultralytics التوازن الأكثر إقناعًا في الأداء. إن تصميمه الأصلي NMS CPU السريع للغاية يجعله الخيار النهائي لضمان استمرارية البنية التحتية للذكاء الاصطناعي في المستقبل.