تخطي إلى المحتوى

PP-YOLOE+ مقابل EfficientDet: مقارنة تقنية شاملة

يعد اختيار البنية الصحيحة خطوة حاسمة في بناء تطبيقات رؤية الكمبيوتر القوية. يستكشف هذا الدليل التقني المفاضلات بين نموذجين معروفين لاكتشاف الكائنات: PP-YOLOE+ و EfficientDet. سنقوم بتحليل بنياتهما، وتقييم مقاييس أدائهما، واستكشاف سيناريوهات النشر المثالية لهما.

في حين أن كلا النموذجين قد قدما مساهمات كبيرة في هذا المجال، سنناقش أيضًا كيف توفر البدائل الحديثة مثل Ultralytics كفاءة ذاكرة فائقة، واستنتاجًا أسرع، وتجربة مطور مبسطة للغاية.

نظرة عامة معمارية: PP-YOLOE+

PP-YOLOE+ هو نسخة مطورة منYOLO الأصلي، تم تصميمه خصيصًا لتحسين الأداء على وحدات معالجة الرسومات (GPU) من جانب الخادم داخل PaddlePaddle . ويقدم العديد من التحسينات على البنية الأساسية، مع التركيز على نموذج بدون مرساة.

تعرف على المزيد حول PP-YOLOE+

يتميز PP-YOLOE+ بوجود عمود فقري CSPRepResNet، ورأس متوافق مع المهام الفعالة (ET-head)، ويعتمد بشكل كبير على الخسارة متغيرة البؤرة للتصنيف إلى جانب الخسارة البؤرية التوزيعية لانحدار مربع الحدود. ساعد انتقاله إلى تصميم كاشف خالٍ من المراسي على تبسيط خط أنابيب المعالجة اللاحقة، مما جعله شديد التنافسية في وقت إصداره.

فوائد التكامل

غالبًا ما تجد الفرق التي استثمرت بالفعل بشكل كبير في PaddlePaddle من Baidu أن PP-YOLOE+ أسهل في الاستخدام لمهام مثل تقسيم المثيلات، على الرغم من أنه يفتقر إلى الدعم الواسع النطاق لأطر العمل المتعددة الذي نراه في الأدوات الأحدث.

نظرة عامة معمارية: EfficientDet

يتبع EfficientDet نهجًا مختلفًا تمامًا في اكتشاف الكائنات، حيث يعتمد بشكل كبير على البحث في البنية العصبية ومبادئ القياس المركب.

تعرف على المزيد حول EfficientDet

حجر الأساس في EfficientDet هو شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تسمح شبكة BiFPN بدمج الميزات متعددة النطاقات بسهولة وسرعة من خلال إدخال أوزان قابلة للتعلم لتعلم أهمية الميزات المختلفة المدخلة. إلى جانب العمود الفقري EfficientNet، تعمل EfficientDet على توسيع نطاق عرض الشبكة وعمقها ودقتها بشكل منهجي في وقت واحد.

على الرغم من كفاءتها العالية من الناحية النظرية من حيث FLOPs، إلا أن نماذج EfficientDet قد تواجه أحيانًا صعوبة في ترجمة الكفاءة النظرية إلى سرعة فعلية على الأجهزة الطرفية بسبب أنماط الوصول المعقدة إلى الذاكرة، وهو ما يتناقض بشكل حاد مع متطلبات الذاكرة المنخفضة للنماذج YOLO.

تحليل الأداء والمعايير

يُقارن الجدول أدناه المقاييس الرئيسية في مجموعات البيانات القياسية مثل COCO. توفر مقارنة متوسط الدقة (mAP) مع سرعة الاستدلال صورة واضحة عن حدود باريتو.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

كما هو موضح، يتوسع PP-YOLOE+ بشكل عام بشكل أفضل في mAP الخام لوحدات GPU المتطورة، بينما يحاول EfficientDet تقليل المعاملات. ومع ذلك، يتخلف كلاهما عن إمكانيات الوقت الفعلي الحديثة المطلوبة للذكاء الاصطناعي المتطور على الحافة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين PP-YOLOE+ وEfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

PP-YOLOE+ هو خيار قوي لـ:

  • تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.

متى تختار EfficientDet

يوصى باستخدام EfficientDet في الحالات التالية:

  • خطوط أنابيب Google Cloud و TPU: الأنظمة المدمجة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • بحث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات تحجيم عمق الشبكة وعرضها ودقتها المتوازن.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

البديل الحديث: Ultralytics

في حين أن PP-YOLOE+ و EfficientDet يمثلان معالم تاريخية مهمة، فإن المطورين الذين يسعون إلى الحصول على دقة متطورة واستهلاك أقل للذاكرة وتجربة مستخدم مبسطة يجب أن يبحثوا عن Ultralytics .

يمثل YOLO26 قفزة هائلة إلى الأمام في مجال اكتشاف الأجسام، حيث يقدم العديد من الابتكارات الهامة:

  • تصميم شامل خالٍ من NMS: استنادًا إلى الإنجازات التي حققتها YOLOv10، يلغي YOLO26 بشكل أصيل التثبيط غير الأقصى (NMS) أثناء الاستدلال. وهذا يؤدي إلى زمن انتقال أقل بكثير ويزيل اختناقات المعالجة اللاحقة المعقدة.
  • مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّنًا هجينًا من SGD و Muon. وهذا يحسن استقرار التدريب بشكل كبير ويقلل من وقت التقارب.
  • سرعة فائقة: يقدم YOLO26 استدلالًا أسرع بنسبة تصل إلى 43% على CPU مقارنة بالأجيال الأقدم مثل YOLO11، مما يجعله الخيار الأفضل على الإطلاق للأجهزة الطرفية التي تعمل بالبطارية أو تعتمد على CPU فقط.
  • دوال الخسارة المتقدمة: يعمل دمج ProgLoss و STAL على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر ضروري لمهام مثل تحليلات الطائرات بدون طيار والروبوتات.

تعدد المهام وتعدد الاستخدامات

على عكس EfficientDet الذي يركز فقط على الكشف، يتعامل YOLO26 بشكل أساسي مع تقدير الوضع وتصنيف الصور ومربعات الحدود الموجهة (OBB)، كل ذلك ضمن نفس النظام البيئي الذي يتم صيانته جيدًا.

سهولة الاستخدام وتكامل النظام البيئي

أحد أكبر عيوب النماذج القديمة مثل EfficientDet هو تعقيد مسارات التدريب وإعدادات التعلم الآلي. في المقابل، توفر Ultralytics تجربة مطورين لا مثيل لها.

يتطلب نشر نموذج باستخدام Ultralytics بضعة أسطر فقط من التعليمات البرمجية، مما يوفر تباينًا صارخًا مع التكوينات المطولة التي تتطلبها الأطر القديمة.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

بالنسبة لأولئك الذين يستكشفون بدائل أخرى، فإن بنى مثل RT-DETR أو YOLOv8 متاحة أيضًا في Ultralytics ، مما يتيح إمكانية التبديل والاختبار بسلاسة.

الخلاصة

يظل PP-YOLOE+ خيارًا قويًا لنشر خوادم محددة داخل نظام Paddle البيئي، ويظل EfficientDet دراسة مثيرة للاهتمام في تصميم البنية الآلية. ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب استنتاجًا في الوقت الفعلي وسهولة في النشر ومتطلبات ذاكرة دنيا، يوفر Ultralytics التوازن الأكثر إقناعًا في الأداء. إن تصميمه الأصلي NMS CPU السريع للغاية يجعله الخيار النهائي لضمان استمرارية البنية التحتية للذكاء الاصطناعي في المستقبل.


تعليقات