تخطي إلى المحتوى

EfficientDet مقابل PP-YOLOE+: مقارنة تقنية بين بنى الكشف القابلة للتوسع

في مجال اكتشاف الأجسام التنافسي، هناك القليل من المنافسات التي توضح تطور تصميم الشبكات العصبية بشكل أفضل من التباين بين EfficientDet و PP-YOLOE+. في حين قدم EfficientDet مفهوم التوسع المركب إلى العالم، قام PP-YOLOE+ بتحسين نموذج بدون مرساة للتطبيقات الصناعية.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين المؤثرين، ويقيّم خياراتهما المعمارية ووقت الاستدلال ومدى ملاءمتهما للنشر. سنستكشف أيضاً كيف أن البدائل الحديثة مثل Ultralytics و YOLO11 تستند إلى هذه الأسس لتوفر سهولة استخدام فائقة وأداء متطور.

معايير الأداء التفاعلية

لفهم مكانة هذه النماذج في التسلسل الهرمي الحالي للرؤية الحاسوبية، راجع الرسم البياني أدناه. فهو يوضح التوازن بين السرعة (الكمون) والدقة (mAP)، مما يساعدك على تحديد النموذج الأمثل لقيود الأجهزة لديك.

جدول المقارنة المترية

يعرض الجدول التالي عرضًا تفصيليًا لمقاييس الأداء على COCO . لاحظ التطور في الكفاءة، لا سيما في نسبة المعلمات إلى الأداء.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

EfficientDet: رائد التوسع المركب

طورت Google برنامج EfficientDet الذي أحدث ثورة في تصميم النماذج من خلال اقتراح إمكانية توسيع نطاق الدقة والكفاءة معًا بشكل منهجي. قبل EfficientDet، كان توسيع نطاق النموذج يعني زيادة العمق أو العرض أو الدقة بشكل تعسفي.

الابتكارات المعمارية

يستخدم EfficientDet العمود الفقري EfficientNet، المعروف بكفاءة معلماته العالية. لكن السمة المميزة له هي BiFPN (شبكة هرمية ثنائية الاتجاه للميزات). على عكس شبكات FPN القياسية التي تجمع الميزات دون تمييز، تطبق BiFPN أوزانًا قابلة للتعلم على ميزات الإدخال المختلفة، مما يسمح للشبكة بتعلم أهمية كل مقياس.

ويقترن ذلك بـ Compound Scaling، وهي طريقة قائمة على المعاملات تقوم بتحجيم الدقة والعمق والعرض بشكل موحد للبنية الأساسية وشبكة الميزات وشبكات التنبؤ. ويتيح هذا النهج الشامل لـ EfficientDet تغطية نطاق واسع من قيود الموارد، من الأجهزة المحمولة (D0) إلى GPU المتطورة (D7).

تعرف على المزيد حول EfficientDet

PP-YOLOE+: مُحسّن للاستخدام الصناعي

PP-YOLOE+ هو تطورYOLO من PaddlePaddle التابع لـ Baidu. وهو يمثل تحولًا نحو أجهزة الكشف الخالية من المراسي والمُحسّنة خصيصًا GPU السحابي وحافة GPU مثل V100 و T4.

الابتكارات المعمارية

يشير الحرف "Plus" في PP-YOLOE+ إلى التحسينات التي أُدخلت على النسخة الأصلية، بما في ذلك بنية أساسية قوية تستند إلى CSPRepResNet. تستفيد هذه البنية من إعادة تحديد المعلمات لتبسيط الهياكل المعقدة لوقت التدريب إلى طبقات بسيطة لوقت الاستدلال، مما يزيد السرعة بشكل كبير.

يستخدم PP-YOLOE+ تقنية Task Alignment Learning (TAL)، وهي استراتيجية لتعيين التسميات تختار العينات الإيجابية ديناميكيًا بناءً على مزيج من درجات التصنيف والتوطين. وهذا يضمن أن التنبؤات عالية الثقة هي أيضًا الأكثر دقة من حيث التوطين، وهو تحدٍ شائع في أجهزة الكشف الخالية من المراسي.

تعرف على المزيد حول PP-YOLOE+

تعمق: الاختلافات الجوهرية

1. منهجيات دمج الميزات

يعد BiFPN من EfficientDet أنيقًا من الناحية النظرية، حيث يتيح إعادة استخدام الميزات المعقدة. ومع ذلك، فإن هذا التباين في أنماط الوصول إلى الذاكرة قد يؤدي إلى بطء في أداء مسرعات الأجهزة التي تفضل عمليات المصفوفات الموحدة. في المقابل، يستخدم PP-YOLOE+ تصميم RepResBlock في PANet، وهو ما يعادل رياضيًا الكتل المعقدة أثناء التدريب، ولكنه ينهار إلى تلافيف واحدة أثناء الاستدلال، مما يزيد GPU إلى أقصى حد.

2. استقرار التدريب

يعتمد EfficientDet على إطار عمل AutoML، الذي قد يكون تكراره أو ضبطه مكلفًا من الناحية الحسابية دون موارد ضخمة. يستخدم PP-YOLOE+ نهجًا ثابتًا للرسوم البيانية نموذجيًا في PaddlePaddle وهو نهج مستقر ولكنه قد يبدو صارمًا مقارنة بالطبيعة الديناميكية للنماذج PyTorch مثل Ultralytics YOLOv8 أو YOLO11.

3. النظام البيئي والصيانة

على الرغم من الأهمية التاريخية لمستودع Google إلا أنه لا يحظى بنفس القدر من الصيانة النشطة مقارنة بالمشاريع التي تقودها المجتمعات. PP-YOLOE+ هو جزء من مجموعة PaddleDetection، التي تتميز بقوتها ولكنها مرتبطة بشكل كبير PaddlePaddle . قد يؤدي ذلك إلى صعوبة التعلم بالنسبة للمطورين المعتادين على PyTorch TensorFlow مما يعقد عملية نشر النموذج على الأجهزة غير القياسية.

تعقيد النشر

PaddlePaddle يتطلب نشر النماذج من أطر عمل محددة مثل PaddlePaddle أدوات تحويل متخصصة (على سبيل المثال، paddle2onnx) قبل أن يمكن استخدامها مع محركات الاستدلال العامة مثل TensorRT OpenVINO.

Ultralytics : YOLO26 و YOLO11

بينما مهدت EfficientDet و PP-YOLOE+ الطريق، اتجه هذا المجال نحو نماذج توفر توازنًا أفضل بين السرعة والدقة مع قابلية استخدام أفضل بكثير. Ultralytics تمنح الأولوية لتجربة مطور سلسة ("سهولة الاستخدام") إلى جانب الأداء الخام.

لماذا يختار المطورون Ultralytics

  1. سهولة الاستخدام: باستخدام Python موحدة، يمكنك التبديل بين YOLO11و YOLO26 و RT-DETR عن طريق تغيير سلسلة واحدة.
  2. نظام بيئي جيد الصيانة: تضمن Ultralytics ومجتمع GitHub النشط حصولك على أحدث إصلاحات الأخطاء وتنسيقات التصدير وأدلة النشر.
  3. كفاءة الذاكرة: تشتهر Ultralytics بانخفاض استهلاكها للذاكرة أثناء التدريب مقارنة بالبنى القديمة أو نماذج المحولات الثقيلة، مما يجعلها متاحة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
  4. تعدد الاستخدامات: على عكس EfficientDet (الكشف فقط)، تدعم Ultralytics بشكل أساسي التجزئة وتقدير الوضع و OBB والتصنيف.

تحت الأضواء: YOLO26

يضع الإصدار الجديد YOLO26 معيارًا جديدًا لعام 2026. فهو يشتمل على ميزات تعالج بشكل خاص قيود الأجيال السابقة:

  • نهاية إلى نهاية أصلاً: YOLO26 هي بنية NMS. وهذا يزيل خطوة القمع غير الأقصى تماماً، والتي غالباً ما تكون عنق زجاجة في المشاهد المزدحمة وتبسط منطق النشر بشكل كبير.
  • MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن تقاربًا مستقرًا حتى مع مجموعات البيانات الضخمة.
  • ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة هذه على تحسين اكتشاف الأجسام الصغيرة، وهي نقطة ضعف تقليدية في YOLO مقارنةً بتحجيم EfficientDet عالي الدقة.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

تعرف على المزيد حول YOLO26

تطبيقات عملية في أرض الواقع

غالبًا ما يعتمد اختيار النموذج المناسب على التطبيق الصناعي المحدد.

التصوير الطبي

لطالما حظي متغير D7 من EfficientDet بشعبية في تحليل الصور الطبية (مثل الكشف عن الأورام في الأشعة السينية) لأنه يتعامل بفعالية مع المدخلات عالية الدقة. ومع ذلك، فإن سرعة الاستدلال البطيئة تحد من استخدامه في المعالجة غير المتصلة بالإنترنت. البدائل الحديثة مثل YOLO11 هي الآن المفضلة للمساعدة في التشخيص في الوقت الفعلي.

التصنيع ومراقبة الجودة

يتميز PP-YOLOE+ في بيئات التصنيع الآلية حيث تكون الكاميرات ثابتة والإضاءة خاضعة للتحكم. كما أن تحسينه لـ TensorRT مناسبًا لخطوط التجميع عالية السرعة التي تكتشف العيوب.

المدن الذكية والذكاء الاصطناعي المتطور

بالنسبة لتطبيقات المدن الذكية مثل مراقبة حركة المرور، يعد Ultralytics الخيار الأفضل. إن قدرته CPU أعلى بنسبة 43٪ تعد أمرًا بالغ الأهمية للأجهزة الطرفية (مثل Raspberry Pi أو NVIDIA ) حيث لا تتوفر وحدات معالجة رسومات مخصصة عالية الطاقة. NMS إزالة NMS تعني NMS أن زمن الاستجابة أصبح حتميًا، وهو عامل حاسم لأنظمة السلامة في الوقت الفعلي.

الخلاصة

يعد كل من EfficientDet و PP-YOLOE+ معلمين بارزين في تاريخ الرؤية الحاسوبية. أثبت EfficientDet أن التوسع يمكن أن يكون علميًا، بينما أظهر PP-YOLOE+ قوة التصميمات الخالية من المراسي في GPU .

ومع ذلك، بالنسبة للمطورين الذين يبدأون مشاريع جديدة في عام 2026، يقدم Ultralytics الحزمة الأكثر جاذبية. من خلال الجمع بين دقة الرؤوس الحديثة الخالية من المثبتات وبساطة التصميم NMS والدعم القوي Ultralytics ، فإنه يوفر أسرع مسار من المفهوم إلى الإنتاج.

لبدء تدريب نماذجك المتطورة اليوم، تفضل بزيارة Ultralytics .


تعليقات