تخطي إلى المحتوى

EfficientDet مقابل PP-YOLOE+: دراسة تقنية متعمقة في هياكل الكشف عن الكائنات

لقد تأثر مشهد الرؤية الحاسوبية بشكل كبير بالتطور المستمر لنماذج الكشف عن الأشياء. ومن المعالم البارزة في هذه الرحلة نذكر EfficientDet من Google و PP-YOLOE+ من Baidu. ورغم أن كلا الهيكلين صمما لتحقيق التوازن الدقيق بين الكفاءة الحاسوبية ودقة الكشف، إلا أنهما يتعاملان مع هذا التحدي من خلال فلسفتين تصميميتين مختلفتين تمامًا.

يحلل هذا الدليل الشامل هياكلها ومنهجيات التدريب وسيناريوهات النشر في العالم الحقيقي لمساعدتك في اختيار الشبكة العصبية المثلى لتطبيق الرؤية الحاسوبية التالي.

الابتكارات المعمارية وفلسفات التصميم

إن فهم البنية الأساسية لهذه النماذج أمر بالغ الأهمية لنشرها بفعالية في بيئات الإنتاج، سواء على الأجهزة الطرفية أو خوادم السحابة.

EfficientDet: قوة التحجيم المركب

طورت Google برنامج EfficientDet الذي أحدث تحولاً جذرياً في طريقة التعامل مع توسيع نطاق النماذج، حيث لم يعد يعتبر عملية مخصصة، بل أصبح طريقة توسيع نطاق مركبة قائمة على مبادئ رياضية.

تعرف على المزيد حول EfficientDet

يكمن الابتكار الأساسي في EfficientDet في شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية التي تجمع الميزات من أعلى إلى أسفل فقط، تقدم BiFPN أوزانًا قابلة للتعلم لإجراء دمج الميزات عبر النطاقات من أعلى إلى أسفل ومن أسفل إلى أعلى. وهذا يسمح للشبكة بفهم أهمية الميزات المختلفة للمدخلات بشكل بديهي. بالاقتران مع العمود الفقري EfficientNet، يقوم EfficientDet بتحجيم الدقة والعمق والعرض في وقت واحد، مما يخلق مجموعة من النماذج (d0 إلى d7) التي تلبي احتياجات الميزانيات الحسابية المختلفة.

تحجيم EfficientDet

عند نشر EfficientDet، ضع في اعتبارك الأجهزة المستهدفة بعناية. في حين أن d0 مناسب للأجهزة المحمولة، فإن التوسع إلى d7 يتطلب GPU كبيرة وقدرة حوسبة كبيرة.

PP-YOLOE+: تخطي حدود PaddlePaddle

بناءً على نجاحات سابقاتها، تم تصميم PP-YOLOE+ من قبل PaddlePaddle في Baidu لتقديم أداء متطور، تم تحسينه خصيصًا لنشر الخوادم عالية الإنتاجية.

تعرف على المزيد حول PP-YOLOE+

يتميز PP-YOLOE+ بوجود عمود فقري CSPRepResNet، الذي يستفيد من شبكات Cross Stage Partial جنبًا إلى جنب مع تقنيات إعادة تحديد المعلمات لتحسين استخراج الميزات دون زيادة زمن الاستدلال. يعمل ET-head (رأس فعال ومتوافق مع المهام) على تحسين التوافق بين مهام التصنيف والتوطين بشكل كبير. علاوة على ذلك، يستخدم تصميمًا خاليًا من المراسي جنبًا إلى جنب مع التعيين الديناميكي للعلامات (TAL)، مما يبسط عملية التدريب ويحسن التعميم عبر مجموعات البيانات المتنوعة.

مقاييس ومعايير الأداء

عند اختيار نموذج للاستدلال في الوقت الفعلي، من الأهمية بمكان تقييم التوازن بين متوسط الدقة (mAP) وسرعة الحساب. يوضح الجدول أدناه مقاييس الأداء الرئيسية لكلا النموذجين.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

كما لوحظ، يحقق PP-YOLOE+ عمومًا ذروات دقة أعلى عند عدد معادل من المعلمات، لا سيما في متغيراته الأكبر (l و x). وهو مُحسّن للغاية من أجل GPU ، مما يجعله خيارًا ممتازًا لنشر خوادم المعالجة المجمعة. على العكس من ذلك، توفر نماذج EfficientDet الأصغر نسبة معلمة إلى FLOP عالية الكفاءة، والتي يمكن أن تكون مفيدة في بيئات الذاكرة شديدة التقييد.

حالات الاستخدام المثالية واستراتيجيات النشر

غالبًا ما يعتمد الاختيار بين هذه البنى بشكل كبير على المجموعة التقنية الحالية لديك وأجهزة النشر.

متى تختار EfficientDet:

  • سير عمل AutoML: إذا كنت تستثمر بكثافة في نظام Google البيئي وتعتمد على إمكانات البحث الآلي في البنية.
  • الحافة المحدودة الموارد: توفر النماذج الأقل مستوى (d0، d1) أداءً يمكن التنبؤ به على وحدات المعالجة المركزية المحمولة حيث يمثل حجم المعلمات قيدًا صارمًا.

متى تختار PP-YOLOE+:

  • GPU المتطورة: السيناريوهات التي تتطلب أقصى إنتاجية على NVIDIA مثل معالجة مئات من تدفقات الفيديو المتزامنة لمراقبة المدن الذكية.
  • PaddlePaddle : إذا كان فريق التطوير لديك يستخدم بالفعل إطار عمل التعلم العميق من Baidu، فإن دمج PP-YOLOE+ سيكون سلسًا.

Ultralytics : تقديم YOLO26

في حين أن EfficientDet و PP-YOLOE+ هما نموذجان رائعان، فإن الوتيرة السريعة للابتكار في مجال الذكاء الاصطناعي تتطلب حلولاً توفر أداءً متطورًا وسهولة استخدام لا مثيل لها. وهنا يتفوق Ultralytics حيث يثبت نفسه كخيار متميز لتطبيقات الرؤية الحاسوبية الحديثة.

صدر YOLO26 في عام 2026، وهو يعيد تعريف الكشف عن الكائنات في الوقت الفعلي تمامًا من خلال تقديم تصميم أصلي شامل NMS. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression — وهي عقبة مستمرة في النماذج القديمة — يوفر YOLO26 نشرًا أبسط بكثير ويقلل من تذبذب زمن الاستدلال.

علاوة على ذلك، تم تحسين YOLO26 خصيصًا لتطبيقات الحافة. إن إزالة Distribution Focal Loss (DFL) يبسط عملية التصدير إلى تنسيقات مثل ONNX TensorRT مما ينتج عنه CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بالأجيال السابقة. وهذا يجعله قوة مطلقة لأجهزة إنترنت الأشياء التي تعمل بالبطارية.

تدريب الاستقرار مع MuSGD

يضم YOLO26 مُحسّن MuSGD المبتكر، وهو مزيج من SGD Muon. مستوحى من التطورات في تدريب LLM، يضمن هذا المُحسّن تدريبًا عالي الاستقرار وتقاربًا سريعًا، مما يوفر ساعات GPU قيّمة.

يمكن للمطورين أيضًا الاستفادة من وظائف الخسارة المتقدمة في YOLO26، بما في ذلك ProgLoss + STAL، التي تُظهر تحسينات ملحوظة في التعرف على الأجسام الصغيرة — وهو مطلب أساسي لتطبيقات التصوير الجوي والزراعة الدقيقة.

نشر سلس مع Ultralytics

Ultralytics القوة الحقيقية لـ Ultralytics في نظامها البيئي الموحد. على عكس النماذج التي تتطلب نصوص تدريب معقدة ومخصصة، يوفر YOLO26 واجهة برمجة تطبيقات (API) مبسطة للغاية. لا يتطلب تدريب نموذج على مجموعة البيانات المخصصة الخاصة بك سوى بضع أسطر من Python :

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference on a new image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

سواء كنت بحاجة إلى الكشف القياسي أو مهام متخصصة مثل تقسيم الحالات وتقدير الوضع، فإن YOLO26 يدعم هذه المهام بشكل أصلي من خلال نماذج أولية متعددة المقاييس وتقدير الاحتمالية المتبقية (RLE)، كل ذلك ضمن نفس الإطار السهل الاستخدام.

استكشاف نماذج أخرى بارزة

إذا كنت تقوم بتقييم البنى الهندسية لمتطلبات مؤسسية محددة، فمن الجدير أيضًا النظر في الجيل السابق Ultralytics YOLO11، الذي لا يزال يمثل أداة قوية ومختبرة في الإنتاج. بالنسبة للتطبيقات التي تتطلب بنى قائمة على المحولات، فإن RT-DETR بديلاً مثيراً للاهتمام، على الرغم من أنه يتطلب عادةً CUDA أعلى أثناء التدريب مقارنةً YOLO عالية الكفاءة.

في الختام، في حين يوفر EfficientDet توسيعًا قائمًا على المبادئ ويوفر PP-YOLOE+ GPU ممتازة ضمن إطاره المحدد، فإن Ultralytics يقدم الحل الأكثر توازنًا وتعددًا في الاستخدامات وسهولة في الاستخدام للمطورين المتاح حاليًا. إن بنيته الأصلية الشاملة وقدراته الواسعة على التكامل تجعله الأساس الموصى به للجيل التالي من الذكاء الاصطناعي البصري.


تعليقات