تخطي إلى المحتوى

PP-YOLOE+ مقابل EfficientDet: مقارنة فنية للكشف عن الكائنات

يعد اختيار النموذج الصحيح لاكتشاف الأجسام قرارًا حاسمًا يؤثر على أداء تطبيقات الرؤية الحاسوبية وقابليتها للتطوير وكفاءتها. في هذه المقارنة التقنية، نقوم بتحليل بنيتين بارزتين: PP-YOLOE+، وهو كاشف عالي الأداء خالٍ من الارتكاز من نظام PaddlePaddle من بايدو، و EfficientDet، وهي بنية قابلة للتطوير من Google المعروفة بطريقة القياس المركب.

PP-YOLOE+: مُحسَّن للسرعة والدقة

يمثل PP-YOLOE+ تطورًا كبيرًا في سلسلة YOLO حيث تم تطويره لتحقيق التوازن الأمثل بين الدقة وسرعة الاستدلال. وهو مبني على النموذج الخالي من الارتكاز، ويبسط خط أنابيب الكشف مع الاستفادة من التقنيات المتقدمة مثل تعلم محاذاة المهام (TAL).

الميزات المعمارية الرئيسية

يدمج PP-YOLOE+ العمود الفقري CSPRepResNet، الذي يجمع بين كفاءة CSPNet وإمكانيات إعادة تحديد المعلمات في ResNet. يسمح ذلك للنموذج بالتقاط تمثيلات الميزات الغنية دون تكبد تكاليف حسابية مفرطة. ويستخدم العنق شبكة تجميع المسار (PAN) لدمج الميزات الفعالة متعددة المقاييس، مما يضمن اكتشاف الأجسام الصغيرة بموثوقية أعلى.

الميزة البارزة هي الرأس الفعال المحاذي للمهام (ET-Head). على عكس الرؤوس المقترنة التقليدية، يفصل الرأس المحاذي للمهام بين مهام التصنيف والتوطين، باستخدام TAL لمحاذاة أفضل المراسي ديناميكيًا مع كائنات الحقيقة الأرضية. يعمل هذا النهج على تحسين سرعة التقارب والدقة النهائية بشكل كبير.

تعرف على المزيد حول PP-YOLOE+

EfficientDet: الكفاءة القابلة للتطوير

قدم EfficientDet نهجًا جديدًا لتوسيع نطاق النموذج، مع التركيز على تحسين الدقة والكفاءة في آن واحد. وهو مبني على العمود الفقري لشبكة EfficientNet ويقدم شبكة هرمية ثنائية الاتجاه مرجحة (BiFPPN).

الميزات المعمارية الرئيسية

إن الابتكار الأساسي لشبكة EfficientDet هو الشبكة الثنائية لملامح السمة (BiFPPN)، والتي تسمح بدمج الميزات متعددة النطاقات بسهولة وسرعة. وخلافاً لشبكات FPN السابقة التي كانت تجمع الميزات بالتساوي، تقوم BiFPPN بتعيين أوزان لكل ميزة من ميزات المدخلات، مما يسمح للشبكة بتعلم أهمية ميزات المدخلات المختلفة. بالإضافة إلى ذلك، يستخدم EfficientDet طريقة تحجيم مركّبة تعمل على قياس الدقة والعمق والعرض بشكل موحد لجميع شبكات العمود الفقري وشبكة الميزات وشبكات التنبؤ المربع/الفئة، مما يوفر عائلة من النماذج (D0 إلى D7) مصممة خصيصًا لتناسب قيود الموارد المختلفة.

تعرف على المزيد حول EfficientDet

تحليل الأداء: السرعة مقابل الدقة

عند تقييم هذه النماذج، تتضح المفاضلة بين سرعة الاستدلال ومتوسط الدقةmAP). في حين أن EfficientDet وضع معايير عالية عند إصداره، فقد استفادت البنى الأحدث مثل PP-YOLOE+ من التصاميم المدركة للأجهزة لتحقيق أداءٍ فائق على وحدات معالجة الرسومات الحديثة.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

تسلط البيانات الضوء على أن PP-YOLOE+ يتفوق بشكل كبير على EfficientDet في زمن انتقال الاستدلال على GPU . على سبيل المثال، يحقق PP-YOLOE+l mAP أعلى (52.9) من EfficientDet-d6 (52.6) بينما يكون أسرع بأكثر من 10 أضعاف على GPU T4 (8.36 مللي ثانية مقابل 89.29 مللي ثانية). تحافظ EfficientDet على أهميتها في السيناريوهات التي تكون فيها وحدات المعالجة المركزية FLOP هي القيد الأساسي، مثل وحدات المعالجة المركزية المحمولة منخفضة الطاقة للغاية، ولكنها تكافح من أجل المنافسة في بيئات الخوادم عالية الإنتاجية.

تحسين الأجهزة

تم تصميم الخيارات المعمارية في PP-YOLOE+ خصيصًا لتكون ملائمة لمسرعات أجهزة GPU مثل TensorRT. يتم هيكلة العمليات لزيادة التوازي إلى أقصى حد، في حين أن الاتصالات المعقدة في EfficientDet's BiFPPN يمكن أن تخلق أحيانًا اختناقات في الوصول إلى الذاكرة على وحدات معالجة الرسومات.

نقاط القوة والضعف

يساعد فهم إيجابيات وسلبيات كل نموذج في اختيار الأداة المناسبة لمهام رؤية حاسوبية محددة.

PP-YOLOE+

  • نقاط القوة:
    • نسبة عالية من الدقة إلى السرعة: يوفر أحدث ما توصلت إليه mAP مع قدرات استدلالية في الوقت الفعلي على وحدات معالجة الرسومات.
    • خالي من المرساة: يزيل الحاجة إلى ضبط صندوق الارتكاز المعقد، مما يبسط إعداد التدريب.
    • تعيين التسمية الديناميكي: يستخدم TAL لتحسين المواءمة بين التصنيف والتوطين.
  • نقاط الضعف:
    • خصوصية النظام البيئي: تم تحسينه بشكل كبير لإطار عمل PaddlePaddle والذي قد يمثل منحنى تعليمي للمستخدمين المعتادين على PyTorch.
    • كثافة الموارد: تتطلب المتغيرات الأكبر حجمًا (L و X) ذاكرة كبيرة، مما قد يحد من النشر على الأجهزة المتطورة ذات حدود ذاكرة الوصول العشوائي الصارمة.

EfficientDet

  • نقاط القوة:
    • كفاءة المعلمات: تحقيق دقة عالية مع عدد أقل نسبيًا من المعلمات مقارنة بأجهزة الكشف القديمة.
    • قابلية التوسع: تسمح طريقة القياس المركب للمستخدمين بالتبديل بسهولة بين أحجام النماذج (d0-d7) بناءً على الحوسبة المتاحة.
    • BiFPPN: دمج الميزات المبتكرة التي تتعامل بكفاءة مع الكائنات بمقاييس مختلفة.
  • نقاط الضعف:
    • الاستدلال البطيء: على الرغم من انخفاض عدد عمليات التدوير، غالبًا ما تؤدي بنية الرسم البياني المعقدة إلى إبطاء أوقات الاستدلال في العالم الحقيقي، خاصةً على وحدات معالجة الرسومات.
    • سرعة التدريب: يمكن أن يكون التدريب أبطأ مقارنةً بأجهزة الكشف الحديثة ذات المرحلة الواحدة بسبب تعقيد البنية.

حالات الاستخدام في العالم الحقيقي

تتفوق هذه النماذج في بيئات مختلفة بناءً على نقاط قوتها المعمارية.

  • التصنيع والأتمتة الصناعية: يُعد PP-YOLOE+ خيارًا ممتازًا لمراقبة الجودة في التصنيع. تسمح سرعته الاستدلالية العالية باكتشاف العيوب في الوقت الفعلي على خطوط التجميع سريعة الحركة حيث يتم حساب أجزاء من الثانية.

  • البيع بالتجزئة والمخزون الذكي: بالنسبة لتحليلات البيع بالتجزئة، مثل الدفع الآلي أو مراقبة الرفوف، تضمن دقة PP-YOLOE+ تحديد المنتجات بشكل صحيح حتى في المشاهد المزدحمة.

  • الاستشعار عن بُعد والصور الجوية: إن قدرة EfficientDet على التوسّع إلى درجات دقة أعلى (على سبيل المثال، D7) تجعلها مفيدة لتحليل صور الأقمار الصناعية أو صور الطائرات بدون طيار عالية الدقة حيث تكون سرعة المعالجة أقل أهمية من اكتشاف السمات الصغيرة في الصور الكبيرة.

  • أجهزة الحافة منخفضة الطاقة: يُفضّل أحيانًا استخدام متغيرات EfficientDet الأصغر (D0-D1) لأجهزة الذكاء الاصطناعي المتط ورة القديمة حيث يكون إجمالي FLOP هو الحد الأقصى الصعب، ولا يتوفر تسريع GPU .

ميزة Ultralytics: لماذا تختار YOLO11؟

في حين أن PP-YOLOE+ وEfficientDet يقدمان حلولاً قوية، فإن Ultralytics YOLO11 يوفر تجربة متفوقة لمعظم المطورين والباحثين. فهو يجمع بين أفضل الابتكارات المعمارية الحديثة مع نظام بيئي يركز على المستخدم.

تعرف على المزيد حول YOLO11

لماذا YOLO11

  1. سهولة الاستخدام: تشتهر نماذج Ultralytics بسهولة استخدامها "الجاهزة". وبفضل واجهة برمجة تطبيقاتPython البسيطة CLI برمجة تطبيقاتPython CLI برمجة CLI بديهية، يمكنك تدريب النماذج والتحقق من صحتها ونشرها في دقائق، على عكس ملفات التكوين المعقدة التي تتطلبها الأطر الأخرى.
  2. نظام بيئي جيد الصيانة: مجتمع Ultralytics نشط ومتنامي. تضمن التحديثات المنتظمة التوافق مع أحدث إصدارات PyTorch و ONNX و CUDA مما يوفر أساسًا مستقرًا للمشاريع طويلة الأجل.
  3. توازن الأداء: يحقق YOLO11 توازنًا ملحوظًا، وغالبًا ما يتفوق على PP-YOLOE+ في السرعة مع مطابقة الدقة أو تجاوزها. تم تصميمه ليكون محايدًا من حيث الأجهزة، حيث يعمل بشكل استثنائي على وحدات المعالجة المركزية ووحدات معالجة الرسومات ووحدات المعالجة العصبية.
  4. كفاءة الذاكرة: بالمقارنة مع النماذج القائمة على المحولات أو البنى الأقدم، تم تحسين نماذج Ultralytics YOLO لتقليل استهلاك الذاكرة أثناء التدريب. يسمح ذلك بأحجام دفعات أكبر وتقارب أسرع على الأجهزة القياسية.
  5. تعدد الاستخدامات: على عكس EfficientDet الذي هو في المقام الأول كاشف للأجسام، يدعم YOLO11 مجموعة واسعة من المهام بما في ذلك تجزئة المثيل وتقدير الوضعيات واكتشاف الأجسام الموجهة والتصنيف ضمن إطار عمل واحد موحد.
  6. كفاءة التدريب: بفضل التعزيزات المتقدمة وأدوات تحميل البيانات المحسّنة، فإن تدريب نموذج YOLO11 سريع وفعال. تتوفر أوزان واسعة النطاق مُدرَّبة مسبقًا، مما يتيح نتائج تعلُّم نقل قوية مع الحد الأدنى من البيانات.

مثال: تشغيل YOLO11 في Python

لا يتطلب الأمر سوى بضعة أسطر من التعليمات البرمجية لتحميل نموذج YOLO11 المدرب مسبقًا وتشغيل الاستدلال، مما يدل على بساطة سير عمل Ultralytics .

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

الخلاصة

ساهم كل من PP-YOLOE+ وEfficientDet بشكل كبير في مجال رؤية الكمبيوتر. يعد PP-YOLOE+ منافسًا قويًا للمستخدمين المندمجين بعمق في نظام Baidu البيئي الذي يتطلب إنتاجية عالية GPU . يظل EfficientDet مثالاً كلاسيكيًا على كفاءة المعلمات والتصميم القابل للتطوير.

ومع ذلك، بالنسبة لأولئك الذين يبحثون عن حل متعدد الاستخدامات وعالي الأداء وسهل الاستخدام للمطورين, Ultralytics YOLO11 هو الخيار الموصى به. فهو يجمع بين الدقة المتطورة، والسرعة في الوقت الحقيقي، والنظام البيئي الداعم مما يجعله المنصة المثالية لبناء تطبيقات الذكاء الاصطناعي من الجيل التالي.

لإجراء المزيد من المقارنات، فكر في استكشاف YOLO11 مقابل EfficientDet أو PP-YOLOE+ مقابل YOLOv10 لمعرفة كيف تتراكم هذه النماذج مقابل البنى الحديثة الأخرى.


تعليقات