تخطي إلى المحتوى

PP-YOLOE+ ضد DAMO-YOLO: مقارنة فنية مفصلة للكشف عن الكائنات

يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا يوازن بين المفاضلات بين الدقة وسرعة الاستدلال والتكلفة الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين PP-YOLOE+، الذي طورته Baidu، و DAMO-YOLO، من مجموعة Alibaba. سنقوم بتحليل بنياتهما وقياسات الأداء وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اتخاذ خيار مستنير لمشاريع الرؤية الحاسوبية الخاصة بهم.

PP-YOLOE+: دقة عالية ضمن نظام PaddlePaddle البيئي

PP-YOLOE+ هو نموذج لاكتشاف الكائنات أحادي المرحلة وخالٍ من المرساة تم تطويره بواسطة Baidu كجزء من مجموعة PaddleDetection الخاصة بهم. تم إصداره في عام 2022، وهو يركز على تحقيق دقة عالية مع الحفاظ على كفاءة معقولة، خاصة داخل إطار التعلم العميق PaddlePaddle.

تفاصيل فنية:

البنية والميزات الرئيسية

يعتمد PP-YOLOE+‎‏ على عائلة YOLO مع العديد من التحسينات الرئيسية التي تهدف إلى تحسين المفاضلة بين الدقة والسرعة.

  • تصميم بدون مربعات ارتكاز (Anchor-Free): من خلال إلغاء مربعات الارتكاز المحددة مسبقًا، يبسط PP-YOLOE+ مسار الكشف ويقلل من تعقيد ضبط المعلمات الفائقة. هذا النهج شائع في الكاشفات الحديثة، بما في ذلك العديد من نماذج Ultralytics YOLO. يمكنك معرفة المزيد حول الكاشفات الخالية من الارتكاز في مسرد المصطلحات الخاص بنا.
  • مكونات فعالة: يستخدم النموذج عمودًا فقريًا من نوع CSPRepResNet لاستخراج ميزات قوية ورقبة Path Aggregation Network (PAN) لدمج الميزات بشكل فعال عبر النطاقات.
  • رأس منفصل: يفصل مهام التصنيف والانحدار في رأس الاكتشاف، وهي تقنية معروفة بتحسين الأداء عن طريق منع التداخل بين المهمتين.
  • تعلم محاذاة المهام (TAL): يستخدم PP-YOLOE+ دالة فقدان متخصصة لتحسين مواءمة درجات التصنيف ودقة التوطين، مما يؤدي إلى تنبؤات أكثر دقة.

نقاط القوة والضعف

  • نقاط القوة: يُعرف PP-YOLOE+ بدقته العالية، خاصة في تكويناته الأكبر (l, x). تم تصميم تصميمه بشكل جيد ومُحسَّن لنظام PaddlePaddle البيئي، مما يجعله خيارًا قويًا للمطورين الذين يعملون بالفعل داخل هذا الإطار.
  • نقاط الضعف: القيد الأساسي هو اعتماده على إطار عمل PaddlePaddle. قد يواجه مستخدمو أطر العمل الأكثر شيوعًا مثل PyTorch تحديات في التكامل والنشر. علاوة على ذلك، قد يكون دعم المجتمع والموارد المتاحة أقل شمولاً من تلك الخاصة بالنماذج المعتمدة على نطاق أوسع.

حالات الاستخدام

يُعد PP-YOLOE+ مناسبًا تمامًا للتطبيقات التي تكون فيها الدقة العالية ذات أهمية قصوى وتعتمد بيئة التطوير على PaddlePaddle. تتضمن حالات الاستخدام الشائعة ما يلي:

تعرف على المزيد حول PP-YOLOE+

DAMO-YOLO: طريقة سريعة ودقيقة من علي بابا

DAMO-YOLO هو نموذج للكشف عن الأجسام تم تطويره بواسطة باحثين في مجموعة علي بابا. يهدف هذا النموذج، الذي تم تقديمه في أواخر عام 2022، إلى تطوير أحدث التقنيات في مجال المفاضلة بين السرعة والدقة من خلال دمج العديد من التقنيات المبتكرة، بدءًا من البحث عن بنية الشبكة ووصولًا إلى استراتيجيات تعيين التسميات المتقدمة.

تفاصيل فنية:

البنية والميزات الرئيسية

يقدم DAMO-YOLO مجموعة من التقنيات لتحقيق أدائه المذهل.

  • البحث في الهندسة العصبية (NAS): يستخدم NAS للعثور على بنية عمود فقري مثالية (MAE-NAS)، مما يؤدي إلى أداة استخلاص ميزات عالية الكفاءة.
  • عنق RepGFPN الفعال: يتضمن النموذج تصميم عنق جديدًا، RepGFPN، وهو مصمم لدمج الميزات متعددة المقاييس بكفاءة مع زمن انتقال منخفض.
  • ZeroHead: يقترح DAMO-YOLO "ZeroHead" الذي يقلل بشكل كبير من النفقات الحسابية لرأس الكشف، ويفصله عن العنق ويزيد من تحسين السرعة.
  • تعيين تسميات AlignedOTA: يستخدم استراتيجية ديناميكية لتعيين التسميات تسمى AlignedOTA، والتي تعمل على مواءمة مهام التصنيف والانحدار لتحديد عينات إيجابية عالية الجودة أثناء التدريب، ممّا يعزز الدقة.
  • تقطير المعرفة: يتم تحسين عملية التدريب باستخدام تقطير المعرفة لزيادة تحسين أداء النماذج الأصغر.

نقاط القوة والضعف

  • نقاط القوة: الميزة الرئيسية لـ DAMO-YOLO هي توازنها الاستثنائي بين السرعة والدقة، خاصة بالنسبة لنماذجها الأصغر. تجعل المكونات المبتكرة مثل MAE-NAS و ZeroHead أحد أسرع الكاشفات المتاحة لمستوى mAP معين.
  • نقاط الضعف: على الرغم من قوته، إلا أن DAMO-YOLO هو نموذج يركز على البحث. قد يكون تنفيذه أقل سلاسة وسهولة في الاستخدام مقارنة بالأطر الجاهزة للإنتاج. النظام البيئي المحيط به ليس شاملاً، مما قد يجعل التدريب والنشر أكثر صعوبة لغير الخبراء.

حالات الاستخدام

تجعل سرعة DAMO-YOLO مرشحًا ممتازًا للتطبيقات التي تتطلب الاستدلال في الوقت الفعلي، خاصة على الأجهزة ذات الموارد المحدودة.

  • الأنظمة الذاتية: مناسب للروبوتات والطائرات بدون طيار حيث يكون زمن الوصول المنخفض أمرًا بالغ الأهمية.
  • الذكاء الاصطناعي الطرفي (Edge AI): تم تحسين النماذج الصغيرة والسريعة (t, s) للنشر على الأجهزة الطرفية مثل NVIDIA Jetson.
  • المراقبة بالفيديو: معالجة تدفقات الفيديو بكفاءة لتطبيقات مثل منع السرقة أو مراقبة حركة المرور.

تعرف على المزيد حول DAMO-YOLO

تحليل الأداء: PP-YOLOE+ مقابل DAMO-YOLO

عند مقارنة النموذجين، نلاحظ مقايضات متميزة. يوفر DAMO-YOLO عمومًا سرعة فائقة لحجمه، بينما يتوسع PP-YOLOE+ لتحقيق دقة أعلى مع متغيراته الأكبر.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

من الجدول، يحقق DAMO-YOLOt معدل mAP أعلى (42.0) مع استدلال أسرع (2.32 مللي ثانية) من PP-YOLOE+t (39.9 mAP، 2.84 مللي ثانية). ومع ذلك، فإن PP-YOLOE+s أكثر كفاءة في المعلمات وعمليات الفلوبس (FLOPs). في النهاية العالية، تصل PP-YOLOE+x إلى أعلى دقة (54.7 mAP) ولكن بتكلفة كبيرة من حيث الحجم والكمون.

ميزة Ultralytics: لماذا تختار YOLO11؟

في حين أن كلاً من PP-YOLOE+ و DAMO-YOLO يقدمان ميزات مقنعة، يجب على المطورين الذين يبحثون عن حل شامل وعالي الأداء وسهل الاستخدام أن يفكروا في Ultralytics YOLO11. إنه يمثل تتويجًا لسنوات من البحث والتطوير، مما يوفر مزيجًا مثاليًا من الأداء وسهولة الاستخدام.

  • سهولة الاستخدام: تُعرف نماذج Ultralytics بتجربة المستخدم المبسطة. بفضل واجهة برمجة تطبيقات Python البسيطة و الوثائق الشاملة والعديد من الأدلة، فإن البدء سريع للغاية.
  • نظام بيئي مُدار بشكل جيد: توفر Ultralytics نظامًا بيئيًا شاملاً يتضمن تطويرًا نشطًا على GitHub، ودعمًا قويًا من المجتمع، ومنصة Ultralytics HUB لتدريب النماذج ونشرها وإدارتها بدون تعليمات برمجية.
  • موازنة الأداء: تم تصميم YOLO11 لتوفير توازن ممتاز بين السرعة والدقة، مما يجعله مناسبًا لمجموعة واسعة من سيناريوهات النشر في العالم الحقيقي، بدءًا من خوادم الحوسبة السحابية إلى الأجهزة الطرفية منخفضة الطاقة.
  • تنوع الاستخدامات: على عكس أجهزة الكشف المتخصصة، فإن نماذج Ultralytics YOLO هي مراكز قوة متعددة المهام. يمكن لنموذج YOLO11 واحد أداء اكتشاف الكائنات، والتقسيم، والتصنيف، وتقدير الوضعيات، مما يوفر مرونة لا مثيل لها.
  • كفاءة التدريب: مع الأوزان المُدرَّبة مسبقًا المتاحة بسهولة وعملية التدريب الفعالة، يمكن للمستخدمين تحقيق أحدث النتائج على مجموعات البيانات المخصصة بأقل جهد. تم أيضًا تحسين نماذج Ultralytics لتقليل استخدام الذاكرة أثناء التدريب والاستدلال مقارنة بالعديد من البدائل.

بالنسبة للمطورين الذين يبحثون عن نموذج قوي ومتعدد الاستخدامات وسهل الاستخدام، فإن نماذج Ultralytics الأخرى مثل YOLOv8 و YOLOv10 توفر أيضًا مزايا كبيرة مقارنةً بـ PP-YOLOE+ و DAMO-YOLO.

الخلاصة

يعتبر كل من PP-YOLOE+ و DAMO-YOLO من نماذج الكشف عن الأجسام القوية التي طورت هذا المجال. يعتبر PP-YOLOE+ منافسًا قويًا للمستخدمين الذين يعطون الأولوية للدقة العالية داخل نظام PaddlePaddle البيئي. يتفوق DAMO-YOLO في تقديم سرعة استثنائية، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي.

ومع ذلك، بالنسبة لمعظم المطورين والباحثين، تقدم عائلة Ultralytics YOLO، وخاصة أحدث YOLO11، الحزمة الأكثر إقناعًا. إن الجمع بين الأداء العالي والتنوع عبر مهام الرؤية المتعددة وسهولة الاستخدام ونظام بيئي داعم ويتم صيانته جيدًا يجعلها الخيار الأفضل لبناء حلول الذكاء الاصطناعي من الجيل التالي.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات