تخطي إلى المحتوى

DAMO-YOLO مقابل PP-YOLOE+: مقارنة فنية

يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا يوازن بين الدقة وسرعة الاستدلال والتكلفة الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين DAMO-YOLO، الذي طورته مجموعة Alibaba، و PP-YOLOE+، الذي طورته Baidu. سنقوم بتحليل بنياتهما وقياسات الأداء وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اتخاذ خيار مستنير لمشاريع الرؤية الحاسوبية الخاصة بهم.

في حين أن كلا النموذجين يقدمان تطورات كبيرة، من المهم أيضًا مراعاة بدائل مثل سلسلة Ultralytics YOLO. توفر نماذج مثل Ultralytics YOLO11 توازنًا تنافسيًا للغاية بين الأداء والكفاءة، إلى جانب نظام بيئي سهل الاستخدام ويتم صيانته جيدًا ويسرع التطوير من البحث إلى الإنتاج.

DAMO-YOLO: طريقة سريعة ودقيقة من علي بابا

تم تقديم DAMO-YOLO بواسطة مجموعة Alibaba كطريقة سريعة ودقيقة للكشف عن الأجسام تستفيد من العديد من التقنيات الجديدة لتحقيق توازن فائق بين السرعة والدقة. إنه يعتمد على فلسفة YOLO ولكنه يتضمن مكونات متقدمة لتجاوز حدود الأداء.

تفاصيل فنية:

تعرف على المزيد حول DAMO-YOLO

البنية والميزات الرئيسية

تتميز بنية DAMO-YOLO بدمجها لأحدث التقنيات المكتشفة من خلال البحث عن البنية العصبية (NAS) والتحسينات الأخرى.

  • الأعمدة الفقرية المدعومة بالبحث في الهندسة العصبية (NAS): يستخدم DAMO-YOLO أعمدة فقرية تم إنشاؤها بواسطة MAE-NAS من Alibaba، مما يؤدي إلى أدوات استخلاص ميزات عالية الكفاءة ومصممة خصيصًا لاكتشاف الكائنات.
  • عنق RepGFPN الفعال: يقدم عنقًا جديدًا، وهو شبكة هرم الميزات المعممة (GFPN)، مع إعادة التهيئة لتعزيز دمج الميزات عبر مقاييس مختلفة مع الحفاظ على زمن انتقال منخفض.
  • ZeroHead: يستخدم النموذج رأسًا مبسطًا بدون معلمات يفصل بين مهام التصنيف والانحدار، مما يقلل من النفقات الحسابية ويحسن الأداء.
  • تعيين تصنيفات AlignedOTA: إستراتيجية ديناميكية وتركز على المواءمة لتعيين التصنيفات، AlignedOTA، تستخدم لضمان تحديد أفضل المرساة (anchor) المناسبة أثناء التدريب، مما يؤدي إلى تنبؤات أكثر دقة.
  • تحسين التقطير: تستفيد DAMO-YOLO من تقطير المعرفة لنقل المعرفة من نماذج المعلم الأكبر والأكثر قوة إلى نماذج الطلاب الأصغر، مما يعزز دقتها دون زيادة تكلفة الاستدلال.

نقاط القوة والضعف

نقاط القوة:

  • موازنة ممتازة بين السرعة والدقة: يتفوق DAMO-YOLO في توفير دقة عالية بسرعات استدلال سريعة جدًا، مما يجعله مثاليًا لتطبيقات الوقت الفعلي.
  • فعالة حسابيًا: تم تصميم النموذج ليكون خفيف الوزن من حيث المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs)، وهو أمر مفيد للنشر على الأجهزة محدودة الموارد.
  • بنية مبتكرة: يمثل استخدام NAS و RepGFPN و ZeroHead خطوة كبيرة إلى الأمام في تصميم النماذج الفعالة.

نقاط الضعف:

  • تكامل النظام البيئي: يتم تنفيذ النموذج بشكل أساسي داخل إطار عمل يعتمد على MMDetection، الأمر الذي قد يتطلب جهدًا إضافيًا للاندماج في سير عمل PyTorch القياسي.
  • دعم المجتمع: كنموذج يركز على البحث من مختبر تابع لشركة، قد يكون لديه مجتمع أصغر وعدد أقل من موارد الطرف الثالث مقارنة بالنماذج الأكثر اعتمادًا على نطاق واسع.

PP-YOLOE+: دقة عالية ضمن نظام PaddlePaddle البيئي

PP-YOLOE+، الذي تم تطويره بواسطة Baidu، هو نسخة محسنة من سلسلة PP-YOLOE. وهو كاشف بدون نقاط ارتكاز أحادي المرحلة يعطي الأولوية لتحقيق دقة عالية مع الحفاظ على كفاءة معقولة، خاصة داخل إطار عمل التعلم العميق PaddlePaddle.

تفاصيل فنية:

تعرف على المزيد حول PP-YOLOE+

البنية والميزات الرئيسية

يعتمد PP-YOLOE+‎‏ على أساس قوي خالٍ من المرساة مع العديد من التحسينات الرئيسية التي تهدف إلى تعزيز الأداء.

  • تصميم خالٍ من المربعات المحورية (Anchor-Free Design): من خلال التخلص من المربعات المحورية المحددة مسبقًا، يبسط PP-YOLOE+ مسار الكشف ويقلل من عدد المعلمات الفائقة التي تحتاج إلى ضبط.
  • العمود الفقري CSPRepResNet: يستخدم عمودًا فقريًا قويًا يجمع بين مبادئ CSPNet و RepVGG لإنشاء مستخرج ميزات قوي وفعال.
  • فقدان ورأس متقدمان: يشتمل النموذج على Varifocal Loss ورأس ET-Head فعال (رأس محاذاة المهام الفعال) لتحسين محاذاة مهام التصنيف والتوطين، مما يحسن دقة الكشف.
  • تحسين PaddlePaddle: تم دمج PP-YOLOE+ وتحسينه بعمق لإطار عمل PaddlePaddle، مما يوفر تدريباً واستدلالاً ونشراً سلساً للمستخدمين داخل هذا النظام البيئي.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: تحقق المتغيرات الأكبر من PP-YOLOE+ دقة متطورة في مجموعة بيانات COCO.
  • نماذج قابلة للتطوير: وهي متوفرة بأحجام مختلفة (t, s, m, l, x)، مما يسمح للمستخدمين باختيار نموذج يناسب ميزانيتهم الحسابية المحددة.
  • دعم قوي للنظام البيئي: موثق ومدعوم بشكل جيد داخل مجموعة أدوات PaddleDetection.

نقاط الضعف:

  • الاعتماد على إطار عمل: يمكن أن يكون اعتماده الأساسي على إطار عمل PaddlePaddle عائقًا كبيرًا أمام المطورين والفرق الذين يعتمدون على PyTorch.
  • أقل كفاءة: بالمقارنة مع DAMO-YOLO، غالبًا ما تحتوي نماذج PP-YOLOE+ على المزيد من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) لمستوى مماثل من الدقة، مما يجعلها أكثر كثافة من الناحية الحسابية.

تحليل الأداء: DAMO-YOLO مقابل PP-YOLOE+

يسلط أداء DAMO-YOLO و PP-YOLOE+ الضوء على فلسفات التصميم المختلفة الخاصة بهما. تم تصميم DAMO-YOLO لتحقيق أقصى قدر من الكفاءة، مما يوفر مقايضة أفضل بين السرعة والدقة. في المقابل، تركز PP-YOLOE+ على تجاوز حدود الدقة، خاصة مع نماذجها الأكبر، على حساب متطلبات حسابية أعلى.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

من الجدول، يمكننا ملاحظة:

  • الدقة (mAP): يحقق PP-YOLOE+x أعلى mAP بنسبة 54.7٪، متجاوزًا جميع متغيرات DAMO-YOLO. ومع ذلك، على نطاقات أصغر، تكون نماذج DAMO-YOLO تنافسية للغاية.
  • السرعة: تُظهر نماذج DAMO-YOLO باستمرار سرعات استدلال أسرع على وحدة معالجة الرسوميات T4 مقارنة بنماذج PP-YOLOE+ ذات الحجم المماثل.
  • الكفاءة (المعلمات و FLOPs): DAMO-YOLO أكثر كفاءة بشكل عام. على سبيل المثال، تحقق DAMO-YOLOm نسبة mAP تبلغ 49.2% مع 28.2 مليون معلمة، في حين أن PP-YOLOE+m الأكثر دقة (49.8% mAP) يتطلب 23.43 مليون معلمة ولكنه أبطأ. نموذج PP-YOLOE+x الأكبر أكبر بكثير في كل من المعلمات و FLOPs.

ميزة Ultralytics: لماذا تختار YOLO11؟

في حين أن DAMO-YOLO و PP-YOLOE+ هما نموذجان قويان، إلا أنهما يأتيان مع قيود على النظام البيئي. بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات وسهل الاستخدام وعالي الأداء، فإن Ultralytics YOLO11 هو بديل استثنائي.

تم تصميم نماذج Ultralytics مع إعطاء الأولوية القصوى لتجربة المطور. تشمل المزايا الرئيسية ما يلي:

  • سهولة الاستخدام: واجهة برمجة تطبيقات Python مبسطة، و توثيق شامل، و CLI مباشر يجعل التدريب والتحقق والنشر بسيطًا بشكل لا يصدق.
  • نظام بيئي مُدار بشكل جيد: توفر Ultralytics نظامًا بيئيًا قويًا مع تطوير نشط ودعم مجتمعي قوي على GitHub والتكامل مع Ultralytics HUB لـ MLOps شامل.
  • تنوع الاستخدامات: على عكس الكاشفات المتخصصة، فإن YOLO11 هو نموذج متعدد المهام يدعم الكشف عن الكائنات، والتجزئة، والتصنيف، وتقدير الوضعية خارج الصندوق.
  • كفاءة التدريب: تم تحسين نماذج Ultralytics YOLO لتدريب فعال، وغالبًا ما تتطلب ذاكرة ووقتًا أقل، مع مجموعة غنية من الأوزان المُدرَّبة مسبقًا المتاحة لبدء أي مشروع.

الخلاصة: ما هو النموذج المناسب لك؟

يعتمد الاختيار بين DAMO-YOLO و PP-YOLOE+ بشكل كبير على أولويات مشروعك المحددة ومجموعة التكنولوجيا الحالية.

  • اختر DAMO-YOLO إذا كان هدفك الأساسي هو تحقيق أفضل توازن ممكن بين السرعة والدقة لـ الاستدلال في الوقت الفعلي، خاصة على الأجهزة الطرفية. إنه خيار ممتاز لأولئك الذين يقدرون الكفاءة الحسابية ومرتاحون للعمل مع إطاره القائم على MMDetection.

  • اختر PP-YOLOE+ إذا كان تطبيقك يتطلب أعلى دقة ممكنة وكنت تعمل بالفعل ضمن نظام Baidu PaddlePaddle البيئي أو تخطط لتبنيه. تعد النماذج الأكبر مثالية للتطبيقات عالية المخاطر حيث الدقة هي الأهم.

  • بالنسبة لمعظم المطورين والباحثين، نوصي بـ Ultralytics YOLO11. فهو يوفر مزيجًا مقنعًا من الأداء العالي والتنوع عبر مهام رؤية متعددة وسهولة استخدام لا مثيل لها. يزيل النظام البيئي القوي والذي تتم صيانته جيدًا الاحتكاك المرتبط بالنماذج الخاصة بالإطار، ممّا يسمح لك بالتركيز على بناء ونشر حلول الذكاء الاصطناعي المبتكرة بشكل أسرع.

استكشف مقارنات أخرى



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات