تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLO11: مقارنة فنية للكشف عن الكائنات

يُعد اختيار نموذج الكشف عن الكائنات الأمثل قرارًا بالغ الأهمية يوازن بين الدقة والسرعة وقيود النشر. تقدم هذه الصفحة مقارنة فنية شاملة بين PP-YOLOE+، وهو نموذج قوي من نظام PaddlePaddle البيئي الخاص بـ Baidu، و Ultralytics YOLO11، وهو أحدث نموذج متطور من Ultralytics. في حين أن كلا النموذجين يقدمان أداءً قويًا، إلا أن YOLO11 يتميز بكفاءته الفائقة وتنوعه ونظامه البيئي سهل الاستخدام، مما يجعله الخيار الموصى به لمجموعة واسعة من تطبيقات الرؤية الحاسوبية الحديثة.

PP-YOLOE+: دقة عالية ضمن نظام PaddlePaddle البيئي

PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) هو نموذج لاكتشاف الكائنات تم تطويره بواسطة Baidu كجزء من مجموعة PaddleDetection الخاصة بهم. تم إصداره في عام 2022، وهو يركز على تحقيق دقة عالية مع الحفاظ على كفاءة معقولة، خاصة داخل إطار عمل التعلم العميق PaddlePaddle.

تفاصيل فنية:

البنية والميزات الرئيسية

PP-YOLOE+ هو كاشف خالٍ من المرساة أحادي المرحلة يعتمد على بنية YOLO مع العديد من التحسينات الرئيسية. يهدف تصميمه إلى تحسين المفاضلة بين السرعة والدقة.

  • تصميم خالٍ من المربعات المحورية (Anchor-Free Design): من خلال التخلص من المربعات المحورية المحددة مسبقًا، يبسط النموذج مسار الكشف ويقلل من تعقيد ضبط المعلمات الفائقة.
  • مكونات فعالة: غالبًا ما تستخدم الهندسة المعمارية أعمدة فقرية مثل CSPRepResNet ورقبة Path Aggregation Network (PAN) لدمج الميزات بشكل فعال.
  • تعلم محاذاة المهام (TAL): يستخدم دالة فقدان متخصصة واستراتيجية تعيين التسمية لتحسين مواءمة مهام التصنيف والتوطين، مما يساعد على تحسين دقة الكشف الإجمالية.
  • تكامل PaddlePaddle: تم دمج النموذج وتحسينه بعمق لإطار عمل PaddlePaddle، مما يجعله خياراً طبيعياً للمطورين الذين يعملون بالفعل داخل هذا النظام البيئي.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: تحقق نماذج PP-YOLOE+، وخاصة المتغيرات الأكبر، درجات mAP تنافسية في المعايير القياسية مثل مجموعة بيانات COCO.
  • رأس فعال بدون نقاط ارتكاز: تصميم رأس الاكتشاف مبسط لتحقيق الكفاءة.

نقاط الضعف:

  • الاعتماد على إطار عمل: يمكن أن يكون تحسينه الأساسي لـ PaddlePaddle قيدًا على المجتمع الواسع من المطورين الذين يستخدمون PyTorch، مما يتطلب تحويل إطار العمل واحتمال فقدان تحسينات الأداء.
  • استخدام أعلى للموارد: كما هو موضح في جدول الأداء، تحتوي نماذج PP-YOLOE+ بشكل عام على عدد معلمات أعلى وعمليات فاصلة عائمة في الثانية (FLOPs) أكثر مقارنة بنماذج YOLO11 عند مستويات دقة مماثلة، مما يؤدي إلى تكلفة حسابية أكبر.
  • تعددية المهام محدودة: يركز PP-YOLOE+ بشكل أساسي على اكتشاف الكائنات، في حين أن أطر العمل الحديثة الأخرى توفر دعمًا متكاملاً لمجموعة واسعة من مهام الرؤية.

تعرف على المزيد حول PP-YOLOE+

Ultralytics YOLO11: أحدث ما توصلت إليه الأداء والتنوع

Ultralytics YOLO11 هو أحدث تطور في سلسلة YOLO، التي طورها Glenn Jocher و Jing Qiu في Ultralytics. تم إصداره في عام 2024، وهو يضع معياراً جديداً لاكتشاف الكائنات في الوقت الفعلي من خلال تقديم توازن استثنائي بين السرعة والدقة والكفاءة. لقد تم تصميمه من الألف إلى الياء ليكون متعدد الاستخدامات وسهل الاستخدام وقابلاً للنشر عبر مجموعة واسعة من الأجهزة.

تفاصيل فنية:

البنية والميزات الرئيسية

تعتمد YOLO11 على الأساس الناجح لأسلافها مثل YOLOv8 بهندسة محسنة تعزز استخراج الميزات وسرعة المعالجة.

  • هندسة معمارية محسّنة: يتميز YOLO11 بتصميم شبكة مبسط يحقق دقة أعلى مع عدد أقل بكثير من المعلمات وعدد أقل من عمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بالمنافسين مثل PP-YOLOE+. هذه الكفاءة ضرورية للاستدلال في الوقت الفعلي والنشر على الأجهزة الطرفية ذات الموارد المحدودة.
  • تعدد الاستخدامات: إحدى الميزات الرئيسية في YOLO11 هي دعمها الأصلي لمهام رؤية الكمبيوتر المتعددة ضمن إطار عمل واحد وموحد. ويشمل ذلك اكتشاف الأجسام، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضعية، والصناديق المحيطة الموجهة (OBB).
  • سهولة الاستخدام: YOLO11 هو جزء من نظام Ultralytics البيئي الذي يتم صيانته جيدًا والذي يعطي الأولوية لتجربة المستخدم. فهو يوفر واجهة برمجة تطبيقات Python بسيطة و CLI و وثائق شاملة وأوزانًا مُدرَّبة مسبقًا متاحة بسهولة.
  • كفاءة التدريب: تم تصميم النموذج لأوقات تدريب أسرع ويتطلب ذاكرة أقل، مما يجعل الذكاء الاصطناعي الحديث في متناول المطورين والباحثين. يتناقض هذا مع أنواع النماذج الأخرى مثل المحولات، والتي غالبًا ما تكون أبطأ في التدريب وتتطلب المزيد من الموارد الحسابية.
  • نظام بيئي نشط: يستفيد المستخدمون من التطوير النشط والدعم المجتمعي القوي عبر GitHub و Discord والتكامل السلس مع أدوات مثل Ultralytics HUB لـ MLOps شامل.

نقاط القوة والضعف

نقاط القوة:

  • توازن أداء فائق: يوفر مقايضة ممتازة بين السرعة والدقة عبر جميع أحجام النماذج.
  • الكفاءة الحسابية: يؤدي انخفاض عدد المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) إلى استدلال أسرع وتقليل متطلبات الأجهزة.
  • دعم المهام المتعددة: تعدد استخدامات لا مثيل له مع دعم مدمج لخمس مهام رؤية رئيسية.
  • نظام بيئي سهل الاستخدام: سهل التثبيت والتدريب والنشر، مدعومًا بموارد واسعة ومجتمع قوي.
  • مرونة النشر: مُحسَّن لمجموعة واسعة من الأجهزة، من Raspberry Pi إلى الخوادم السحابية.

نقاط الضعف:

  • باعتباره كاشفًا أحادي المرحلة، قد يواجه تحديات مع الأجسام الصغيرة للغاية مقارنةً ببعض الكواشف ثنائية المرحلة المتخصصة.
  • لا تزال النماذج الأكبر (مثل YOLO11x) تتطلب قوة حسابية كبيرة للأداء في الوقت الفعلي، على الرغم من أنها أقل من نماذج المنافسين المماثلة.

تعرف على المزيد حول YOLO11

تحليل الأداء: PP-YOLOE+ مقابل YOLO11

توضح معايير الأداء على مجموعة بيانات COCO بوضوح مزايا YOLO11.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
  • الدقة مقابل الكفاءة: في النهاية العالية، يطابق YOLO11x قيمة 54.7 mAP لـ PP-YOLOE+x ولكنه يفعل ذلك مع 58٪ فقط من المعلمات (56.9 مليون مقابل 98.42 مليون) وعدد أقل من FLOPs. يستمر هذا الاتجاه في الانخفاض؛ على سبيل المثال، يتفوق YOLO11l على PP-YOLOE+l في الدقة (53.4 مقابل 52.9 mAP) مع أقل من نصف المعلمات.
  • سرعة الاستدلال: تُظهر نماذج YOLO11 باستمرار سرعات استدلال أسرع على وحدة معالجة الرسوميات GPU. على سبيل المثال، YOLO11l أسرع بنسبة تزيد عن 25٪ من PP-YOLOE+l على وحدة معالجة الرسوميات T4، بينما YOLO11x أسرع بنسبة تزيد عن 20٪ من PP-YOLOE+x. هذه الميزة في السرعة ضرورية للتطبيقات التي تتطلب معالجة في الوقت الفعلي، مثل المركبات ذاتية القيادة و الروبوتات.
  • قابلية التوسع: يوفر YOLO11 منحنى توسع أكثر كفاءة. يمكن للمطورين تحقيق دقة عالية دون الأعباء الحسابية الهائلة المرتبطة بنماذج PP-YOLOE+ الأكبر، مما يجعل الذكاء الاصطناعي المتقدم أكثر سهولة.

الخلاصة والتوصية

في حين أن PP-YOLOE+ هو كاشف كائنات قادر، إلا أن نقاط قوته تظهر بشكل أوضح للمستخدمين الملتزمين بالفعل بنظام Baidu PaddlePaddle البيئي.

بالنسبة للغالبية العظمى من المطورين والباحثين والشركات، يعد Ultralytics YOLO11 هو الخيار الواضح والأفضل. فهو يوفر مزيجًا حديثًا من الدقة والكفاءة، مما يقلل بشكل كبير من التكاليف الحسابية ويتيح النشر على مجموعة واسعة من الأجهزة. إن تنوعه الذي لا مثيل له عبر خمس مهام رؤية مختلفة، إلى جانب نظام بيئي سهل الاستخدام ومدعوم جيدًا، يمكّن المستخدمين من بناء حلول ذكاء اصطناعي أكثر تعقيدًا وقوة بجهد أقل.

سواء كنت تقوم بالتطوير للحافة أو السحابة، فإن YOLO11 يوفر الأداء والمرونة وإمكانية الوصول اللازمة لتجاوز حدود الممكن في الرؤية الحاسوبية.

نماذج أخرى يجب أخذها في الاعتبار

إذا كنت تستكشف هياكل أخرى، فقد تكون مهتمًا أيضًا بمقارنات مع نماذج مثل YOLOv10 و YOLOv9 و RT-DETR، والتي يتم دعمها أيضًا داخل إطار Ultralytics.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات