YOLO PP-YOLOE+: مقارنة تقنية مفصلة
في بيئة الرؤية الحاسوبية في الوقت الفعلي التي تتسم بالتنافسية الشديدة، من الضروري اختيار البنية المثلى لاحتياجات النشر الخاصة بك. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLO و PP-YOLOE+، ويتعمق في تصميماتهما المعمارية ومنهجيات التدريب ومقاييس الأداء. سنقوم أيضًا بفحص كيفية مقارنة هذه النماذج بالحلول الحديثة مثل Ultralytics الذي تم إصداره مؤخرًا.
نظرات عامة على النموذج
ظهر كلا الإطارين في عام 2022 كبديلين قويين للتطبيقات الصناعية، حيث استفادا من تقنيات متطورة لتوسيع حدود الدقة وسرعة الاستدلال.
DAMO-YOLO
طورت مجموعة Alibaba GroupYOLO التيYOLO عدة تقنيات مبتكرة لتحسين التوازن بين زمن الاستجابة والدقة، معتمدة بشكل كبير على تقنيات البحث الآلي ودمج الميزات المتقدمة.
- المؤلفون: شيانزه شو، ييكي جيانغ، ويهوا تشين، ييلون هوانغ، يوان تشانغ، وشيويو سون
- المنظمة: مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv: YOLO: تقرير عن تصميم الكشف عن الأجسام في الوقت الفعلي
- GitHub: YOLO
- المستندات: YOLO
YOLO بحثًا متعدد المستويات للهندسة المعمارية (MAE-NAS) لتصميم أساسيات مُحسّنة تلقائيًا لكفاءة الأجهزة. كما يتميز بشبكة RepGFPN (شبكة هرمية عامة معاد تقييم معلماتها) فعالة لدمج معالم العنق وتصميم "ZeroHead" خفيف الوزن. علاوة على ذلك، يعتمد بشكل كبير على تقنيات التقطير أثناء التدريب لتعزيز قوة تمثيل نموذج الطالب.
PP-YOLOE+
من PaddlePaddle Baidu PaddlePaddle PP-YOLOE+ هو ترقية تدريجية لهيكل PP-YOLOE. وهو يركز على التدريب المسبق على نطاق واسع ووظائف الخسارة المحسنة لتقديم mAP عالي، خاصة ضمن إطار العمل الأصلي للتعلم العميق.
- المؤلفون: PaddlePaddle Authors
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv: PP-YOLOE: نسخة مطورة من YOLO
- GitHub: PaddlePaddle
- المستندات: تكوينات PP-YOLOE+
يستخدم PP-YOLOE+ هيكل CSPRepResNet و ET-head (رأس فعال ومتوافق مع المهام). تقدم النسخة "plus" استراتيجية تدريب مسبق قوية على مجموعة بيانات Objects365، مما يعزز بشكل كبير قدرتها على التعميم عبر بيئات متنوعة في العالم الحقيقي.
مقارنة معمارية
يؤثر الاختلاف في فلسفة التصميم بين هذين الطرازين بشكل كبير على حالات الاستخدام المثالية وتوافق الأجهزة.
دمج الميزات والبنى الأساسية
تتميز البنية الأساسية التي أنشأتها MAE-NASYOLO بأنها مصممة خصيصًا للأجهزة الطرفية، وغالبًا ما توفر نسبة سرعة إلى معلمات مواتية. ومع ذلك، قد تكون هذه البنى المخصصة صارمة ومعقدة بحيث يصعب تكييفها مع مهام جديدة مثل تجزئة المثيلات. تعمل رقبة RepGFPN على تحسين دمج الميزات متعددة النطاقات، ولكنها تضيف تعقيدًا خلال مرحلة إعادة تصدير المعلمات.
يعتمد PP-YOLOE+ على CSPRepResNet الأكثر تقليدية، ولكنه فعال للغاية. في حين أن هذا العمود الفقري يتطلب مساحة معلمات أكبر منYOLO دقة مماثلة، إلا أنه يتميز بثبات عالٍ في التدريب وسهولة في الاندماج في خطوط الإنتاج الحالية. يتعامل رأس ET الخاص به بكفاءة مع التصنيف والانحدار، ولكنه لا يزال يتطلب خطوات معالجة لاحقة مثل Non-Maximum Suppression (NMS).
القضاء على تأخيرات ما بعد المعالجة
يتطلب كلYOLO PP-YOLOE+ NMS الصناديق المحيطة بعد المعالجة. إذا كان زمن الاستدلال حرجًا، ففكر في استخدام Ultralytics ، الذي يتميز بتصميم أصلي شامل NMS. هذا النهج المبتكر يلغي NMS من أجل خط أنابيب نشر أسرع وأبسط.
تحليل الأداء والمقاييس
عند تقييم هذه النماذج للإنتاج، فإن التوازن بين الدقة (mAP) وسرعة الاستدلال وحجم المعلمات أمر بالغ الأهمية. فيما يلي مقارنة مباشرة بين المتغيرات الأساسية لهذه النماذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
كما يوضح الجدول، يحققYOLO زمن انتقال أقل على النطاقات الصغيرة (s) والصغيرة جدًا (t)، بفضل شبكاته الأساسية المُحسّنة لنظام NAS. ومع ذلك، يتوسع PP-YOLOE+ بشكل مذهل إلى المستويات المتوسطة (m) والكبيرة (l)، محققًا mAP أعلى بكثير، وإن كان ذلك على حساب TensorRT T4 TensorRT قليلاً.
متطلبات الذاكرة وكفاءة التدريب
اعتمادYOLO على التقطير يعني أنك غالبًا ما تحتاج إلى تدريب نموذج معلم أكبر بكثير قبل تدريب نموذج الطالب الأصغر. وهذا يزيد بشكل كبير من متطلباتCUDA وميزانية الحوسبة الإجمالية. يعمل PP-YOLOE+ على تبسيط ذلك من خلال التدريب القياسي أحادي المرحلة، ولكنه يظل مرتبطًا ارتباطًا وثيقًا PaddlePaddle مما قد يحد من المرونة للفرق المعتادة على PyTorch.
على النقيض من ذلك، فإن نموذج Ultralytics الحديث يحل هذه العقبات. باستخدام مُحسِّن MuSGDالجديد — وهو مزيج من SGD Muon مستوحى من ابتكارات تدريب LLM — يحقق YOLO26 تقاربًا أسرع وتدريبًا عالي الاستقرار دون الحاجة إلى خطوط إنتاج معقدة. بالإضافة إلى ذلك، تتطلب YOLO عادةً CUDA أقل بكثير أثناء التدريب مقارنةً بأجهزة الكشف القائمة على المحولات مثل RT-DETR.
تطبيقات في العالم الحقيقي وحالات استخدام مثالية
متى تستخدم DAMO-YOLO
YOLO مثاليًا للاستدلال المتطور عالي الإنتاجية حيث يمثل زمن الاستجابة العقبة الأساسية. تتميز متغيراته الصغيرة في بيئات مثل أنظمة إدارة حركة المرور أو المراقبة الأساسية بالطائرات بدون طيار، شريطة أن يكون لدى فريق الهندسة لديك النطاق الترددي اللازم لإدارة عمليات التقطير المعقدة وإعادة تحديد المعلمات.
متى تستخدم PP-YOLOE+
يتميز PP-YOLOE+ عندما تكون مستثمراً بشكل كبير في نظام Baidu البيئي أو تقوم بتشغيل خوادم على نطاق واسع. mAP المذهل، mAP مناسب لتحليل الصور الطبية المعقدة أو الكشف عن عيوب التصنيع الكثيفة.
ميزة Ultralytics
في حين أن كل منYOLO PP-YOLOE+ يقدمان مزايا محلية محددة، فإن المطورين الذين يبحثون عن أقصى قدر من التنوع والسرعة وسهولة الاستخدام يلجأون باستمرار إلى Ultralytics .
عند ترقية خط أنابيب الرؤية الحاسوبية، يوفر Ultralytics تجربة مطورين لا مثيل لها:
- CPU أسرع بنسبة تصل إلى 43٪ CPU : مع الإزالة الكاملة لخسارة التركيز التوزيعي (DFL)، يتميز YOLO26 بسرعة ملحوظة في وحدات المعالجة المركزية المتطورة وأجهزة إنترنت الأشياء منخفضة الطاقة.
- تحسين اكتشاف الأجسام الصغيرة: يوفر دمج وظائف فقدان ProgLoss و STAL تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهو أمر حيوي بالنسبة للصور الجوية.
- تنوع واسع النطاق: على عكس PP-YOLOE+ الذي يركز بشكل صارم على الكشف، يتعامل YOLO26 بسلاسة مع تقدير الوضع، والمربعات المحددة الموجهة (OBB)، والتجزئة الدلالية مع تحسينات معمارية خاصة بالمهمة.
الخلاصة
يمثلYOLO PP-YOLOE+ معالم مهمة في تطور اكتشاف الكائنات بدون مرساة.YOLO حدود البحث في البنية العصبية لزمن الاستجابة، بينما أظهر PP-YOLOE+ قوة التدريب المسبق على نطاق واسع.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة وسهولة النشر، فإن نموذج Ultralytics هو الخيار الأمثل. بفضل بنيته NMS Python القوية وتكامله السلس مع أدوات مثل Weights & Biases و TensorRT يضمن انتقال مشاريعك بسلاسة من النموذج الأولي إلى الإنتاج.
هل أنت مستعد للبدء؟ اطلع على دليلUltralytics أو قارن المزيد من النماذج في نظرة عامة على YOLO11 YOLO.