Link to this sectionDAMO-YOLO في مقابل PP-YOLOE+#
في المشهد شديد التنافسية للرؤية الحاسوبية في الوقت الفعلي، يعد اختيار البنية المثلى لاحتياجات النشر الخاصة بك أمراً حاسماً. يقدم هذا الدليل مقارنة تقنية شاملة بين DAMO-YOLO و PP-YOLOE+، مع الغوص في تصاميم معماريتها ومنهجيات التدريب ومقاييس الأداء. سنقوم أيضاً بفحص مدى كفاءة هذه النماذج مقارنة بالحلول الحديثة مثل نموذج Ultralytics YOLO26 الذي تم إصداره مؤخراً.
Link to this sectionنظرة عامة على النماذج#
ظهر كلا الإطارين في عام 2022 كبدائل قوية للتطبيقات الصناعية، حيث استخدما تقنيات متطورة لدفع حدود الدقة وسرعة الاستدلال.
Link to this sectionDAMO-YOLO#
قدمت DAMO-YOLO، التي طورتها Alibaba Group، العديد من التقنيات المبتكرة لتحسين المقايضة بين زمن الوصول والدقة، مع الاعتماد بشكل كبير على تقنيات البحث الآلي ودمج الميزات المتقدم.
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المنظمة: Alibaba Group
- التاريخ: 2022-11-23
- Arxiv: DAMO-YOLO: تقرير حول تصميم كشف الكائنات في الوقت الفعلي
- GitHub: tinyvision/DAMO-YOLO
- الوثائق: DAMO-YOLO README
تستخدم DAMO-YOLO بحثاً معمارياً متعدد المقاييس (MAE-NAS) لتصميم هياكل أساسية (backbones) محسنة تلقائياً لكفاءة الأجهزة. كما تتميز بـ RepGFPN (شبكة هرمية للميزات المعممة المعاد معاييرتها) فعالة لدمج ميزات الرقبة وتصميم "ZeroHead" خفيف الوزن. علاوة على ذلك، فهي تعتمد بشكل كبير على تقنيات التقطير (distillation) أثناء التدريب لتعزيز قوة تمثيل نموذج الطالب.
Link to this sectionPP-YOLOE+#
من فريق PaddlePaddle التابع لـ Baidu، يأتي PP-YOLOE+ كترقية تدريجية لبنية PP-YOLOE. يركز هذا النموذج على التدريب المسبق واسع النطاق ووظائف الخسارة المحسنة لتقديم دقة mAP عالية، خاصة ضمن إطار عمل التعلم العميق الأصلي الخاص به.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: PP-YOLOE: نسخة متطورة من YOLO
- GitHub: PaddlePaddle/PaddleDetection
- الوثائق: إعدادات PP-YOLOE+
يستخدم PP-YOLOE+ هيكلاً أساسياً من نوع CSPRepResNet ورأس ET-head (رأس فعال متوافق مع المهام). تقدم نسخة "plus" استراتيجية تدريب مسبق قوية على مجموعة بيانات Objects365، مما يعزز قدرتها بشكل كبير على التعميم عبر بيئات العالم الحقيقي المتنوعة.
Link to this sectionمقارنة معمارية#
يؤثر الاختلاف في فلسفة التصميم بين هذين النموذجين بشكل كبير على حالات الاستخدام المثالية وتوافق الأجهزة.
Link to this sectionدمج الميزات والهياكل الأساسية (Backbones)#
الهياكل الأساسية التي تم إنشاؤها بواسطة MAE-NAS في DAMO-YOLO مصممة خصيصاً للأجهزة الطرفية (edge devices)، وغالباً ما توفر نسبة مواتية بين السرعة والمعاملات. ومع ذلك، يمكن أن تكون هذه البنى المخصصة جامدة ومعقدة للتكيف مع مهام جديدة مثل تجزئة الكائنات. تعمل رقبة RepGFPN على تحسين دمج الميزات متعددة المقاييس ولكنها تضيف تعقيداً أثناء مرحلة تصدير إعادة المعايرة.
يعتمد PP-YOLOE+ على بنية CSPRepResNet الأكثر تقليدية وفعالية في نفس الوقت. بينما يتطلب هذا الهيكل مساحة معاملات أكبر من DAMO-YOLO لتحقيق دقة مماثلة، إلا أنه مستقر للغاية في التدريب وأسهل في الدمج ضمن مسارات العمل الحالية. يتعامل رأس ET-head الخاص به بكفاءة مع التصنيف والانحدار، ولكنه لا يزال يتطلب خطوات معالجة لاحقة مثل كبت القيم غير القصوى (NMS).
يتطلب كل من DAMO-YOLO و PP-YOLOE+ استخدام NMS لمعالجة صناديق الإحاطة (bounding boxes) لاحقاً. إذا كان زمن الاستدلال أمراً بالغ الأهمية، ففكر في استخدام Ultralytics YOLO26، الذي يتميز بتصميم أصلي نهاية-إلى-نهاية بدون NMS. يلغي هذا النهج الرائد الحاجة إلى معالجة NMS اللاحقة للحصول على مسار نشر أسرع وأبسط.
Link to this sectionتحليل الأداء والمقاييس#
عند تقييم هذه النماذج للإنتاج، يعد التوازن بين الدقة (mAP)، وسرعة الاستدلال، وحجم المعاملات أمراً بالغ الأهمية. فيما يلي مقارنة مباشرة بين متغيراتها الأساسية.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
كما يوضح الجدول، تحقق DAMO-YOLO عموماً زمن وصول أقل على المقاييس الصغيرة (s) والدقيقة جداً (t)، بفضل هياكلها الأساسية المحسنة بواسطة NAS. ومع ذلك، يتوسع PP-YOLOE+ بشكل ممتاز في الفئات المتوسطة (m) والكبيرة (l)، حيث يتميز بنقاط mAP أعلى بشكل ملحوظ، وإن كان ذلك بتكلفة طفيفة على سرعة T4 TensorRT.
Link to this sectionمتطلبات الذاكرة وكفاءة التدريب#
يعني اعتماد DAMO-YOLO على التقطير (distillation) أنك غالباً ما تحتاج إلى تدريب نموذج معلم أكبر بكثير قبل تدريب نموذج الطالب الأصغر. هذا يزيد بشكل كبير من متطلبات ذاكرة CUDA والميزانية الحسابية الإجمالية. يبسط PP-YOLOE+ هذا الأمر من خلال التدريب القياسي أحادي المرحلة، لكنه يظل مرتبطاً بإحكام بإطار عمل PaddlePaddle، مما قد يحد من المرونة للفرق المعتادة على PyTorch.
على النقيض من ذلك، يحل نموذج Ultralytics YOLO26 الحديث هذه الاختناقات. باستخدام محسن MuSGD الجديد—وهو هجين من SGD و Muon مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة—يحقق YOLO26 تقارباً أسرع وتدريباً مستقراً للغاية دون الحاجة إلى مسارات تقطير معقدة. بالإضافة إلى ذلك، تتطلب نماذج YOLO عادةً ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بكاشفات المستندة إلى المحولات (Transformer) مثل RT-DETR.
Link to this sectionتطبيقات العالم الحقيقي وحالات الاستخدام المثالية#
Link to this sectionمتى تستخدم DAMO-YOLO#
تعتبر DAMO-YOLO مثالية لاستدلال الحافة ذي الإنتاجية العالية حيث يكون زمن الوصول هو العائق الأساسي. تتفوق متغيراتها الصغيرة في بيئات مثل أنظمة إدارة المرور أو مراقبة الطائرات بدون طيار الأساسية، بشرط أن يكون لدى فريق الهندسة لديك النطاق الترددي اللازم لإدارة عمليات التقطير وإعادة المعايرة المعقدة الخاصة بها.
Link to this sectionمتى تستخدم PP-YOLOE+#
يتألق PP-YOLOE+ عندما تكون مستثمراً بالفعل بعمق في نظام Baidu البيئي أو عند تشغيل عمليات نشر خادم واسعة النطاق. تجعله دقة mAP المثيرة للإعجاب مناسباً لتحليل الصور الطبية المعقد أو الكشف المكثف عن عيوب التصنيع.
Link to this sectionميزة Ultralytics#
بينما يقدم كل من DAMO-YOLO و PP-YOLOE+ مزايا موضعية محددة، فإن المطورين الذين يسعون للحصول على أقصى قدر من التنوع والسرعة وسهولة الاستخدام يتجهون باستمرار إلى منصة Ultralytics.
عند ترقية مسار عمل الرؤية الحاسوبية الخاص بك، يوفر Ultralytics YOLO26 تجربة مطور لا مثيل لها:
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع الإزالة الكاملة لخسارة التوزيع البؤري (DFL)، يعد YOLO26 سريعاً بشكل ملحوظ على وحدات المعالجة المركزية الطرفية وأجهزة إنترنت الأشياء ذات الطاقة المنخفضة.
- تحسين اكتشاف الكائنات الصغيرة: يوفر دمج وظائف الخسارة ProgLoss و STAL تحسينات كبيرة في التعرف على الكائنات الصغيرة، وهو أمر حيوي للصور الجوية.
- تنوع واسع: على عكس PP-YOLOE+ الذي يركز فقط على الاكتشاف، يتعامل YOLO26 بسلاسة مع تقدير الوضعية، وصناديق الإحاطة الموجهة (OBB)، والتجزئة الدلالية مع تحسينات معمارية خاصة بالمهمة.
Link to this sectionالخلاصة#
يمثل DAMO-YOLO و PP-YOLOE+ معالم مهمة في تطور كشف الكائنات بدون نقاط ارتكاز (anchor-free). دفع DAMO-YOLO حدود البحث في البنية العصبية لزمن وصول الحافة، بينما أظهر PP-YOLOE+ قوة التدريب المسبق واسع النطاق.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة وبساطة النشر، فإن نموذج Ultralytics YOLO26 هو الخيار النهائي. إن بنيته الخالية من NMS، وواجهة Python البرمجية القوية، والتكامل السلس مع أدوات مثل Weights & Biases و TensorRT تضمن انتقال مشاريعك بسلاسة من النموذج الأولي إلى الإنتاج.
هل أنت مستعد للبدء؟ استكشف دليل البدء السريع لـ Ultralytics أو قارن بين المزيد من النماذج في نظرتنا العامة YOLO11 في مقابل DAMO-YOLO.