DAMO-YOLO مقابل PP-YOLOE+: مقارنة تقنية مفصلة

في بيئة الرؤية الحاسوبية في الوقت الفعلي التي تتسم بالتنافسية الشديدة، من الضروري اختيار البنية المثلى لاحتياجات النشر الخاصة بك. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLO و PP-YOLOE+، ويتعمق في تصميماتهما المعمارية ومنهجيات التدريب ومقاييس الأداء. سنقوم أيضًا بفحص كيفية مقارنة هذه النماذج بالحلول الحديثة مثل Ultralytics الذي تم إصداره مؤخرًا.

نظرات عامة على النموذج

ظهرت كلتا الأطر في عام 2022 كبدائل قوية للتطبيقات الصناعية، مستفيدة من التقنيات المتطورة لدفع حدود الدقة وسرعة الاستدلال.

DAMO-YOLO

طورت مجموعة Alibaba GroupYOLO التيYOLO عدة تقنيات مبتكرة لتحسين التوازن بين زمن الاستجابة والدقة، معتمدة بشكل كبير على تقنيات البحث الآلي ودمج الميزات المتقدمة.

المؤلفون: شيانزه شو، ييتشي جيانغ، ويهوا تشن، ييلون هوانغ، يوان تشانغ، وشيويو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv: DAMO-YOLO: تقرير حول تصميم detect الكائنات في الوقت الفعلي
GitHub: YOLO
المستندات: YOLO

يستخدم DAMO-YOLO بحثًا عن البنية متعدد المقاييس (MAE-NAS) لتصميم هياكل العمود الفقري تلقائيًا والمحسّنة لكفاءة الأجهزة. كما يتميز بشبكة RepGFPN فعالة (شبكة هرمية للميزات المعممة ذات المعلمات المعاد تعريفها) لدمج ميزات الرقبة وتصميم "ZeroHead" خفيف الوزن. علاوة على ذلك، يعتمد بشكل كبير على تقنيات التقطير أثناء التدريب لتعزيز قوة تمثيل النموذج الطالب.

تعرف على المزيد حول DAMO-YOLO

PP-YOLOE+

من PaddlePaddle Baidu PaddlePaddle PP-YOLOE+ هو ترقية تدريجية لهيكل PP-YOLOE. وهو يركز على التدريب المسبق على نطاق واسع ووظائف الخسارة المحسنة لتقديم mAP عالي، خاصة ضمن إطار العمل الأصلي للتعلم العميق.

المؤلفون: PaddlePaddle Authors
المنظمة: بايدو
التاريخ: 2022-04-02
أرشيف: PP-YOLOE: نسخة مطورة من YOLO
GitHub: PaddlePaddle
المستندات: تكوينات PP-YOLOE+

يستخدم PP-YOLOE+ هيكل CSPRepResNet و ET-head (رأس فعال ومتوافق مع المهام). تقدم النسخة "plus" استراتيجية تدريب مسبق قوية على مجموعة بيانات Objects365، مما يعزز بشكل كبير قدرتها على التعميم عبر بيئات متنوعة في العالم الحقيقي.

تعرف على المزيد حول PP-YOLOE+

مقارنة معمارية

يؤثر الاختلاف في فلسفة التصميم بين هذين الطرازين بشكل كبير على حالات الاستخدام المثالية وتوافق الأجهزة.

دمج الميزات والبنى الأساسية

الهياكل الأساسية التي تم إنشاؤها بواسطة MAE-NAS في DAMO-YOLO مصممة خصيصًا للأجهزة الطرفية، وغالبًا ما توفر نسبة سرعة إلى معلمة مواتية. ومع ذلك، يمكن أن تكون هذه المعماريات المخصصة جامدة ومعقدة للتكيف مع المهام الجديدة مثل instance segmentation. يعمل عنق RepGFPN على تحسين دمج الميزات متعددة المقاييس ولكنه يضيف تعقيدًا أثناء مرحلة تصدير إعادة المعايرة.

يعتمد PP-YOLOE+ على CSPRepResNet الأكثر تقليدية، ولكنه فعال للغاية. في حين أن هذا العمود الفقري يتطلب مساحة معلمات أكبر منYOLO دقة مماثلة، إلا أنه يتميز بثبات عالٍ في التدريب وسهولة في الاندماج في خطوط الإنتاج الحالية. يتعامل رأس ET الخاص به بكفاءة مع التصنيف والانحدار، ولكنه لا يزال يتطلب خطوات معالجة لاحقة مثل Non-Maximum Suppression (NMS).

القضاء على تأخيرات ما بعد المعالجة

يتطلب كل من DAMO-YOLO و PP-YOLOE+ استخدام NMS للمعالجة اللاحقة لمربعات التحديد. إذا كانت زمن استجابة الاستدلال حرجًا، ففكر في استخدام Ultralytics YOLO26، الذي يتميز بـ تصميم خالٍ من NMS من البداية إلى النهاية بشكل أصلي. يلغي هذا النهج الرائد المعالجة اللاحقة لـ NMS للحصول على مسار نشر أسرع وأبسط.

تحليل الأداء والمقاييس

عند تقييم هذه النماذج للإنتاج، فإن التوازن بين الدقة (mAP) وسرعة الاستدلال وحجم المعلمات أمر بالغ الأهمية. فيما يلي مقارنة مباشرة بين المتغيرات الأساسية لهذه النماذج.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

كما يوضح الجدول، يحقق DAMO-YOLO بشكل عام زمن انتقال أقل على النطاقات الصغيرة (s) والمتناهية الصغر (t)، بفضل بنياته الأساسية المحسّنة بواسطة NAS. ومع ذلك، يتوسع PP-YOLOE+ بشكل لا يصدق إلى المستويات المتوسطة (m) والكبيرة (l)، ويفخر بدرجات mAP أعلى بكثير، وإن كان ذلك على حساب طفيف لسرعة T4 TensorRT.

متطلبات الذاكرة وكفاءة التدريب

يعتمد DAMO-YOLO على التقطير، مما يعني أنك غالبًا ما تحتاج إلى تدريب نموذج معلم أكبر بكثير قبل تدريب نموذج الطالب الأصغر. هذا يزيد بشكل كبير من متطلبات ذاكرة CUDA والميزانية الحسابية الإجمالية. يبسط PP-YOLOE+ هذا باستخدام التدريب القياسي أحادي المرحلة ولكنه يظل مرتبطًا بإحكام بإطار عمل PaddlePaddle، مما قد يحد من المرونة للفرق المعتادة على PyTorch.

في المقابل، يحل نموذج Ultralytics YOLO26 الحديث هذه الاختناقات. باستخدام مُحسّن MuSGD الجديد—وهو هجين من SGD و Muon مستوحى من ابتكارات تدريب نماذج اللغات الكبيرة (LLM)—يحقق YOLO26 تقاربًا أسرع وتدريبًا مستقرًا للغاية دون الحاجة إلى مسارات تقطير معقدة. بالإضافة إلى ذلك، تتطلب نماذج YOLO عادةً ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالكاشفات القائمة على المحولات مثل RT-DETR.

تطبيقات في العالم الحقيقي وحالات استخدام مثالية

متى تستخدم DAMO-YOLO

DAMO-YOLO مثالي للاستدلال عالي الإنتاجية على الأجهزة الطرفية حيث يكون زمن الاستجابة هو الاختناق الأقصى. تتفوق متغيراته الصغيرة في بيئات مثل أنظمة إدارة المرور أو مراقبة الطائرات بدون طيار الأساسية، شريطة أن يمتلك فريقك الهندسي القدرة على إدارة عمليات التقطير وإعادة المعلمات المعقدة الخاصة به.

متى تستخدم PP-YOLOE+

يتميز PP-YOLOE+ عندما تكون مستثمراً بشكل كبير في نظام Baidu البيئي أو تقوم بتشغيل خوادم على نطاق واسع. mAP المذهل، mAP مناسب لتحليل الصور الطبية المعقدة أو الكشف عن عيوب التصنيع الكثيفة.

ميزة Ultralytics

في حين أن كل منYOLO PP-YOLOE+ يقدمان مزايا محلية محددة، فإن المطورين الذين يبحثون عن أقصى قدر من التنوع والسرعة وسهولة الاستخدام يلجأون باستمرار إلى Ultralytics .

عند ترقية خط أنابيب الرؤية الحاسوبية، يوفر Ultralytics تجربة مطورين لا مثيل لها:

استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع الإزالة الكاملة لـ Distribution Focal Loss (DFL)، يعد YOLO26 سريعًا بشكل ملحوظ على وحدات CPU الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة.
تحسين اكتشاف الأجسام الصغيرة: يتيح دمج دالتي الخسارة ProgLoss وSTAL تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهو أمر حيوي للصور الجوية.
تعدد استخدامات واسع: على عكس PP-YOLOE+ الذي يركز بشكل صارم على detect، يتعامل YOLO26 بسلاسة مع تقدير الوضع، وصناديق الإحاطة الموجهة (obb)، والتجزئة الدلالية مع تحسينات معمارية خاصة بالمهام.

الخلاصة

يمثل DAMO-YOLO و PP-YOLOE+ علامات فارقة مهمة في تطور اكتشاف الكائنات بدون نقاط ارتكاز. دفع DAMO-YOLO حدود البحث عن البنية العصبية لتقليل زمن الاستجابة على الأجهزة الطرفية، بينما أظهر PP-YOLOE+ قوة التدريب المسبق واسع النطاق.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة وسهولة النشر، فإن نموذج Ultralytics هو الخيار الأمثل. بفضل بنيته NMS Python القوية وتكامله السلس مع أدوات مثل Weights & Biases و TensorRT يضمن انتقال مشاريعك بسلاسة من النموذج الأولي إلى الإنتاج.

هل أنت مستعد للبدء؟ اطلع على دليلUltralytics أو قارن المزيد من النماذج في نظرة عامة على YOLO11 YOLO.