تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv10: مقارنة فنية شاملة

يعد اختيار النموذج الصحيح للكشف عن الأجسام قرارًا محوريًا يؤثر على كفاءة أنظمة الرؤية الحاسوبية ودقتها وقابليتها للتطوير. تُحلل هذه المقارنة التفصيلية نموذج PP-YOLOE+، وهو كاشف محسّن خالٍ من المرساة من نظام PaddlePaddle من بايدو، و YOLOv10، وهو كاشف ثوري متكامل في الوقت الحقيقي من جامعة تسينغهوا مدمج بالكامل في نظام Ultralytics البيئي.

تمثل هذه النماذج نهجين متميزين لحل المفاضلة بين السرعة والدقة. من خلال فحص ابتكاراتهما المعمارية ومقاييس الأداء وحالات الاستخدام المثالية، نقدم الرؤى اللازمة لاختيار أفضل أداة لتطبيقك المحدد.

PP-YOLOE+: الدقة في نظام PaddlePaddle البيئي

PP-YOLOE+ (PP-YOLOE+ ) هو تطوير لبنية PP-YOLOE+ ( PaddlePaddle عملي لا تنظر إلا إلى مستوى واحد فعال بالإضافة إلى ذلك) هو تطور لبنية PP-YOLOE، مصمم لتوفير آليات كشف عالية الدقة. تم تطويره بواسطة Baidu، وهو بمثابة نموذج رئيسي ضمن PaddlePaddle مع التركيز على التحسين للتطبيقات الصناعية حيث تكون بيئات الأجهزة محددة مسبقًا.

المؤلفون: PaddlePaddle المؤلفون
المنظمة:بايدو
التاريخ: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:PaddleDetection Repository
المستندات:PP-YOLOE+ توثيق

الميزات المعمارية الرئيسية

يتميز PP-YOLOE+ عن غيره من خلال العديد من التحسينات الهيكلية التي تهدف إلى تحسين تمثيل الميزة وتحديد موقعها:

  • آلية خالية من المرساة: يستخدم نهجًا خاليًا من المرساة لتقليل تعقيد ضبط المعلمة الفائقة وتحسين التعميم عبر أشكال الكائنات.
  • العمود الفقري CSPRepResNet: يدمج الشبكات الجزئية المتقاطعة (CSP) مع شبكة RepResNet، مما يوفر إمكانات قوية لاستخراج الميزات التي توازن بين العبء الحسابي وقوة التمثيل.
  • تعلُّم محاذاة المهام (TAL): يستخدم دالة خسارة متخصصة تعمل على مواءمة درجات التصنيف ديناميكيًا مع دقة التوطين، مما يضمن أن تكون عمليات الكشف عالية الثقة هي الأكثر دقة أيضًا.
  • الرأس الفعال (ET-Head): رأس كشف مبسط يفصل بين مهام التصنيف والانحدار لتقليل التداخل وتحسين سرعة التقارب.

تعرف على المزيد حول PP-YOLOE+

YOLOv10: ثورة الوقت الحقيقي NMS

YOLOv10 يمثل نقلة نوعية في سلالة YOLO . تم تطويره من قِبل باحثين في جامعة تسينغهوا، وهو يعالج عنق الزجاجة التاريخي المتمثل في الكبت غير الأقصى (NMS) من خلال تقديم تعيينات مزدوجة متسقة للتدريب NMS. وهذا يسمح بالنشر الحقيقي من طرف إلى طرف مع تقليل زمن انتقال الاستدلال بشكل كبير.

المؤلفون: Ao Wang, Hui Chen, Lihao Liu, et al.
المنظمة:جامعة تسينغهوا
التاريخ: 2024-05-23
ArXiv:https://arxiv.org/abs/2405.14458
GitHub:YOLOv10 مستودع
المستندات:Ultralytics YOLOv10 Docs

الابتكار وتكامل النظام البيئي

YOLOv10 ليس مجرد تحديث معماري؛ بل هو تصميم شامل قائم على الكفاءة.

  • تدريبNMS: من خلال اعتماد استراتيجية التعيين المزدوج للتسميات - من واحد إلى متعدد للإشراف الغني ومن واحد إلى واحد للاستدلال الفعال - يلغي برنامج YOLOv10 الحاجة إلى المعالجة اللاحقة NMS . وهذا يقلل من زمن الاستنتاج وتعقيد النشر.
  • تصميم شامل للكفاءة: يتميّز برؤوس تصنيف خفيفة الوزن وتقليل التجميعات المنفصلة للقنوات المكانية لزيادة الاحتفاظ بالمعلومات إلى أقصى حد مع تقليل عدد وحدات FLOP.
  • تكاملUltralytics : كجزء من نظام Ultralytics البيئي، يستفيد YOLOv10 من سهولة الاستخدام عبر واجهة برمجة تطبيقات Python الموحّدة، مما يجعلها متاحة للمطورين لتدريب النماذج والتحقق من صحتها ونشرها دون عناء.
  • كفاءة الذاكرة: تم تحسين البنية لتخفيض استهلاك الذاكرة أثناء التدريب، وهي ميزة كبيرة مقارنةً بالكاشفات القائمة على المحولات أو التكرارات القديمة لـ YOLO .

اعرف المزيد عن YOLOv10

تحليل الأداء الفني

تبرز المقاييس التالية الاختلافات في الأداء بين النموذجين. يُظهر YOLOv10 كفاءة أعلى باستمرار، حيث يوفر دقة أعلى مع عدد أقل من المعلمات وزمن استجابة أقل.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

تفسير الكفاءة والسرعة

تكشف البيانات عن ميزة واضحة لـ YOLOv10 من حيث توازن الأداء.

  • كفاءة المعلمات: يحقق YOLOv10l كفاءة mAP المعلمات (53.3%) أعلى من YOLOv10l (52.9%) مع استخدام ما يقرب من نصف المعلمات (29.5 مليون مقابل 52.2 مليون). وهذا يجعل YOLOv10 أخف في التخزين وأسرع في التحميل.
  • الحمل الحسابي: إن عدد وحدات FLOP لنماذج YOLOv10 أقل باستمرار لمستويات الدقة المماثلة، مما يترجم إلى انخفاض استهلاك الطاقة - وهو عامل حاسم لأجهزة الذكاء الاصطناعي المتطورة.
  • سرعة الاستدلال: بفضل التصميم NMS يحقق YOLOv10n زمن انتقال منخفض للغاية يبلغ 1.56 مللي ثانية على GPU T4، متفوقًا بذلك على أصغر متغير PP-YOLOE+.

ميزة NMS Advantantage

تتطلب أجهزة الكشف عن الكائنات التقليدية كبتًا غير أقصىNMS لتصفية المربعات المتداخلة، وهي خطوة غالبًا ما تكون بطيئة ويصعب تحسينها على الأجهزة. يزيل YOLOv10 هذه الخطوة تمامًا، مما يؤدي إلى ثبات زمن الاستدلال بغض النظر عن عدد الكائنات المكتشفة.

نقاط القوة والضعف

YOLOv10: الخيار العصري

  • نقاط القوة:
    • سهولة الاستخدام: تم دمجها بسلاسة في نظام Ultralytics مما يوفر واجهة برمجة تطبيقات موحدة للتدريب والنشر.
    • سرعة النشر: تزيل البنية الحقيقية من البداية إلى النهاية اختناقات ما بعد المعالجة.
    • كفاءة الموارد: استخدام أقل للذاكرة وعدد أقل من المعلمات يجعلها مثالية للبيئات المحدودة الموارد مثل الروبوتات وتطبيقات الأجهزة المحمولة.
    • كفاءة التدريب: يدعم التدريب السريع من خلال أوزان متوفرة مسبقًا ومتاحة بسهولة مع أوزان مُدربة مسبقًا وأجهزة تحميل بيانات مُحسَّنة.
  • نقاط الضعف:
    • وباعتبارها بنية أحدث، فإن النظام البيئي للبرامج التعليمية للجهات الخارجية ينمو بسرعة، ولكنه قد يكون أصغر من إصدارات YOLO الأقدم مثل YOLOv5 أو YOLOv8.

PP-YOLOE+: PaddlePaddle المتخصص في PaddlePaddle

  • نقاط القوة:
    • دقة عالية: توفر دقة ممتازة، خاصةً في متغيرات الطراز الأكبر (PP-YOLOE+x).
    • تحسين الإطار: تم ضبطه بشكل كبير للمستخدمين الذين استثمروا بالفعل بعمق في البنية التحتية لـ PaddlePaddle .
  • نقاط الضعف:
    • انغلاق النظام الإيكولوجي: يقتصر الدعم الأساسي على إطار عمل PaddlePaddle والذي يمكن أن يكون عائقًا أمام الفرق التي تستخدم PyTorch أو TensorFlow.
    • ثقيلة الوزن: يتطلب موارد حسابية أكثر بكثير (FLOPs و Params) لمطابقة دقة نماذج YOLO الأحدث.

توصيات حالة الاستخدام

تطبيقات الوقت الحقيقي والحوسبة الطرفية

للتطبيقات التي تتطلب أوقات استجابة فورية، مثل المركبات ذاتية القيادة أو خطوط التصنيع عالية السرعة, YOLOv10 هو الخيار الأفضل. يضمن زمن انتقاله المنخفض وخطوة NMS التي تمت إزالتها سرعات استدلالية حتمية، وهو أمر بالغ الأهمية للأنظمة ذات الأهمية الحرجة للسلامة.

الرؤية الحاسوبية للأغراض العامة

بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات، تقدم نماذجUltralytics YOLO ميزة مميزة بسبب النظام البيئي الذي يتم صيانته جيدًا. إن القدرة على التبديل بسهولة بين المهامdetect segment والتشكيل) والتصدير إلى تنسيقات مثل ONNX و TensorRT و CoreML تجعل YOLOv10 وأشقاءه قابلين للتكيف بدرجة كبيرة.

عمليات نشر صناعية محددة

إذا كانت بنيتك التحتية الحالية مبنية بالكامل على مجموعة تقنيات بايدو، فإن PP-YOLOE+ يوفر حلاً أصليًا يتكامل بشكل جيد مع أدوات PaddlePaddle الأخرى. ومع ذلك، بالنسبة للمشاريع الجديدة، فإن كفاءة التدريب وانخفاض تكاليف الأجهزة في YOLOv10 غالبًا ما تحقق عائدًا أفضل على الاستثمار.

الشروع في العمل مع YOLOv10

اختبر سهولة الاستخدام التي تتميز بها نماذج Ultralytics . يمكنك تحميل التنبؤات وتشغيلها باستخدام YOLOv10 في بضعة أسطر فقط من كود Python :

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

تسمح واجهة برمجة التطبيقات البسيطة هذه للباحثين بالتركيز على البيانات والنتائج بدلاً من التعليمات البرمجية النمطية.

الخلاصة

بينما يظل PP-YOLOE+ منافسًا قويًا في إطاره المحدد, YOLOv10 حزمة أكثر إقناعًا لمجتمع الرؤية الحاسوبية الأوسع نطاقًا. وتوفر إنجازاته المعمارية في التخلص من NMS جنبًا إلى جنب مع متانة نظام Ultralytics البيئي، للمطورين أداة ليست أسرع وأخف وزنًا فحسب، بل أسهل في الاستخدام والصيانة أيضًا.

لأولئك الذين يتطلعون إلى البقاء في الطليعة المطلقة، نوصي أيضاً باستكشاف YOLO11، وهو أحدث طراز رائد من Ultralytics الذي يتخطى حدود التنوع والأداء عبر مهام الرؤية المتعددة.

استكشف نماذج أخرى

وسّع فهمك لمشهد اكتشاف الكائنات من خلال هذه المقارنات:


تعليقات