تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv6.0: مقارنة تقنية مفصلة

غالبًا ما ينطوي التنقل في مشهد البنى الحديثة للكشف عن الأجسام على الاختيار بين النماذج المحسّنة لأنظمة بيئية محددة لإطار عمل محدد وتلك المصممة للسرعة الصناعية الخام. يقارن هذا التحليل الشامل بين PP-YOLOE+، وهو كاشف عالي الدقة وخالٍ من الارتكاز من مجموعة PaddlePaddle و YOLOv6.0، وهو نموذج يركز على السرعة صممته شركة Meituan للتطبيقات الصناعية في الوقت الحقيقي. من خلال فحص بنيتيهما ومقاييس أدائهما وحالات الاستخدام المثالية، يمكن للمطورين تحديد النموذج الذي يتوافق بشكل أفضل مع قيود النشر الخاصة بهم.

PP-YOLOE+: دقة خالية من المرساة

تمثل PP-YOLOE+ تطور سلسلة YOLO التي طورها باحثو Baidu لدفع حدود الدقة داخل PaddlePaddle في النظام البيئي. تم إصداره في أوائل عام 2022، وهو يركز على تصميم خالٍ من المراسي لتبسيط خط أنابيب التدريب مع تقديم أحدث أداء لمهام الرؤية الحاسوبية للأغراض العامة.

المؤلفون: PaddlePaddle المؤلفون
المنظمة:بايدو
التاريخ: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:PaddlePaddle
المستندات:PaddlePaddle

الهندسة المعمارية والابتكارات الرئيسية

بُنيت بنية PP-YOLOE+ على العمود الفقري CSPRepResNet، الذي يجمع بين قدرات استخراج الميزة للشبكات المتبقية مع كفاءة الوصلات الجزئية المتقاطعة (CSP). ومن أهم ما يميزه عن أجهزة الكشف التقليدية هو رأسه الخالي من المرتكزات، مما يلغي الحاجة إلى مربعات الارتكاز المحددة مسبقًا. يعمل هذا التخفيض في المعلمات الفائقة على تبسيط تكوين النموذج وتحسين التعميم عبر مجموعات البيانات المتنوعة.

والأهم من ذلك، يستخدم PP-YOLOE+ تعلّم محاذاة المهام (TAL) لحل مشكلة عدم التوافق بين مهام التصنيف والتوطين - وهي مشكلة شائعة في أجهزة الكشف ذات المرحلة الواحدة. من خلال تعيين التسميات ديناميكيًا استنادًا إلى جودة التوقعات، يضمن TAL أن أعلى درجات الثقة تتوافق مع المربعات المحددة الأكثر دقة.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يحقق باستمرار دقة فائقة mAP على معايير مثل COCO خاصةً في متغيرات النماذج الأكبر (مثل PP-YOLOE+x).
  • تدريب مبسط: يزيل النموذج الخالي من المرساة تعقيد تحليلات التجميع لتحديد حجم المرساة.
  • تآزر النظام الإيكولوجي: يوفر تكاملاً عميقاً للمستخدمين الراسخين بالفعل في إطار التعلم العميق PaddlePaddle .

نقاط الضعف:

  • زمن انتقال الاستدلال: يُظهر عمومًا سرعات استدلال أبطأ مقارنةً بالنماذج المدركة للأجهزة مثل YOLOv6 خاصةً على أجهزة GPU .
  • تبعية الإطار: يمكن أن يكون نقل النماذج إلى أطر عمل أخرى مثل PyTorch أو ONNX للنشر أكثر صعوبة مقارنةً بالبنى التي لا تعتمد على إطار عمل أصلاً.

حالات الاستخدام المثالية

غالبًا ما يكون PP-YOLOE+ هو الخيار المفضل حيث تكون الأولوية للدقة على زمن الاستجابة المنخفض للغاية.

تعرف على المزيد حول PP-YOLOE+

YOLOv6.0: مصمم هندسيًا للسرعة الصناعية

تم تقديم YOLOv6.0 من قِبل فريق الذكاء الاصطناعي للرؤية في Meituan لتلبية المتطلبات الصارمة للتطبيقات الصناعية. من خلال إعطاء الأولوية للمفاضلة بين سرعة الاستدلال والدقة، يستخدم YOLOv6 مبادئ تصميم مدركة للأجهزة لزيادة الإنتاجية على وحدات معالجة الرسومات والأجهزة المتطورة.

المؤلفون: Chuyi Li وLulu Li وYifei Geng وHongliang Jiang وMeng Cheng وBo Zhang وZaidan Ke وXiaoming Xu وXiangxiang Chu
المنظمة:Meituan
التاريخ: 2023-01-13
ArXiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics

البنية والميزات الرئيسية

يتميز YOLOv6.0 ب "العمود الفقري الفعال لإعادة المعلمات" المستوحى من RepVGG، والذي يسمح للنموذج بأن يكون له بنية معقدة أثناء التدريب لتعلم الميزات الغنية ولكن بنية مبسطة أثناء الاستدلال من أجل السرعة. إن تقنية إعادة المعلمات هذه هي المفتاح لقدرات الاستدلال في الوقت الحقيقي.

ويستخدم النموذج أيضًا التقطير الذاتي، حيث يقوم نموذج المعلم الأكبر بتوجيه تدريب نموذج الطالب الأصغر، مما يعزز الدقة دون إضافة تكلفة حسابية في وقت التشغيل. علاوةً على ذلك، يدعم YOLOv6 تكميم النموذج بشكل قوي، مما يجعله فعالاً للغاية في النشر على الأجهزة ذات الموارد الحاسوبية المحدودة.

تحسين الأجهزة المحمولة

يشتمل YOLOv6 على سلسلة "لايت" محددة من النماذج المحسّنة لوحدات المعالجة المركزية المحمولة، باستخدام كتل مميزة للحفاظ على السرعة في حالة عدم توفر تسريع GPU .

نقاط القوة والضعف

نقاط القوة:

  • سرعة استثنائية: صُمم خصيصًا لتحقيق إنتاجية عالية، حيث يحقق طراز YOLOv6.0n زمن انتقال أقل من 2 مللي ثانية على وحدات معالجة الرسومات T4.
  • تحسين الأجهزة: البنية صديقة لـ TensorRT وتحسين استخدام GPU إلى أقصى حد.
  • تحجيم فعال: يوفر توازنًا جيدًا بين الدقة والتكلفة الحسابية (FLOPs).

نقاط الضعف:

  • نطاق المهام المحدود: مصمم في المقام الأول للكشف؛ يفتقر إلى الدعم الأصلي للمهام المعقدة مثل تقدير الوضعية أو المربعات المحدودة الموجهة (OBB).
  • دعم المجتمع: على الرغم من فعالية النظام البيئي إلا أنه أقل نشاطًا فيما يتعلق بعمليات التكامل مع الجهات الخارجية والدروس المجتمعية مقارنةً بنماذج Ultralytics .

حالات الاستخدام المثالية

يتفوق YOLOv6.0 في البيئات التي يكون فيها وقت رد الفعل حرجاً.

اعرف المزيد عن YOLOv6

مقارنة الأداء

يظهر الاختلاف في فلسفة التصميم - التركيز على الدقة في PP-YOLOE+ مقابل التركيز على السرعة في YOLOv6بوضوح في مقاييس الأداء. يتلقى PP-YOLOE+ عمومًا درجات أعلى mAP الحد الأعلى من تعقيد النموذج، بينما يهيمن YOLOv6 على سرعة الاستدلال الخام للنماذج الأصغر والأسرع.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7

ملاحظة: تعتمد مقارنات المقاييس بشكل كبير على الأجهزة المحددة وتنسيق التصدير المستخدم (على سبيل المثال، ONNX مقابل TensorRT).

توضح البيانات أنه بالنسبة لتطبيقات الحافة المقيدة الموارد، يوفر YOLOv6.0n أقل عائق للدخول من حيث عدد وحدات FLOP وزمن الاستجابة. وعلى العكس من ذلك، بالنسبة للتطبيقات من جانب الخادم التي تتطلب أقصى قدرة على الاكتشاف، يوفر PP-YOLOE+x أعلى سقف دقة.

ميزة Ultralytics : YOLO11

بينما يقدم كل من PP-YOLOE+ و YOLOv6 قدرات قوية في مجال تخصصه, Ultralytics YOLO11 حلاً شاملاً يسد الفجوة بين الدقة العالية وسهولة الاستخدام. إن YOLO11 ليس مجرد نموذج، بل هو نقطة دخول إلى نظام بيئي جيد الصيانة مصمم لتبسيط دورة حياة التعلم الآلي بأكملها.

لماذا تختار Ultralytics

  • براعة لا مثيل لها: على عكس YOLOv6 الذي يعد كاشفًا في المقام الأول، يدعم YOLO11 في الأصل تجزئة المثيل وتقدير الوضعية وOBB والتصنيف. يتيح ذلك للمطورين معالجة مشاكل الرؤية الحاسوبية متعددة الأوجه باستخدام واجهة برمجة تطبيقات واحدة.
  • سهولة الاستخدام: تلخص حزمة Ultralytics Python التعليمات البرمجية النمطية المعقدة. يمكن تحميل نموذج وتشغيل الاستدلال وتصور النتائج في ثلاثة أسطر من التعليمات البرمجية.
  • الكفاءة والذاكرة: تم تحسين نماذج Ultralytics من أجل التدريب الفعال، وعادةً ما تتطلب ذاكرة GPU أقل بكثير من البنى القائمة على المحولات مثل RT-DETR.
  • دعم النظام الإيكولوجي: من خلال التحديثات المتكررة، والوثائق الشاملة، والأدوات مثل Ultralytics HUB للتدريب بدون رموز، يستفيد المستخدمون من منصة تتطور مع تطور الصناعة.

النشر أصبح بسيطاً

تعطي Ultralytics الأولوية لإمكانية الوصول. يمكنك تشغيل الاستدلال المتقدم على الفور:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

تمتد هذه البساطة إلى النشر، مع إمكانات تصدير سطر واحد إلى تنسيقات مثل ONNX, OpenVINOو CoreML مما يضمن أداء نموذجك على النحو الأمثل على أي جهاز مستهدف.

تعرف على المزيد حول YOLO11

الخلاصة

يعتمد الاختيار بين PP-YOLOE+ و YOLOv6.0 إلى حد كبير على القيود المحددة لمشروعك. يعد PP-YOLOE+ منافسًا قويًا للسيناريوهات التي تتطلب دقة عالية في إطار عمل PaddlePaddle بينما يوفر YOLOv6.0 مزايا سرعة مقنعة للبيئات الصناعية التي تعتمد بشكل كبير على استدلال GPU .

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات وملائم للمستقبل يوازن بين الأداء المتطور وتجربة المطورين, Ultralytics YOLO11 هو الحل الأمثل. حيث إن دعمه الشامل للمهام، ومجتمعه النشط، وتكامله السلس في عمليات سير عمل MLOps الحديثة يجعله معيارًا للذكاء الاصطناعي للرؤية المتطورة.

مقارنات النماذج الأخرى

استكشف المزيد من المقارنات التفصيلية للعثور على الطراز المناسب لاحتياجاتك:


تعليقات