تخطي إلى المحتوى

PP-YOLOE+ ضد YOLOv6-3.0: مقارنة فنية مفصلة

غالبًا ما يتضمن التنقل في مشهد بنى اكتشاف الكائنات الحديثة الاختيار بين النماذج المحسّنة لأنظمة بيئية إطارية محددة وتلك المصممة لسرعة صناعية خام. يقارن هذا التحليل الشامل PP-YOLOE+، وهو كاشف عالي الدقة وخالي من المرساة من مجموعة PaddlePaddle، و YOLOv6-3.0، وهو نموذج محوره السرعة صممته Meituan للتطبيقات الصناعية في الوقت الفعلي. من خلال فحص بنياتها وقياسات الأداء وحالات الاستخدام المثالية، يمكن للمطورين تحديد النموذج الذي يتوافق بشكل أفضل مع قيود النشر الخاصة بهم.

PP-YOLOE+: دقة بدون مرساة

يمثل PP-YOLOE+ تطور سلسلة PP-YOLO، التي طورها باحثو Baidu لدفع حدود الدقة داخل نظام PaddlePaddle البيئي. تم إصداره في أوائل عام 2022، وهو يركز على تصميم خالي من المرساة لتبسيط خط أنابيب التدريب مع تقديم أداء حديث لمهام رؤية الكمبيوتر للأغراض العامة.

المؤلفون: مؤلفو PaddlePaddle
المنظمة:Baidu
التاريخ: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
المستندات:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

الهندسة المعمارية والابتكارات الرئيسية

تعتمد بنية PP-YOLOE+ على backbone من نوع CSPRepResNet، والذي يجمع بين قدرات استخراج الميزات لشبكات Residual Networks وكفاءة اتصالات Cross Stage Partial (CSP). والانحراف الكبير عن الكاشفات التقليدية هو رأسه الخالي من anchor، مما يلغي الحاجة إلى مربعات الربط محددة مسبقًا. هذا التقليل في المعلمات الفائقة يبسط تكوين النموذج ويحسن التعميم عبر مجموعات البيانات المتنوعة.

الأهم من ذلك، تستخدم PP-YOLOE+ Task Alignment Learning (TAL) لحل مشكلة عدم التوافق بين مهام التصنيف وتحديد الموقع—وهي مشكلة شائعة في أجهزة detect ذات المرحلة الواحدة. من خلال التعيين الديناميكي للتسميات بناءً على جودة التنبؤات، يضمن TAL أن تتوافق أعلى درجات الثقة مع bounding boxes الأكثر دقة.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يحقق باستمرار درجات mAP فائقة على المعايير مثل COCO، خاصة في متغيرات النماذج الأكبر (مثل PP-YOLOE+x).
  • تدريب مبسط: يزيل نموذج التدريب الخالي من المرساة تعقيد تحليلات التجميع لتحديد حجم المرساة.
  • التآزر في النظام البيئي: يوفر تكاملاً عميقًا للمستخدمين المتجذرين بالفعل في إطار عمل التعلم العميق PaddlePaddle.

نقاط الضعف:

  • زمن انتقال الاستدلال: يُظهر عمومًا سرعات استدلال أبطأ مقارنةً بالنماذج المدركة للأجهزة مثل YOLOv6، خاصةً على أجهزة GPU.
  • الاعتماد على الإطار: يمكن أن يكون نقل النماذج إلى أطر أخرى مثل PyTorch أو ONNX من أجل النشر أكثر صعوبة مقارنة بالبنى المحايدة للإطار أصلاً.

حالات الاستخدام المثالية

غالبًا ما يكون PP-YOLOE+ هو الخيار المفضل حيث تكون الدقة لها الأسبقية على الكمون المنخفض للغاية.

تعرف على المزيد حول PP-YOLOE+

YOLOv6-3.0: مصمم للسرعة الصناعية

تم تقديم YOLOv6-3.0 بواسطة فريق رؤية الذكاء الاصطناعي في Meituan لتلبية المتطلبات الصارمة للتطبيقات الصناعية. مع إعطاء الأولوية للموازنة بين سرعة الاستدلال والدقة، يستخدم YOLOv6 مبادئ التصميم المدركة للأجهزة لزيادة الإنتاجية إلى أقصى حد على وحدات معالجة الرسوميات (GPUs) و الأجهزة الطرفية.

المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، و شيانغشيانغ تشو
المنظمة:Meituan
التاريخ: 2023-01-13
ArXiv:https://arxiv.org/abs/2301.05586
GitHub:https://github.com/meituan/YOLOv6
المستندات:https://docs.ultralytics.com/models/yolov6/

البنية والميزات الرئيسية

يتميز YOLOv6-3.0 بـ "Efficient Reparameterization Backbone"، المستوحى من RepVGG، والذي يسمح للنموذج بهيكل معقد أثناء التدريب لتعلم الميزات الغنية ولكن بهيكل مبسط أثناء الاستدلال لتحقيق السرعة. تقنية إعادة التهيئة هذه هي المفتاح لقدرات الاستدلال في الوقت الفعلي.

يستخدم النموذج أيضًا التقطير الذاتي، حيث يوجه نموذج معلم أكبر تدريب نموذج طالب أصغر، مما يعزز الدقة دون إضافة تكلفة حسابية في وقت التشغيل. علاوة على ذلك، يدعم YOLOv6 تحديد كمية النموذج القوي، مما يجعله فعالاً للغاية للنشر على الأجهزة ذات موارد الحوسبة المحدودة.

تحسين الأداء على الأجهزة المحمولة

تتضمن YOLOv6 سلسلة "Lite" محددة من النماذج المحسّنة لوحدات المعالجة المركزية (CPU) للأجهزة المحمولة، وتستخدم كتلًا مميزة للحفاظ على السرعة حيث لا يتوفر تسريع وحدة معالجة الرسومات (GPU).

نقاط القوة والضعف

نقاط القوة:

  • سرعة استثنائية: مُصمم خصيصًا للإنتاجية العالية، حيث يحقق نموذج YOLOv6-3.0n زمن انتقال أقل من 2 مللي ثانية على وحدات معالجة الرسومات T4.
  • تحسين الأجهزة: البنية صديقة لتحسين TensorRT، مما يزيد من استخدام وحدة معالجة الرسومات (GPU).
  • توسع فعال: يوفر توازنًا جيدًا للدقة مقابل التكلفة الحسابية (FLOPs).

نقاط الضعف:

  • نطاق مهمة محدود: مصمم بشكل أساسي للاكتشاف (detection)؛ يفتقر إلى الدعم الأصلي للمهام المعقدة مثل تقدير الوضع أو مربعات الإحاطة الموجهة (OBB).
  • دعم المجتمع: على الرغم من فعالية النظام البيئي، إلا أنه أقل نشاطًا فيما يتعلق بعمليات تكامل الجهات الخارجية والبرامج التعليمية للمجتمع مقارنةً بنماذج Ultralytics.

حالات الاستخدام المثالية

يتفوق YOLOv6-3.0 في البيئات التي يكون فيها وقت الاستجابة حاسمًا.

  • الروبوتات: تمكين الملاحة والتفاعل للروبوتات المتنقلة المستقلة (AMRs).
  • تحليل حركة المرور: أنظمة إدارة حركة المرور في الوقت الفعلي والتي تتطلب عد وتصنيف فوري للمركبات.
  • خطوط الإنتاج: مراقبة حزام النقل عالي السرعة لـ segment الحزم وفرزها.

تعرف على المزيد حول YOLOv6

مقارنة الأداء

إن التباعد في فلسفة التصميم - التركيز على الدقة لـ PP-YOLOE+ مقابل التركيز على السرعة لـ YOLOv6 - يظهر بوضوح في مقاييس الأداء. يحقق PP-YOLOE+ عمومًا درجات mAP أعلى في الطرف العلوي من تعقيد النموذج، بينما يهيمن YOLOv6 على سرعة الاستدلال الخام للنماذج الأصغر والأسرع.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

ملاحظة: تعتمد مقارنات المقاييس بشكل كبير على الأجهزة المحددة و تنسيق التصدير المستخدم (على سبيل المثال، ONNX مقابل TensorRT).

توضح البيانات أنه بالنسبة لتطبيقات الحافة ذات الموارد المحدودة، يوفر YOLOv6-3.0n أقل حاجز للدخول من حيث FLOPs وزمن الوصول. وعلى العكس من ذلك، بالنسبة لتطبيقات جانب الخادم حيث تكون هناك حاجة إلى أقصى قدرة detect، يوفر PP-YOLOE+x أعلى سقف للدقة.

ميزة Ultralytics: YOLO11

بينما يقدم PP-YOLOE+ و YOLOv6 قدرات قوية في مجالاتهما المتخصصة، فإن Ultralytics YOLO11 يوفر حلاً شاملاً يسد الفجوة بين الدقة العالية وسهولة الاستخدام. YOLO11 ليس مجرد نموذج ولكنه نقطة دخول إلى نظام بيئي مُصان جيدًا مصمم لتبسيط دورة حياة التعلم الآلي machine learning بأكملها.

لماذا تختار Ultralytics؟

  • تنوع لا يضاهى: على عكس YOLOv6 الذي هو في الأساس كاشف، يدعم YOLO11 أصلاً تقسيم المثيلات instance segmentation، وتقدير الوضع pose estimation، وOBB، والتصنيف classification. يتيح ذلك للمطورين معالجة مشاكل رؤية الكمبيوتر computer vision متعددة الأوجه باستخدام واجهة برمجة تطبيقات API واحدة.
  • سهولة الاستخدام: تختزل حزمة Python الخاصة بـ Ultralytics التعليمات البرمجية المعقدة. يمكن إجراء تحميل نموذج وتشغيل الاستدلال وتصور النتائج في ثلاثة أسطر من التعليمات البرمجية.
  • الكفاءة والذاكرة: تم تحسين نماذج Ultralytics للتدريب الفعال، وعادةً ما تتطلب ذاكرة GPU أقل بكثير من البنى القائمة على المحولات مثل RT-DETR.
  • دعم النظام البيئي: مع التحديثات المتكررة والوثائق الشاملة وأدوات مثل Ultralytics HUB للتدريب بدون تعليمات برمجية، يستفيد المستخدمون من نظام أساسي يتطور مع الصناعة.

نشر بسيط

تعطي Ultralytics الأولوية لإمكانية الوصول. يمكنك تشغيل الاستدلال المتقدم على الفور:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

يمتد هذا البساطة إلى النشر، مع إمكانات التصدير بسطر واحد إلى تنسيقات مثل ONNX و OpenVINO و CoreML، مما يضمن أداء النموذج الخاص بك على النحو الأمثل على أي جهاز مستهدف.

تعرف على المزيد حول YOLO11

الخلاصة

يعتمد الاختيار بين PP-YOLOE+ و YOLOv6-3.0 إلى حد كبير على القيود المحددة لمشروعك. يعتبر PP-YOLOE+ منافسًا قويًا للسيناريوهات التي تتطلب دقة عالية داخل إطار عمل PaddlePaddle، بينما يوفر YOLOv6-3.0 مزايا سرعة مقنعة للبيئات الصناعية التي تعتمد بشكل كبير على استدلال GPU.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات ومقاوم للمستقبل يوازن بين الأداء الحديث وتجربة المطور، تظل Ultralytics YOLO11 هي التوصية الأفضل. إن دعمه الشامل للمهام ومجتمعه النشط والتكامل السلس في مهام سير عمل MLOps الحديثة يجعله المعيار لرؤية الذكاء الاصطناعي المتطورة.

مقارنات النماذج الأخرى

استكشف مقارنات أكثر تفصيلاً للعثور على النموذج المناسب لاحتياجاتك:


تعليقات