تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv8: مقارنة فنية

يعد اختيار البنية المثلى للكشف عن الأجسام خطوة محورية في تطوير تطبيقات رؤية حاسوبية قوية. وغالبًا ما ينطوي هذا القرار على مفاضلة معقدة بين سرعة الاستدلال ودقة الكشف ومرونة النشر. يقدم هذا الدليل مقارنة تقنية متعمقة بين نموذج PP-YOLOE+، وهو نموذج عالي الدقة من نظام Baidu PaddlePaddle و Ultralytics YOLOv8وهو نموذج مشهور عالميًا مشهور بتعدد استخداماته وسرعته ونظامه البيئي الملائم للمطورين.

PP-YOLOE+: الدقة في نظام PaddlePaddle البيئي

PP-YOLOE+ هو نسخة مطوّرة من PP-YOLOE، تم تطويره من قبل فريق PaddleDetection في Baidu. وهو يمثل تكرارًا مهمًا في عائلة YOLO وتم تحسينه خصيصًا لإطار عمل PaddlePaddle . تم إصداره لتحسين معايير (SOTA) السابقة (SOTA)، ويركز بشكل كبير على تحسين المفاضلة بين كفاءة التدريب ودقة الاستدلال.

التفاصيل الفنية: المؤلفون المؤلفون PaddlePaddle
المؤسسة بايدو
التاريخ: 2022-04-02
اركسيف: https://arxiv.org/abs/2203.16250
جيثب: https:PaddlePaddle
المستندات: https:PaddlePaddle

تعرف على المزيد حول PP-YOLOE+

البنية والميزات الأساسية

يتبنى PP-YOLOE+ بنية حديثة خالية من الارتكاز، مما يبسّط عملية التدريب من خلال إلغاء الحاجة إلى حساب أبعاد صندوق الارتكاز الأمثل لمجموعات بيانات محددة.

  • العمود الفقري: يستخدم العمود الفقري CSPRepResNet، الذي يجمع بين مزايا التدفق المتدرج لشبكة CSPNet وإمكانية إعادة تحديد المعلمات في RepVGG. وهذا يسمح للنموذج بأن يكون له بنية معقدة أثناء التدريب لتعلم ميزات غنية ولكن بنية أبسط وأسرع أثناء الاستدلال.
  • الرقبة: يوظف النموذج رقبة شبكة تجميع المسار (PAN) لتعزيز دمج الميزات عبر مقاييس مختلفة، وهو أمر بالغ الأهمية للكشف عن الأجسام ذات الأحجام المختلفة.
  • الرأس: الابتكار الرئيسي هو الرأس الفعال المحاذي للمهام (ET-Head). تفصل آلية الرأس المنفصلة هذه بين ميزات التصنيف وتحديد الموقع، باستخدام تعلم محاذاة المهام (TAL) لضمان أن أعلى درجات الثقة تتوافق مع المربعات المحددة الأكثر دقة.

نقاط القوة والقيود

نقاط القوة: تم تصميم PP-YOLOE+ لتحقيق أداء عالٍ على المعايير القياسية مثل مجموعة بياناتCOCO . ويساهم تطبيقها للخسارة البؤرية المتغيرة وخسارة التوزيع البؤري في قدرتها المذهلة على التعامل مع اختلال التوازن بين الفئات وغموض التوطين.

نقاط الضعف: القيد الأساسي للعديد من المطورين هو اعتماده العميق على إطار عمل PaddlePaddle . على الرغم من قوته، إلا أن PaddlePaddle لديه مجتمع عالمي أصغر مقارنةً ب PyTorchمما قد يعقد التكامل في خطوط أنابيب MLOPS الحالية التي تعتمد على الأدوات القياسية. بالإضافة إلى ذلك، يركز PP-YOLOE+ في الغالب على الاكتشاف، ويفتقر إلى القدرات الأصلية متعددة المهام الموجودة في مجموعات أكثر شمولاً.

Ultralytics YOLOv8: معيار تعدد الاستخدامات والأداء

Ultralytics YOLOv8 يمثل نقلة نوعية في كيفية تطوير نماذج الذكاء الاصطناعي ونشرها. تم تصميمه من قِبل Ultralytics وهو مصمم ليس فقط كنموذج ولكن كإطار عمل كامل قادر على التعامل مع مجموعة واسعة من مهام الرؤية الحاسوبية، بدءًا من الكشف إلى التحليل المكاني المعقد.

التفاصيل الفنية: المؤلفون: جلين جوتشر، وأيوش تشوراسيا، وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
جيثب: https:ultralytics
المستندات: https:yolov8

تعرف على المزيد حول YOLOv8

الهندسة المعمارية والنظام البيئي

يبني YOLOv8 على إرث إصدارات YOLO السابقة مع العمود الفقري C2f المحسّن، والذي يحل محل الوحدة C3 لتحسين تدفق التدرج وكفاءة استخراج الملامح.

ميزة Ultralytics

يتفوق YOLOv8 في سهولة الاستخدام. تسمح حزمة Ultralytics Python بالتدريب والتحقق من الصحة والتنبؤ في بضعة أسطر من التعليمات البرمجية.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100)

هذه البساطة مدعومة بنظام بيئي جيد الصيانة. يستفيد المستخدمون من التكامل السلس مع أدوات مثل Ultralytics HUB للتدريب السحابي، و TensorBoard للتصور، ومجموعة متنوعة من تنسيقات التصدير بما في ذلك ONNX و TensorRT و OpenVINO. وهذا يضمن أن النماذج ليست مجرد قطع أثرية بحثية ولكنها جاهزة للنشر في العالم الحقيقي.

التحليل المقارن: المقاييس والأداء

عند تقييم هذه النماذج، من الضروري النظر إلى ما هو أبعد من دقة الخط الأعلى والنظر في الكفاءة. يعرض الجدول أدناه مقارنة مفصلة للمقاييس الرئيسية.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

السرعة والكفاءة

تسلط البيانات الضوء على كفاءة YOLOv8 الفائقة. إن YOLOv8n (النانو) هو نموذج متميز لتطبيقات الذكاء الاصطناعي المتطورة، حيث يحقق سرعة استدلال رائعة تبلغ 1.47 مللي ثانية على GPU T4، أسرع بكثير من أصغر نموذج YOLOv8n YOLOV8+t. علاوةً على ذلك، لا يتطلب YOLOv8n سوى 3.2 مليون معلمة و8.7 مليار فلوب فقط، مما يجعله أخف وزنًا بكثير من نظيره.

الدقة مقابل الموارد

في حين أن PP-YOLOE+x يحقق mAP أعلى قليلاً يبلغ 54.7، إلا أنه يحقق ذلك بتكلفة كبيرة: ما يقرب من 100 مليون معلمة. في المقابل YOLOv8x يُحقِّق نسبة 53.9 mAP تنافسية مع معلمات أقل بنسبة 30% تقريبًا (68.2 مليون). بالنسبة لمعظم التطبيقات العملية، يوفر YOLOv8 أداءً أكثر توازناً، حيث يوفر دقة SOTA دون الحاجة إلى نفقات حسابية ضخمة.

كفاءة الذاكرة

تشتهر نماذج Ultralytics YOLO بذاكرة منخفضة أثناء التدريب والاستدلال. على عكس بعض النماذج القائمة على المحولات أو البنى الثقيلة، تم تحسين YOLOv8 ليعمل بكفاءة على أجهزة من فئة المستهلك، مما يقلل من الحاجة إلى موارد الحوسبة السحابية باهظة الثمن.

حالات الاستخدام والتطبيقات المثالية

غالباً ما يعتمد الاختيار بين هذه النماذج على القيود المحددة لمشروعك.

متى تختار YOLOv8

YOLOv8 هو الخيار الموصى به للغالبية العظمى من المطورين نظرًا لتعدد استخدام اته وسهولة استخدامه.

  • النشر على الحافة: مع النماذج خفيفة الوزن مثل YOLOv8n فهي مثالية للنشر على Raspberry Pi أو NVIDIA Jetson أو الأجهزة المحمولة.
  • خطوط أنابيب متعددة المهام: إذا كان مشروعك يتطلب تتبع الكائنات إلى جانب التجزئة أو تقدير الوضعية (على سبيل المثال، التحليلات الرياضية)، فإن YOLOv8 يوفر كل هذه الإمكانيات في مكتبة واحدة موحدة.
  • النماذج الأولية السريعة: يتيح توافر أوزان مُدرَّبة مسبقاً وواجهة برمجة تطبيقات بسيطة للفرق الانتقال من المفهوم إلى إثبات المفهوم في ساعات.
  • دعم متعدد المنصات: دعم ممتاز لـ ONNX, OpenVINOو CoreML يضمن تشغيل نموذجك في أي مكان.

متى تفكر في استخدام PP-YOLOE+

لا يزال PP-YOLOE+ منافسًا قويًا على وجه التحديد للمستخدمين المندمجين بعمق في نظام Baidu البيئي.

  • مهام سير عملPaddlePaddle : ستجد الفرق التي تستخدم بالفعل مجموعة PaddlePaddle لمهام الذكاء الاصطناعي الأخرى أن PP-YOLOE+ يتناسب بشكل طبيعي مع بنيتها التحتية الحالية.
  • الدقة النظرية القصوى: بالنسبة للمسابقات البحثية أو السيناريوهات التي يكون فيها كل جزء من mAP مهمًا والموارد الحسابية غير محدودة، فإن أكبر نماذج PP-YOLOE+ قادرة للغاية.

الخلاصة

بينما يُظهر PP-YOLOE+ قدرات إطار عمل PaddlePaddle بأرقام دقة مبهرة, Ultralytics YOLOv8 هو الحل الأكثر عملية وقوة لمجتمع الرؤية الحاسوبية الأوسع نطاقًا. إن مزيجها الرابح من السرعة العالية وكفاءة الموارد ومجموعة الميزات الغنية - بما في ذلك الدعم الأصلي للتجزئة وتقدير الوضعية - يجعلهاالخيار الأفضل لتطوير الذكاء الاصطناعي الحديث.

يضمن YOLOv8 المدعوم بمجتمع مفتوح المصدر نابض بالحياة ووثائق شاملة وتحديثات مستمرة، أن المطورين مجهزون بأدوات مستقبلية لحل مشاكل العالم الحقيقي بفعالية.

استكشف نماذج أخرى

إذا كنت مهتمًا باستكشاف أحدث التطورات في مجال اكتشاف الأجسام، ففكر في الاطلاع على هذه المقارنات ذات الصلة:


تعليقات