YOLOv8 PP-YOLOE+: نظرة متعمقة على الكشف عن الأجسام عالي الأداء

في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار بنية الكشف عن الأجسام المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة وإمكانية النشر. يقدم هذا الدليل مقارنة تقنية شاملة بين Ultralytics YOLOv8 و PP-YOLOE+، ويحلل ابتكاراتهما المعمارية ومقاييس الأداء ومدى ملاءمتهما للتطبيقات الواقعية.

نظرة عامة على النموذج

Ultralytics YOLOv8

YOLOv8 يمثل قفزة كبيرة إلى الأمام في YOLO حيث يقدم إطارًا موحدًا لاكتشاف الكائنات وتقسيم الحالات وتقدير الوضع. مبني على إرث من السرعة والدقة، يتميز برأس اكتشاف جديد خالٍ من المراسي ووظيفة خسارة مبتكرة.

المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
المؤسسة:Ultralytics
التاريخ: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
الوثائق:https://docs.ultralytics.com/models/yolov8/

تعرف على المزيد حول YOLOv8

PP-YOLOE+

PP-YOLOE+ هو تطور لسلسلة PP-YOLOE من PaddlePaddle التابع لـ Baidu. وهو يركز على تحسين آلية بدون مرساة وتحسين استراتيجيات التدريب لتحقيق أداء تنافسي، لا سيما داخل PaddlePaddle .

المؤلفون: مؤلفو PaddlePaddle
المؤسسة:بايدو
التاريخ: 2022-04-02
أرشيف:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
المستندات:PaddleDetection PP-YOLOE+ التكوينات

تعرف على المزيد حول PP-YOLOE+

مقارنة الأداء

عند تقييم أجهزة الكشف عن الأجسام، فإن التوازن بين سرعة الاستدلال (الكمون) ومتوسط الدقة (mAP) أمر بالغ الأهمية. يوضح الرسم البياني أدناه هذه العلاقة، يليه جدول مفصل بالمقاييس.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

ملاحظة: تبرز مقاييس الأداء أنه في حين يُظهر PP-YOLOE+ كفاءة FLOPs نظرية قوية، فإن YOLOv8 يقدم إنتاجية فائقة في العالم الواقعي وكفاءة معلمات، خاصة على الأجهزة الطرفية CPU.

الاختلافات المعمارية

YOLOv8 Ultralytics YOLOv8

YOLOv8 نظامًا متطورًا للكشف بدون نقاط ربط. على عكس الإصدارات السابقة التي كانت تعتمد على مربعات ربط محددة مسبقًا، YOLOv8 بمراكز الأجسام مباشرةً. وهذا يبسط عملية التدريب ويحسن التعميم عبر مجموعات بيانات متنوعة مثل COCO.

تشمل الميزات المعمارية الرئيسية ما يلي:

وحدة C2f: تحل وحدة C2f (عنق الزجاجة الجزئي عبر المراحل مع اثنين من التلافيف) محل وحدة C3، وهي تعمل على تحسين تدفق التدرج وإثراء تمثيل الميزات مع الحفاظ على حجم خفيف الوزن.
الرأس المنفصل: يتم التعامل مع مهام التصنيف والانحدار بواسطة فروع منفصلة، مما يسمح للنموذج بالتركيز على أنواع ميزات محددة لكل مهمة، مما يؤدي إلى دقة أعلى.
المُخصص المتوافق مع المهام: استراتيجية متطورة لتخصيص التسميات تعمل على مواءمة العينات الإيجابية بشكل ديناميكي مع الحقائق الأساسية استنادًا إلى درجات التصنيف والانحدار.

بنية PP-YOLOE+

تم بناء PP-YOLOE+ على أساس إطار عمل PP-YOLOE، باستخدام العمود الفقري CSPResNet وشبكة تجميع المسارات المبسطة (PANet). ويؤكد على إعادة تحديد المعلمات وتخصيص العلامات بكفاءة.

تشمل الميزات المعمارية الرئيسية ما يلي:

RepResBlock: يستخدم تقنيات إعادة المعلمات لدمج طبقات متعددة في تلافيف واحد أثناء الاستدلال، مما يقلل من زمن الاستجابة دون التضحية بقدرة التدريب.
TAL (تعلم محاذاة المهام): على غرار YOLOv8 يستخدم تعلم محاذاة المهام لتحسين محاذاة المراسي.
التدريب المسبق لـ Object365: يشير الرمز "+" في PP-YOLOE+ إلى استخدام التدريب المسبق على نطاق واسع على مجموعة بيانات Objects365، مما يساهم في ارتفاع معدل mAP يزيد من تعقيد التدريب للمستخدمين الذين يرغبون في تكرار النتائج من الصفر.

النظام البيئي وسهولة الاستخدام

ميزة Ultralytics

أحد أهم العوامل المميزة لـ YOLOv8 هو نظام Ultralytics القوي. هذا النموذج ليس مجرد مستودع للرموز البرمجية، بل هو منتج مدعوم بالكامل ومتكامل في سير عمل سلس.

واجهة برمجة تطبيقات موحدة: يمكن للمطورين التبديل بين المهام —الكشف والتجزئة وتقدير الوضع و OBB والتصنيف— بمجرد تغيير حجة سلسلة واحدة.
Ultralytics : تتيح Ultralytics إدارة مجموعات البيانات وتدريب النماذج ونشرها بسهولة مباشرة من المتصفح.
تكامل واسع النطاق: دعم أصلي لأدوات MLOps مثل Weights & Biasesو Cometو MLflow يضمن أن تتبع التجارب يكون سهل الاستخدام.

واجهة Python بسيطة

YOLOv8 تشغيل الاستدلال باستخدام YOLOv8 بضع أسطر فقط من التعليمات البرمجية:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

نظام PP-YOLOE+ البيئي

PP-YOLOE+ مدمج بشكل عميق في PaddlePaddle . على الرغم من قوته، إلا أن هذا قد يمثل منحنى تعلم أكثر صعوبة للمطورين المعتادين على PyTorch TensorFlow. غالبًا ما يعتمد النشر على PaddleLite أو تحويل النماذج إلى ONNX Paddle2ONNX، مما يضيف خطوة إضافية مقارنة بقدرات التصدير المباشر Ultralytics .

التدريب وكفاءة الذاكرة

تدريب فعال

YOLOv8 تصميم YOLOv8 لتحقيق كفاءة التدريب. وهو يدعم تحديد حجم الدفعة تلقائيًاGPU بشكل فوري. تم تحسين بنيته بحيث يستهلك ذاكرة VRAM أقل أثناء التدريب مقارنة بالنماذج القائمة على المحولات مثل RT-DETR، مما يتيح للمستخدمين تدريب نماذج أكبر على أجهزة من فئة المستهلكين.

الأوزان المدربة مسبقًا

Ultralytics مجموعة واسعة من الأوزان المدربة مسبقًا لمختلف المهام والأحجام (من Nano إلى X-Large). تتوفر هذه النماذج على الفور ويتم تنزيلها تلقائيًا عند الاستخدام لأول مرة، مما يسرع بشكل كبير من دورة التطوير لمشاريع التعلم النقلي. في المقابل، غالبًا ما يتطلب الاستفادة من القوة الكاملة لـ PP-YOLOE+ التنقل بين التكوينات المحددة لمكتبة PaddleDetection.

حالات الاستخدام والتوصيات

متى تختار YOLOv8

Ultralytics YOLOv8 هو الخيار الموصى به لمعظم المطورين والشركات نظرًا لتعدد استخداماته وسهولة استخدامه.

نشر Edge: مثالي للتشغيل على أجهزة مثل Raspberry Pi أو الهواتف المحمولة باستخدام TFLite أو CoreML.
المهام متعددة الوسائط: إذا كان مشروعك يتطلب تقسيمًا أو تقديرًا للوضع إلى جانب الكشف، فإن YOLOv8 حلاً موحدًا.
النماذج الأولية السريعة: تتيح واجهة CLI البسيطة CLI Python إمكانية التكرار السريع، مما يجعلها مثالية للشركات الناشئة وفعاليات الهاكاثون.
دعم المجتمع: بفضل المجتمع الضخم على GitHub و Discord، يمكن العثور على حلول للمشكلات بسرعة وموثوقية.

متى تختار PP-YOLOE+

PP-YOLOE+ هو منافس قوي إذا كنت قد استثمرت بالفعل في البنية التحتية لـ Baidu.

PaddlePaddle : ضروري للفرق التي تعتمد في عمليات الإنتاج الخاصة بها بشكل كامل على PaddlePaddle.
خوادم عالية الحوسبة: يعمل النموذج بشكل جيد في البيئات التي تتوفر فيها وحدات معالجة رسومات (GPU) متطورة للاستفادة من بنيته المعقدة لتحقيق أقصى mAP بغض النظر عن تعقيد النشر.

المستقبل: YOLO26

بينما YOLOv8 معيارًا قويًا في الصناعة، Ultralytics تخطي حدود الرؤية الحاسوبية. الإصدار الأخير YOLO26 الذي تم إصداره مؤخرًا يمثل الجيل التالي من الكفاءة.

يقدم YOLO26 تصميمًا شاملاً NMS، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وينتج عن ذلك استنتاج أسرع ومنطق نشر أبسط. علاوة على ذلك، فإن الابتكارات مثل MuSGD Optimizer و DFL Removal تجعل YOLO26 أسرع بنسبة تصل إلى 43٪ على CPU مقارنة بالأجيال السابقة، مما يعزز مكانته كخيار متميز للحوسبة المتطورة.

بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، YOLOv8 بشدة بتقييم YOLO26 جنبًا إلى جنب مع YOLOv8 لضمان استمرارية تطبيقاتك في المستقبل.

تعرف على المزيد حول YOLO26

الخلاصة

يعد كل من YOLOv8 PP-YOLOE+ نموذجين ممتازين لاكتشاف الأجسام. ومع ذلك، Ultralytics YOLOv8 يتميز بتصميمه المتمركز حول المستخدم ووثائقه الشاملة وتعدد استخداماته الذي لا مثيل له. من خلال تقليل عوائق الدخول مع الحفاظ على الأداء المتطور، يتيح YOLOv8— وخليفته YOLO26 — للمطورين إمكانية إنشاء حلول ذكاء اصطناعي متطورة بأقل قدر من الصعوبات.

لمزيد من الاستكشاف لمقارنات النماذج، راجع تحليلاتنا لـ YOLOv8 EfficientDet و YOLOv8 YOLOv6.