PP-YOLOE+ مقابل YOLOv10: مقارنة بين أجهزة الكشف الحديثة عن الأجسام
تطور مجال الكشف عن الأجسام في الوقت الفعلي بسرعة كبيرة، مدفوعًا بالحاجة إلى نماذج توازن بين الدقة العالية والكمون المنخفض. ومن المساهمات المهمة في هذا المجال PP-YOLOE+، الذي طورته Baidu كجزء من مجموعة PaddleDetection، و YOLOv10، وهو إصدار أكاديمي من جامعة Tsinghua قدم التدريب NMS.
يقدم هذا الدليل مقارنة تقنية مفصلة بين هاتين البنيتين، حيث يبحث في مقاييس أدائهما ومنهجيات التدريب ومدى ملاءمتهما لمختلف تطبيقات الرؤية الحاسوبية. ورغم أن كلا النموذجين يقدمان إمكانات مذهلة، فإننا نسلط الضوء أيضًا على كيفية توفير Ultralytics والنماذج الأحدث مثل YOLO26 مسارًا أكثر توحيدًا وكفاءة للنشر.
نظرة عامة على الطراز والمواصفات الفنية
فهم مصدر كل طراز وفلسفة تصميمه يساعد في اختيار الأداة المناسبة لقيود الهندسة الخاصة بك.
PP-YOLOE+
PP-YOLOE+ هو إصدار مطور من PP-YOLOE، يركز على تحسين آلية عدم الارتباط وكفاءة التدريب. وهو مدمج بشكل عميق في PaddlePaddle .
- المؤلفون:PaddlePaddle
- المؤسسة:بايدو
- التاريخ: أبريل 2022
- المرجع:arXiv:2203.16250
- الهندسة الرئيسية: تستخدم بنية CSPRepResNet مع استراتيجية تعيين التسميات Task Alignment Learning (TAL). تعتمد على تصميم رأس قياسي بدون مرساة.
YOLOv10
YOLOv10 شكلت تحولًا مهمًا في YOLO من خلال تقديم تصميم شامل يلغي الحاجة إلى القمع غير الأقصى (NMS) أثناء الاستدلال.
- المؤلفون: آو وانغ، هوي تشين، وآخرون.
- المؤسسة:جامعة تسينغ - هوا
- التاريخ: مايو 2024
- المرجع:arXiv:2405.14458
- الهندسة الرئيسية: تتميز بمهام مزدوجة متسقة للتدريب NMS وتصميم نموذج شامل قائم على الكفاءة والدقة.
معايير الأداء
يقارن الجدول التالي النماذج الموجودة في COCO . تشمل المقاييس الرئيسية متوسط الدقة (mAP) وسرعة الاستدلال على تكوينات الأجهزة المختلفة. لاحظ الزيادة الكبيرة في الكفاءة في YOLOv10 لا سيما في عدد المعلمات.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
تحليل الأداء
YOLOv10 بكفاءة فائقة، حيث يحقق في كثير من الأحيان دقة مماثلة أو أفضل باستخدام معلمات أقل بكثير. على سبيل المثال، يحقق YOLOv10x تقريبًا نفس mAP PP-YOLOE+x ولكن باستخدام معلمات أقل بنسبة 42٪ تقريبًا، مما يجعله أكثر ملاءمة للنشر المحدود للذاكرة.
نظرة معمقة على الهيكلة
تصميم PP-YOLOE+
تم بناء PP-YOLOE+ على أساس قوي من PP-YOLOv2. وهو يستخدم بنية أساسية قابلة للتطوير تسمى CSPRepResNet، والتي تجمع بين الاتصالات المتبقية والشبكات الجزئية عبر المراحل لتحسين تدفق التدرج. الرأس خالٍ من المراسي، مما يبسط مساحة البحث عن المعلمات الفائقة مقارنة بالسابقات القائمة على المراسي مثل YOLOv4.
ومع ذلك، يعتمد PP-YOLOE+ على خطوات معالجة لاحقة معقدة. وعلى الرغم من دقته، فإن الاعتماد على NMS يؤدي إلى اختناقات في زمن الاستجابة في المشاهد المزدحمة حيث تتداخل العديد من المربعات المحيطة.
YOLOv10 : معالجة شاملة
YOLOv10 تحولاً جذرياً من خلال التخلص من NMS . ويحقق ذلك من خلال التعيينات المزدوجة المتسقة:
- التعيين من واحد إلى العديد: يستخدم أثناء التدريب لتوفير إشارات إشراف غنية.
- المهمة الفردية: تُستخدم للاستدلال لضمان تنبؤات فريدة لكل كائن.
يتيح هذا التوافق نشر النموذج دون الحاجة إلى إجراء عمليات فرز وتصفية المربعات، وهو ما يمثل ميزة كبيرة للتطبيقات التي تعمل في الوقت الفعلي.
النظام البيئي وسهولة الاستخدام
غالبًا ما يكون النظام البيئي المحيط بالنموذج مهمًا بقدر أهمية البنية نفسها. وهنا يظهر الفرق بين النماذج PaddlePaddle والنماذج Ultralytics بشكل أكثر وضوحًا.
ميزة Ultralytics
يتم دعم كل من YOLOv10 YOLO26 الأحدث ضمنPython Ultralytics Python مما يوفر تجربة سلسة للمطورين.
- واجهة برمجة تطبيقات موحدة: قم بالتبديل بين النماذج (على سبيل المثال، من YOLOv8 YOLOv10 YOLO26) عن طريق تغيير حجة سلسلة واحدة.
- تكامل المنصة: يمكن للمستخدمين الاستفادة من Ultralytics لإدارة مجموعات البيانات وتصور عمليات التدريب ونشر النماذج على الويب ونقاط النهاية الطرفية ببضع نقرات.
- دعم واسع للتصدير: في حين أن PP-YOLOE+ مُحسّن للاستدلال Paddle، فإن Ultralytics تُصدّر بشكل أصلي إلى ONNXو TensorRTو CoreMLو OpenVINO، مما يغطي نطاقًا أوسع من أجهزة النشر.
from ultralytics import YOLO
# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for broad compatibility
path = model.export(format="onnx")
سير عمل PP-YOLOE+
يتطلب PP-YOLOE+ عمومًا تثبيت PaddlePaddle مستودع PaddleDetection. هذا النظام البيئي قوي ولكنه قد يكون أقل سهولة في الوصول إليه بالنسبة للمستخدمين الذين اعتادوا على PyTorch القياسي. غالبًا ما تعطي عملية التصدير الأولوية لمحرك Paddle Inference، مما قد يتطلب خطوات تحويل إضافية للنشر العام.
المستقبل: YOLO26
بينما YOLOv10 مفهوم NMS فإن الإصدار الأخير YOLO26 الذي تم إصداره مؤخرًا على هذه الابتكارات.
YOLO26 هو نظام أساسي NMS من البداية إلى النهاية، مما يضمن أسرع سرعات استدلال ممكنة دون تأخيرات في المعالجة اللاحقة. ويتميز بمحسّن MuSGD، وهو مزيج من SGD Muon (مستوحى من تدريب LLM)، مما يضمن تقاربًا مستقرًا. علاوة على ذلك، مع إزالة Distribution Focal Loss (DFL)، أصبح YOLO26 أسهل بكثير في التصدير والتشغيل على الأجهزة الطرفية منخفضة الطاقة.
بالنسبة للمطورين الذين يبحثون عن أفضل أداء من حيث السرعة والدقة — خاصةً في مجال اكتشاف الأجسام الصغيرة عبر ProgLoss و STAL— فإن YOLO26 هو مسار الترقية الموصى به.
حالات الاستخدام في العالم الحقيقي
متى تختار PP-YOLOE+
- نشر Baidu Cloud: إذا كانت البنية التحتية الخاصة بك مبنية بالفعل على Baidu Cloud أو تستخدم خدمة Paddle، فإن PP-YOLOE+ يوفر تحسينًا أصليًا.
- أجهزة محددة: بعض رقائق الذكاء الاصطناعي المتوفرة في الأسواق الآسيوية تدعم بشكل خاص النماذج PaddlePaddle .
متى تختار Ultralytics YOLOv10 YOLO26)
- الحوسبة الطرفية: مع CPU أسرع بنسبة تصل إلى 43٪ في YOLO26، تعد هذه النماذج مثالية لـ Raspberry Pi أو Jetson Nano أو عمليات النشر على الأجهزة المحمولة.
- المهام المعقدة: بالإضافة إلى الكشف، تدعم Ultralytics تقدير الوضع، وتجزئة الحالات، والكشف عن الكائنات الموجهة (OBB)، مما يتيح لك معالجة مشكلات متنوعة باستخدام أداة واحدة.
- النماذج الأولية السريعة: سهولة التدريب والتحقق تتيح للفرق التكرار السريع، وهو عامل حاسم في بيئات التطوير المرنة.
كفاءة الذاكرة
تشتهرYOLO Ultralytics YOLO باستهلاكها المنخفض للذاكرة. على عكس البنى الهندسية الثقيلة التي تستهلك كميات هائلة من CUDA تسمح YOLO الفعالة مثل YOLO26 باستخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يتيح الوصول إلى تدريبات الذكاء الاصطناعي المتطورة للجميع.
الخلاصة
كل من PP-YOLOE+ و YOLOv10 نموذجان قويان. يعد PP-YOLOE+ خيارًا قويًا PaddlePaddle بينما YOLOv10 حدود الكفاءة بفضل تصميمه NMS. ومع ذلك، للحصول على تجربة تطوير أكثر بساطة، ودعم أوسع للأجهزة، وميزات متطورة مثل مُحسِّن MuSGD و ProgLoss، يبرز Ultralytics كخيار متميز لمهندسي الرؤية الحاسوبية الحديثة.
لاستكشاف خيارات أخرى، يمكنك النظر في YOLOv8 أو RT-DETR للحصول على سيناريوهات عالية الدقة.