PP-YOLOE+ مقابل YOLO11: استكشاف تطور الكشف عن الكائنات عالية الأداء
في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار بنية النموذج المناسب أمرًا بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة وقيود النشر. تستكشف هذه المقارنة معلمين هامين في تاريخ الكشف: PP-YOLOE+، وهو كاشف محسّن خالٍ من المراسي من PaddlePaddle و YOLO11، وهو نسخة متطورة من Ultralytics لتحقيق كفاءة وتعدد استخدامات فائقين.
بينما يمثل PP-YOLOE+ حلاً ناضجًا للتطبيقات الصناعية ضمن أطر عمل محددة، فإن YOLO11 حدود الإمكانيات المتاحة على الأجهزة الطرفية من خلال تحسينات في البنية. علاوة على ذلك، نتطلع إلى YOLO26، أحدث إنجاز يوفر اكتشافًا أصليًا شاملاً NMS.
مقارنة مقاييس الأداء
يقدم الجدول التالي مقارنة مباشرة بين مؤشرات الأداء الرئيسية. YOLO11 ميزة واضحة في الكفاءة، حيث يوفر دقة مماثلة أو أعلى مع عدد أقل بكثير من المعلمات وسرعات استدلال أسرع.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
PP-YOLOE+: PaddlePaddle
PP-YOLOE+ هو نسخة مطورة من PP-YOLOE، تم تطويره من قبل باحثين في Baidu كجزء من مجموعة أدوات PaddleDetection. ويركز على تحسين سرعة تقارب التدريب وأداء المهام النهائية لسابقه.
البنية التقنية
PP-YOLOE+ هو نموذج بدون مرساة يستفيد من العمود الفقري CSPRepResNet واستراتيجية تعلم محاذاة المهام (TAL) لتعيين التسميات. ويستخدم آلية انتباه ESE (الضغط والتحفيز الفعال) الفريدة داخل عنقه لتعزيز تمثيل الميزات. أحد الخيارات المعمارية الرئيسية هو استخدام إعادة المعلمات على غرار RepVGG، مما يتيح للنموذج الحصول على ديناميكيات تدريب معقدة تنهار إلى هياكل أبسط وأسرع أثناء الاستدلال.
تشمل الميزات الرئيسية ما يلي:
- رأس بدون مثبت: يبسط التصميم من خلال إزالة الحاجة إلى مربعات مثبتة محددة مسبقًا.
- مواءمة المهام والتعلم (TAL): يوازن ديناميكيًا بين مهام التصنيف والانحدار لتحسين الدقة.
- التدريب المسبق لـ Object365: تستفيد النسخة "Plus" (+) بشكل كبير من التدريب المسبق القوي على مجموعة البيانات الضخمة لـ Objects365 ، مما يعزز بشكل كبير سرعة التقارب على مجموعات البيانات الأصغر حجمًا.
البيانات الوصفية:
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:PP-YOLOE: نسخة متطورة من YOLO
- جيت هاب:PaddlePaddle/PaddleDetection
قيود النظام البيئي
بينما يقدم PP-YOLOE+ أداءً قويًا، إلا أنه يرتبط ارتباطًا وثيقًا بـ PaddlePaddle للتعلم العميق. TensorFlow يواجه المطورون المعتادون على PyTorch TensorFlow صعوبة في التعلم وتوترًا عند دمجها في خطوط أنابيب MLOps الحالية التي لا تدعم Paddle Inference بشكل أساسي.
Ultralytics YOLO11: إعادة تعريف الكفاءة
صدر عن Ultralytics في أواخر عام 2024، YOLO11 تحسينًا كبيرًا في YOLO حيث يعطي الأولوية لكفاءة المعلمات وقدرة استخراج الميزات. على عكس الطبيعة التي تركز على البحث لبعض البنى، YOLO11 تصميم YOLO11 للاستخدام في العالم الحقيقي، حيث يوازن بين الدقة الأولية وسرعة التشغيل.
الابتكارات المعمارية
YOLO11 كتلة C3k2، وهي نسخة أخف وزناً وأسرع من عنق الزجاجة CSP، وتدمج C2PSA (Cross-Stage Partial with Spatial Attention) لتعزيز تركيز النموذج على المناطق الحرجة من الصورة. تنتج عن هذه التغييرات نموذج أقل تكلفة من الناحية الحسابية من الإصدارات السابقة مع الحفاظ على mAP تنافسية.
تشمل المزايا للمطورين ما يلي:
- استهلاك أقل للذاكرة: YOLO11 معلمات أقل بكثير من PP-YOLOE+ للحصول على دقة مماثلة (على سبيل المثال، يحتوي YOLO11x على معلمات أقل بنسبة 42٪ تقريبًا من PP-YOLOE+x)، مما يجعله مثاليًا للأجهزة الطرفية ذات ذاكرة الوصول العشوائي المحدودة.
- إطار عمل موحد: يدعم الكشف والتجزئة والتصنيف وتقدير الوضع و OBB بسلاسة.
- PyTorch : مبني على PyTorch المعتمد على نطاق واسع، مما يضمن التوافق مع الغالبية العظمى من أدوات ومكتبات الذكاء الاصطناعي الحديثة.
البيانات الوصفية:
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:ultralytics/ultralytics
- المستندات:توثيق YOLO11
التحليل النقدي: اختيار الأداة المناسبة
1. سهولة الاستخدام والنظام البيئي
هذا هو المكان الذي يظهر فيه الفرق بشكل أكثر وضوحًا. تشتهر Ultralytics بـ سهولة الاستخدام. إن ultralytics تتيح Python التدريب والتحقق والنشر في أقل من خمس أسطر من التعليمات البرمجية عادةً.
على العكس من ذلك، يتطلب PP-YOLOE+ تثبيت PaddlePaddle واستنساخ مستودع PaddleDetection. غالبًا ما يتضمن التكوين تعديل ملفات YAML المعقدة واستخدام نصوص برمجية لسطر الأوامر بدلاً من واجهة برمجة تطبيقات Pythonic، مما قد يؤدي إلى إبطاء عملية النمذجة السريعة.
2. النشر والتنوع
YOLO11 بتنوعه. يمكن تصديره بسهولة إلى تنسيقات مثل ONNXو TensorRTو CoreML و TFLite أمر واحد. وهذا يجعله الخيار الأفضل للنشر على أجهزة متنوعة، من وحدات NVIDIA إلى iOS .
على الرغم من إمكانية تصدير PP-YOLOE+، إلا أن العملية غالبًا ما تعطي الأولوية لـ Paddle Inference أو تتطلب خطوات تحويل وسيطة (مثل Paddle2ONNX) التي قد تسبب مشكلات في التوافق. بالإضافة إلى ذلك، YOLO11 مجموعة واسعة من المهام - مثل الكشف عن Oriented Bounding Box (OBB) وتجزئة المثيلات- بشكل فوري، في حين أن PP-YOLOE+ هو في الأساس بنية تركز على الكشف.
3. كفاءة التدريب
تم تحسين Ultralytics من أجل كفاءة التدريب، وغالبًا ما تتطلب CUDA أقل وتتقارب بشكل أسرع بفضل المعلمات الفائقة المحددة مسبقًا. يوفر النظام البيئي أيضًا تكاملًا سلسًا مع أدوات تتبع التجارب مثل Comet و Weights & Biases، مما يؤدي إلى تبسيط دورة حياة MLOps.
نظرة إلى المستقبل: قوة YOLO26
للمطورين الباحثين عن أحدث التقنيات، Ultralytics YOLO26، وهي خطوة ثورية إلى الأمام تتفوق على كل من YOLO11 PP-YOLOE+.
يتميز YOLO26 بتصميم أصلي شامل NMS، وهو اختراق رائد تم تطويره لأول مرة في YOLOv10 أصبح الآن مثاليًا للإنتاج. وهذا يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، والتي غالبًا ما تكون عنق زجاجة في التطبيقات في الوقت الفعلي.
تشمل التطورات الرئيسية في YOLO26 ما يلي:
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) وتحسين بنية الرأس، تم ضبط YOLO26 خصيصًا للحوسبة الطرفية والبيئات التي لا تحتوي على وحدات معالجة رسومات قوية.
- MuSGD Optimizer: مزيج من SGD Muon (مستوحى من Kimi K2 من Moonshot AI)، يوفر هذا المحسن استقرار تدريب نموذج اللغة الكبيرة (LLM) للرؤية الحاسوبية، مما يضمن تقاربًا أسرع.
- ProgLoss + STAL: وظائف خسارة متقدمة تعمل على تحسين اكتشاف الأجسام الصغيرة، وهو أمر بالغ الأهمية لمهام مثل التصوير الجوي أو مراقبة الجودة.
- تحسينات خاصة بالمهام: تتضمن فقدان التجزئة الدلالية لتحسين دقة القناع وفقدان الزاوية المتخصصة لـ OBB، مع معالجة حالات انقطاع الحدود.
التوصية
بالنسبة للمشاريع الجديدة، يُوصى باستخدام YOLO26. تعمل بنيته NMS على تبسيط خطوط النشر بشكل كبير، مما يزيل تعقيد ضبط IoU للمعالجة اللاحقة.
مثال على التنفيذ
جرب بساطة Ultralytics . يوضح الرمز التالي كيفية تحميل النموذج وتدريبه. يمكنك التبديل بسهولة بين YOLO11 YOLO26 عن طريق تغيير سلسلة اسم النموذج.
from ultralytics import YOLO
# Load the latest YOLO26 model (or use "yolo11n.pt")
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The system automatically handles data augmentation and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
# NMS-free output is handled automatically for YOLO26
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified deployment
path = model.export(format="onnx")
بالنسبة للمستخدمين المهتمين ببنى متخصصة أخرى، تغطي الوثائق أيضًا نماذج مثل RT-DETR للكشف القائم على المحولات و YOLO للمهام ذات المفردات المفتوحة.
الخلاصة
بينما يظل PP-YOLOE+ خيارًا قويًا لأولئك الذين استثمروا بشكل كبير في نظام بايدو البيئي، YOLO11 و YOLO26 الأحدث يقدمان حزمة أكثر جاذبية لمجتمع المطورين العام. بفضل سهولة الاستخدام الفائقة ومتطلبات الذاكرة المنخفضة وخيارات التصدير الشاملة والمجتمع المزدهر، توفر Ultralytics التوازن في الأداء اللازم لتطبيقات الرؤية الحاسوبية الحديثة والقابلة للتطوير.