YOLO11 PP-YOLOE+: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي
يعد اختيار بنية الشبكة العصبية المثلى أمرًا بالغ الأهمية عند نشر تطبيقات الرؤية الحاسوبية في الإنتاج. في هذه المقارنة الفنية، ندرس نموذجين بارزين في مجال الكشف عن الكائنات في الوقت الفعلي: Ultralytics YOLO11 و PP-YOLOE+ من Baidu. توفر كلتا البنيتين أداءً قويًا، ولكنهما تتعاملان مع تحديات الدقة وسرعة الاستدلال ونظام المطورين بشكل مختلف تمامًا.
فيما يلي مخطط تفاعلي يعرض حدود أداء هذه النماذج لمساعدتك في تحديد الأنسب لقيود أجهزتك.
أصول النموذج وسلسلة التقنيات
إن فهم أصول هذه النماذج وفلسفات تصميمها يوفر سياقًا قيمًا لفهم نقاط قوتها وحالات الاستخدام المثالية لكل منها.
YOLO11
تم تطوير YOLO11 بواسطة Ultralytics YOLO11 نسخة مطورة للغاية من YOLO حيث يركز على تحقيق التوازن بين الاستدلال عالي السرعة وكفاءة المعلمات القصوى وسهولة الاستخدام التي لا مثيل لها. وهو معروف على نطاق واسع بقدراته المتعددة المهام الموحدة Python سهلة الاستخدام للمطورين.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- المستندات:توثيق YOLO11
تفاصيل PP-YOLOE+
PP-YOLOE+ هو إصدار مطور من PP-YOLOv2، تم بناؤه على PaddlePaddle . ويقدم تغييرات في البنية مثل العمود الفقري CSPRepResNet وتعلم محاذاة المهام (TAL) لتوسيع حدود الدقة، خاصة على وحدات معالجة الرسومات (GPU) المتطورة.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- أرشيف:https://arxiv.org/abs/2203.16250
- GitHub:https://github.com/PaddlePaddle/PaddleDetection/
- الوثائق:وثائق إعدادات PP-YOLOE+
الاختلافات المعمارية
تعكس التصميمات المعمارية الأساسية لـ YOLO11 PP-YOLOE+ أولوياتهما المختلفة في مجال الرؤية الحاسوبية.
YOLO11 يعتمد على بنية أساسية محسّنة للغاية ورأس اكتشاف خالٍ من المراسي. يستخدم كتل C3k2 و Spatial Pyramid Pooling - Fast (SPPF) لالتقاط ميزات متعددة المقاييس بأقل حمل حسابي. هذا التصميم مفيد للغاية لتقليل زمن انتقال الاستدلال على الأجهزة محدودة الموارد مثل وحدات معالجة الشبكات العصبية الطرفية (NPUs) ووحدات المعالجة المركزية (CPUs) المحمولة. علاوة على ذلك، تم تصميم YOLO11 أصلاً للتعلم متعدد المهام، ويدعم تجزئة الكائنات، وتقدير الوضعيات، واكتشاف مربعات الإحاطة الموجهة (obb) مباشرةً.
PP-YOLOE+ يقدم هيكل CSPRepResNet الأساسي ورأس محاذاة المهام الفعال (ET-head). يستفيد بشكل كبير من تقنيات إعادة التوسيط (rep-parameterization) لزيادة القدرة التمثيلية أثناء التدريب، مع دمج تلك المعلمات في التفافات قياسية للاستدلال. وبينما يحقق هذا متوسط دقة (mAP) مثيرًا للإعجاب، تميل النماذج الناتجة إلى أن تكون أثقل من حيث المعلمات واستهلاك الذاكرة، مما يجعلها أكثر ملاءمة للنشر على وحدات معالجة رسوميات (GPU) خوادم قوية بدلاً من أجهزة الحافة خفيفة الوزن.
تعدد المهام وتعدد الاستخدامات
إذا كان مشروعك يتطلب توسيع نطاقه إلى ما وراء المربعات المحددة القياسية، فإن Ultralytics YOLO11 دعمًا أصليًا للتجزئة وتقدير الوضع والتصنيف ضمن نفس واجهة برمجة التطبيقات (API) بالضبط، مما يقلل بشكل كبير من تكاليف التطوير مقارنة بدمج عدة مستودعات مختلفة.
الأداء والمعايير
عند تقييم الأداء، ننظر إلى الدقة (mAP) وسرعة الاستدلال عبر الأجهزة المختلفة وكفاءة النموذج (المعلمات و FLOPs). يوضح الجدول أدناه المقاييس المقارنة، مع إبراز القيم الأكثر كفاءة أو الأعلى أداءً بالخط العريض.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
تحليل
YOLO11 ميزة واضحة في توازن الأداء وكفاءة المعلمات. على سبيل المثال، YOLO11m يحقق mAP أعلى (51.5) من PP-YOLOE+m (49.8) مع استخدام عدد أقل من المعاملات (20.1 مليون مقابل 23.43 مليون) وتحقيق سرعات استدلال أسرع بكثير على TensorRT (4.7 مللي ثانية مقابل 5.56 مللي ثانية). تترجم الطبيعة خفيفة الوزن لنماذج YOLO11 بطبيعتها إلى متطلبات ذاكرة أقل أثناء كل من تدريب النموذج والنشر.
نظام التدريب وسهولة الاستخدام
غالبًا ما تكمن القيمة الحقيقية للنموذج في سهولة تدريبه على مجموعات بيانات الرؤية الحاسوبية المخصصة ونشره في الإنتاج.
ميزة Ultralytics
Ultralytics لتجربة مطور مبسطة. YOLO11 إدارة تدريب YOLO11 من خلال Python أو CLI بسيطة، مما يزيل الحاجة إلى استخدام أكواد نمطية معقدة. تعزز Ultralytics ذلك من خلال توفير تدريب بدون أكواد، وإدارة آلية لمجموعات البيانات، وتصدير بنقرة واحدة إلى تنسيقات مثل ONNXو CoreML و TensorRT.
علاوة على ذلك، تتميز YOLO بكفاءة عالية في استخدام الذاكرة أثناء التدريب، مما يتيح تجنب الأعباء الضخمة على ذاكرة VRAM التي عادة ما تصاحب البنى القائمة على المحولات أو النماذج الثقيلة ذات المعلمات المتكررة، مما يتيح التدريب على أجهزة من فئة المستهلكين.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
نظام PP-YOLOE+ البيئي
يعمل PP-YOLOE+ ضمن نظام PaddleDetection البيئي. على الرغم من أن هذا الإطار قوي ومتكامل بشكل عميق مع حلول Baidu الصناعية، إلا أنه يتطلب من المطورين اعتماد إطار التعلم PaddlePaddle المحدد. قد يؤدي ذلك إلى زيادة صعوبة التعلم بالنسبة للفرق التي تعتمد بالفعل على PyTorch. بالإضافة إلى ذلك، قد يتطلب تصدير نماذج PP-YOLOE+ إلى تنسيقات عالمية قياسية للأجهزة الطرفية خطوات تحويل إضافية مقارنة بخطوط التصدير الأصلية الموجودة في Ultralytics .
حالات الاستخدام المثالية
يعتمد الاختيار بين هذه النماذج على بيئة النشر المحددة الخاصة بك.
- اختر YOLO11 للتطوير السريع، والحوسبة الطرفية، وتطبيقات الهاتف المحمول. سرعة الاستدلال العالية، وبصمة الذاكرة المنخفضة، وقدرات التصدير الواسعة تجعله مثاليًا لمهام مثل إدارة مخزون التجزئة في الوقت الفعلي على وحدات المعالجة المركزية (CPUs) القياسية، وتحليل الصور الجوية القائمة على الطائرات بدون طيار، ومسارات العمل المعقدة متعددة المهام.
- اختر PP-YOLOE+ إذا كان مسار عمل الإنتاج الخاص بك مستثمرًا بالفعل بكثافة في نظام PaddlePaddle البيئي، أو إذا كنت تقوم بالنشر على خوادم استدلال متخصصة وعالية الأداء حيث لا تمثل قيود الذاكرة وتوافق الأجهزة (خارج الأجهزة المحسّنة لـ Paddle) اهتمامات أساسية.
الجيل القادم: تقديم YOLO26
في حين أن YOLO11 قوياً للغاية، إلا أن مجال الذكاء الاصطناعي يتطور بسرعة. من أجل تحقيق أحدث ما توصلت إليه التكنولوجيا في مجال الكشف عن الأشياء، Ultralytics منتجها الجديد YOLO26. تم إصدار YOLO26 في يناير 2026، وهو يعتمد على نجاحات سابقيه لتقديم كفاءة ودقة غير مسبوقة.
أهم ابتكارات YOLO26:
- تصميم شامل بدون NMS: يلغي YOLO26 بطبيعته المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يسرع الاستدلال بشكل كبير ويبسط منطق النشر، وهو قفزة معمارية كانت رائدة لأول مرة في YOLOv10.
- استدلال أسرع على CPU بنسبة تصل إلى 43%: مُحسّن خصيصًا للأجهزة الطرفية التي لا تحتوي على وحدات GPU، مما يضمن أداءً في الوقت الفعلي على الأجهزة منخفضة الطاقة.
- مُحسِّن MuSGD: مستوحى من استقرار تدريب نماذج اللغة الكبيرة (LLM)، يضمن هذا الهجين من SGD و Muon تقاربًا أسرع وتدريبًا أكثر استقرارًا.
- ProgLoss + STAL: دوال خسارة محسنة تعزز بشكل كبير التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتطبيقات الطائرات بدون طيار والمراقبة الأمنية.
- إزالة DFL: تبسط إزالة Distribution Focal Loss تصدير النموذج وتحسن بشكل كبير التوافق عبر مجموعة واسعة من الأجهزة الطرفية.
بالنسبة للمشاريع الجديدة التي تعطي الأولوية للسرعة والتصدير السلس والدقة القصوى، نوصي بشدة بالاستفادة من إمكانات YOLO26 عبر Ultralytics .
إذا كنت تقوم بتقييم بنى أخرى، فقد تكون مهتمًا أيضًا بمقارنة YOLO11 RT-DETR أو استكشاف كيفية عمل YOLOv8 في المعايير الحديثة.