Link to this sectionYOLO11 مقابل PP-YOLOE+#
يُعد اختيار بنية الشبكة العصبية المثلى أمراً بالغ الأهمية عند نشر تطبيقات الرؤية الحاسوبية في بيئات الإنتاج. في هذه المقارنة التقنية، ندرس نموذجين بارزين في مجال اكتشاف الكائنات في الوقت الفعلي: Ultralytics YOLO11 ونموذج PP-YOLOE+ من Baidu. توفر كلتا البنيتين أداءً قوياً، لكنهما تتعاملان مع تحديات الدقة، وسرعة الاستدلال، ونظام المطورين بطرق مختلفة تماماً.
فيما يلي مخطط تفاعلي يعرض حدود أداء هذه النماذج لمساعدتك في تحديد الخيار الأنسب لقيود أجهزتك.
Link to this sectionأصول النماذج والسلالة التقنية#
يوفر فهم أصول وفلسفات تصميم هذه النماذج سياقاً قيماً لنقاط قوتها وحالات الاستخدام المثالية لكل منها.
Link to this sectionتفاصيل YOLO11#
يُمثل YOLO11، الذي طورته Ultralytics، تكراراً محسناً للغاية من سلسلة YOLO، حيث يعطي الأولوية للتوازن بين الاستدلال عالي السرعة، وكفاءة المعلمات الفائقة، وسهولة الاستخدام التي لا تضاهى. وهو معروف على نطاق واسع بقدراته الموحدة للمهام المتعددة وواجهة برمجة تطبيقات Python الصديقة للمطورين.
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- المستندات: توثيق YOLO11
Link to this sectionتفاصيل PP-YOLOE+#
PP-YOLOE+ هو نسخة مطورة من PP-YOLOv2، مبنية على إطار عمل PaddlePaddle. يقدم تغييرات معمارية مثل العمود الفقري CSPRepResNet وTask Alignment Learning (TAL) لدفع حدود الدقة، خاصة على وحدات معالجة الرسومات (GPUs) عالية الأداء.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- المستندات: مستندات تكوين PP-YOLOE+
Link to this sectionالاختلافات المعمارية#
تعكس التصاميم المعمارية الأساسية لكل من YOLO11 وPP-YOLOE+ أولوياتهما المختلفة في مشهد الرؤية الحاسوبية.
YOLO11 مبني على عمود فقري مُحسن للغاية ورأس اكتشاف لا يعتمد على الإرساء (anchor-free). يستخدم كتل C3k2 وSpatial Pyramid Pooling - Fast (SPPF) لالتقاط الميزات متعددة المقاييس بأقل قدر من العبء الحسابي. هذا التصميم مفيد للغاية لتقليل زمن انتقال الاستدلال على الأجهزة المقيدة بالموارد مثل وحدات NPU الطرفية ووحدات المعالجة المركزية (CPUs) للهواتف المحمولة. علاوة على ذلك، تم تصميم YOLO11 أصلاً للتعلم متعدد المهام، مما يدعم تجزئة المثيلات، وتقدير الوضعية، واكتشاف صناديق الإحاطة الموجهة (OBB) بشكل جاهز.
PP-YOLOE+ يقدم العمود الفقري CSPRepResNet ورأس مهام متوافق وفعال (ET-head). يعتمد بشكل كبير على تقنيات إعادة المعلمات لزيادة قدرة التمثيل أثناء التدريب مع طي تلك المعلمات في convolutions قياسية للاستدلال. في حين أن هذا ينتج متوسط دقة متوسط (mAP) مثير للإعجاب، تميل النماذج الناتجة إلى أن تكون أثقل من حيث المعلمات وبصمة الذاكرة، مما يجعلها أكثر ملاءمة للنشر على خوادم GPUs قوية بدلاً من أجهزة الحافة خفيفة الوزن.
إذا كان مشروعك يتطلب التوسع إلى ما هو أبعد من صناديق الإحاطة القياسية، فإن Ultralytics YOLO11 يوفر دعماً أصلياً للتجزئة، وتقدير الوضعية، والتصنيف ضمن نفس واجهة برمجة التطبيقات تماماً، مما يقلل بشكل كبير من عبء التطوير مقارنة بدمج مستودعات متعددة ومنفصلة.
Link to this sectionالأداء والمعايير القياسية#
عند تقييم الأداء، ننظر إلى الدقة (mAP)، وسرعة الاستدلال عبر الأجهزة المختلفة، وكفاءة النموذج (المعلمات وFLOPs). يسلط الجدول أدناه الضوء على المقاييس المقارنة، مع إبراز القيم الأكثر كفاءة أو الأعلى أداءً بخط عريض.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Link to this sectionتحليل#
يُظهر YOLO11 ميزة واضحة في توازن الأداء وكفاءة المعلمات. على سبيل المثال، يحقق YOLO11m متوسط دقة (mAP) أعلى (51.5) من PP-YOLOE+m (49.8) بينما يستخدم عدداً أقل من المعلمات (20.1 مليون مقابل 23.43 مليون) ويحقق سرعات استدلال أسرع بكثير على TensorRT (4.7 مللي ثانية مقابل 5.56 مللي ثانية). الطبيعة خفيفة الوزن لنماذج YOLO11 تترجم بطبيعتها إلى متطلبات ذاكرة أقل أثناء كل من تدريب النموذج والنشر.
Link to this sectionنظام التدريب وسهولة الاستخدام#
غالباً ما تكمن القيمة الحقيقية للنموذج في مدى سهولة تدريب المطورين له على مجموعات بيانات الرؤية الحاسوبية المخصصة ونشره في الإنتاج.
Link to this sectionميزة Ultralytics#
تعطي Ultralytics الأولوية لتجربة مطور مبسطة. تتم إدارة تدريب YOLO11 من خلال واجهة برمجة تطبيقات Python بسيطة أو CLI، مما يلغي الحاجة إلى كتابة كود نمطي معقد. تعمل منصة Ultralytics على تعزيز ذلك من خلال توفير تدريب بدون كود، وإدارة آلية لمجموعة البيانات، وتصدير بنقرة واحدة إلى تنسيقات مثل ONNX، وCoreML، وTensorRT.
علاوة على ذلك، تتميز نماذج YOLO بكفاءة عالية في استخدام الذاكرة أثناء التدريب، مما يتجنب عبء VRAM الهائل النموذجي للبنى القائمة على Transformer أو النماذج الثقيلة ذات إعادة المعلمات، مما يتيح التدريب على أجهزة المستهلك العادية.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionنظام PP-YOLOE+ البيئي#
يعمل PP-YOLOE+ ضمن نظام PaddleDetection البيئي. على الرغم من أن إطار العمل هذا قوي ومتكامل بعمق مع حلول Baidu الصناعية، إلا أنه يتطلب من المطورين اعتماد إطار عمل التعلم العميق PaddlePaddle المحدد. يمكن أن يفرض هذا منحنى تعلم أكثر حدة للفرق التي تعتمد بالفعل على PyTorch كمعيار. بالإضافة إلى ذلك، قد يتطلب تصدير نماذج PP-YOLOE+ إلى تنسيقات عالمية قياسية لأجهزة الحافة خطوات تحويل إضافية مقارنة بخطوط أنابيب التصدير الأصلية الموجودة في سير عمل Ultralytics.
Link to this sectionحالات الاستخدام المثالية#
يعتمد الاختيار بين هذه النماذج على بيئة النشر الخاصة بك.
- اختر YOLO11 للتطوير السريع، والحوسبة الحافية، وتطبيقات الهاتف المحمول. سرعة الاستدلال العالية، وبصمة الذاكرة المنخفضة، وقدرات التصدير الواسعة تجعلها مثالية لمهام مثل إدارة مخزون التجزئة في الوقت الفعلي على وحدات المعالجة المركزية (CPUs) القياسية، وتحليل الصور الجوية المعتمد على الطائرات بدون طيار، وخطوط أنابيب المهام المتعددة المعقدة.
- اختر PP-YOLOE+ إذا كان خط إنتاجك بالكامل مستثمراً بالفعل بكثافة في نظام PaddlePaddle البيئي، أو إذا كنت تنشر على خوادم استدلال مخصصة وعالية الأداء حيث لا تشكل قيود الذاكرة وتوافق الأجهزة (خارج الأجهزة المحسنة لـ Paddle) شواغل أساسية.
Link to this sectionالجيل القادم: تقديم YOLO26#
بينما يظل YOLO11 قوياً جداً، فإن مجال الذكاء الاصطناعي يتحرك بسرعة. للحصول على أحدث التقنيات في اكتشاف الكائنات، قدمت Ultralytics نموذج YOLO26 الجديد. تم إصداره في يناير 2026، ويبني YOLO26 على نجاحات سابقيه لتقديم كفاءة ودقة غير مسبوقتين.
ابتكارات YOLO26 الرئيسية:
- تصميم من طرف إلى طرف لا يتطلب NMS: يعمل YOLO26 أصلاً على إلغاء المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). هذا يسرع الاستدلال بشكل كبير ويبسط منطق النشر، وهي قفزة معمارية تم ابتكارها لأول مرة في YOLOv10.
- استدلال أسرع على CPU بنسبة تصل إلى 43%: تم تحسينه خصيصاً لأجهزة الحافة التي لا تحتوي على وحدات GPU، مما يضمن أداءً في الوقت الفعلي على الأجهزة ذات الطاقة المنخفضة.
- مُحسِّن MuSGD: مستوحى من استقرار تدريب LLM، يضمن هذا الهجين بين SGD وMuon تقارباً أسرع وتدريباً أكثر استقراراً.
- ProgLoss + STAL: تعمل دوال الخسارة المحسنة على تحسين التعرف على الكائنات الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لـ تطبيقات الطائرات بدون طيار والمراقبة الأمنية.
- إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط تصدير النموذج وتحسين التوافق بشكل كبير عبر مجموعة واسعة من أجهزة الحافة.
للمشاريع الجديدة التي تعطي الأولوية للسرعة، والتصدير السلس، وأقصى قدر من الدقة، نوصي بشدة بالاستفادة من قدرات YOLO26 عبر منصة Ultralytics.
إذا كنت تقيم معماريات أخرى، فقد تكون مهتماً أيضاً بمقارنة YOLO11 بـ RT-DETR أو استكشاف كيف يصمد YOLOv8 القديم في المعايير الحديثة.