YOLO11 مقابل PP-YOLOE+: مقارنة تقنية بين كواشف الوقت الفعلي

يعد اختيار بنية الشبكة العصبية المثلى أمراً بالغ الأهمية عند نشر تطبيقات رؤية الحاسوب في بيئات الإنتاج. في هذه المقارنة التقنية، ندرس نموذجين بارزين في مجال اكتشاف الأشياء في الوقت الفعلي: Ultralytics YOLO11 وPP-YOLOE+ من Baidu. توفر كلتا البنيتين أداءً قوياً، لكنهما تتعاملان مع تحديات الدقة، وسرعة الاستدلال، ونظام مطوري البرمجيات بطرق مختلفة تماماً.

فيما يلي مخطط تفاعلي يعرض حدود أداء هذه النماذج لمساعدتك في تحديد الأنسب لقيود أجهزتك.

أصول النماذج والسلالة التقنية

يوفر فهم أصول وفلسفات التصميم لهذه النماذج سياقاً قيماً لنقاط قوتها وحالات استخدامها المثالية.

تفاصيل YOLO11

يُمثل YOLO11، الذي طورته Ultralytics، إصداراً محسناً للغاية من سلسلة YOLO، حيث يعطي الأولوية للتوازن بين استدلال عالي السرعة، وكفاءة فائقة في المعلمات، وسهولة استخدام لا تضاهى. ويُعرف على نطاق واسع بقدراته الموحدة للمهام المتعددة وواجهة برمجة تطبيقات Python الصديقة للمطورين.

اعرف المزيد عن YOLO11

تفاصيل PP-YOLOE+

PP-YOLOE+ هو إصدار مطور من PP-YOLOv2، مبني على إطار عمل PaddlePaddle. وهو يقدم تغييرات معمارية مثل العمود الفقري CSPRepResNet وتعلم محاذاة المهام (TAL) لدفع حدود الدقة، خاصة على وحدات معالجة الرسومات (GPUs) المتطورة.

تعرف على المزيد حول PP-YOLOE+

الاختلافات المعمارية

تعكس التصميمات المعمارية الأساسية لـ YOLO11 وPP-YOLOE+ أولوياتهما المختلفة في مشهد رؤية الحاسوب.

YOLO11 يبني على عمود فقري محسّن للغاية ورأس اكتشاف خالٍ من المراسي (anchor-free). يستخدم وحدات C3k2 وSpatial Pyramid Pooling - Fast (SPPF) لالتقاط الميزات متعددة النطاقات بأقل قدر من الحمل الحسابي. هذا التصميم مفيد للغاية لتقليل زمن انتقال الاستدلال على الأجهزة المحدودة الموارد مثل وحدات NPU الطرفية ووحدات المعالجة المركزية (CPUs) للهواتف المحمولة. علاوة على ذلك، تم تصميم YOLO11 أصلاً للتعلم متعدد المهام، مما يدعم تجزئة المثيلات، وتقدير الوضع، واكتشاف صناديق الإحاطة الموجهة (OBB) بشكل جاهز.

PP-YOLOE+ يقدم العمود الفقري CSPRepResNet ورأس المهام المتوافقة الفعال (ET-head). يستخدم بشكل مكثف تقنيات إعادة المعلمة (rep-parameterization) لزيادة القدرة التمثيلية أثناء التدريب مع دمج تلك المعلمات في التفافات قياسية للاستدلال. في حين أن هذا يؤدي إلى متوسط دقة (mAP) مثير للإعجاب، تميل النماذج الناتجة إلى أن تكون أثقل من حيث المعلمات وبصمة الذاكرة، مما يجعلها أكثر ملاءمة للنشر على خوادم GPUs قوية بدلاً من الأجهزة الطرفية خفيفة الوزن.

تعدد الاستخدامات في المهام المتعددة

إذا كان مشروعك يتطلب التوسع إلى ما هو أبعد من صناديق الإحاطة القياسية، يوفر Ultralytics YOLO11 دعماً أصلياً للتجزئة، وتقدير الوضع، والتصنيف ضمن نفس واجهة برمجة التطبيقات، مما يقلل بشكل كبير من عبء التطوير مقارنة بدمج مستودعات متعددة ومتميزة.

الأداء والمعايير

عند تقييم الأداء، ننظر إلى الدقة (mAP)، وسرعة الاستدلال عبر أجهزة مختلفة، وكفاءة النموذج (المعلمات وFLOPs). يسلط الجدول أدناه الضوء على المقاييس المقارنة، مع القيم الأكثر كفاءة أو الأعلى أداءً بالخط العريض.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

التحليل

يُظهر YOLO11 ميزة واضحة في توازن الأداء وكفاءة المعلمات. على سبيل المثال، يحقق YOLO11m دقة mAP أعلى (51.5) مقارنة بـ PP-YOLOE+m (49.8) بينما يستخدم معلمات أقل (20.1M مقابل 23.43M) ويحقق سرعات استدلال أسرع بشكل ملحوظ على TensorRT (4.7ms مقابل 5.56ms). تترجم الطبيعة خفيفة الوزن لنماذج YOLO11 بطبيعتها إلى متطلبات ذاكرة أقل أثناء كل من تدريب النموذج والنشر.

نظام التدريب وسهولة الاستخدام

غالباً ما تكمن القيمة الحقيقية للنموذج في مدى سهولة تدريب المطورين له على مجموعات بيانات رؤية الحاسوب المخصصة ونشره في بيئة الإنتاج.

ميزة Ultralytics

تضع Ultralytics الأولوية لتجربة مطور مبسطة. تتم إدارة تدريب YOLO11 من خلال واجهة برمجة تطبيقات Python بسيطة أو CLI، مما يغني عن كتابة رموز برمجية روتينية معقدة. تعزز منصة Ultralytics ذلك من خلال توفير تدريب بدون كود، وإدارة آلية لمجموعات البيانات، وتصدير بنقرة واحدة إلى تنسيقات مثل ONNX، وCoreML، وTensorRT.

علاوة على ذلك، تتميز نماذج YOLO بكفاءة عالية في الذاكرة أثناء التدريب، مما يتجنب عبء VRAM الهائل النموذجي للبنى القائمة على Transformer أو النماذج المعقدة ذات المعلمات المعاد تشكيلها، مما يتيح التدريب على أجهزة المستهلك العادية.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

نظام PP-YOLOE+ البيئي

يعمل PP-YOLOE+ ضمن نظام PaddleDetection البيئي. على الرغم من أن إطار العمل هذا قوي ومتكامل بعمق مع حلول Baidu الصناعية، إلا أنه يتطلب من المطورين تبني إطار عمل التعلم العميق PaddlePaddle المحدد. يمكن أن يفرض هذا منحنى تعلم أكثر حدة للفرق التي تعتمد بالفعل على PyTorch. بالإضافة إلى ذلك، قد يتطلب تصدير نماذج PP-YOLOE+ إلى تنسيقات عالمية قياسية للأجهزة الطرفية خطوات تحويل إضافية مقارنة بخطوط أنابيب التصدير الأصلية الموجودة في سير عمل Ultralytics.

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج على بيئة النشر الخاصة بك.

  • اختر YOLO11 للتطوير السريع، والحوسبة الطرفية، وتطبيقات الهاتف المحمول. سرعة الاستدلال العالية، وبصمة الذاكرة المنخفضة، وإمكانات التصدير الواسعة تجعله مثالياً لمهام مثل إدارة مخزون التجزئة في الوقت الفعلي على وحدات المعالجة المركزية العادية، وتحليل الصور الجوية بواسطة الطائرات بدون طيار، وخطوط أنابيب المهام المتعددة المعقدة.
  • اختر PP-YOLOE+ إذا كان خط إنتاجك بالكامل مستثمراً بالفعل بكثافة في نظام PaddlePaddle البيئي أو إذا كنت تقوم بالنشر على خوادم استدلال مخصصة وعالية الأداء حيث لا تعد قيود الذاكرة وتوافق الأجهزة (خارج الأجهزة المحسّنة لـ Paddle) مخاوف رئيسية.

الجيل القادم: تقديم YOLO26

بينما لا يزال YOLO11 قوياً للغاية، فإن مجال الذكاء الاصطناعي يتحرك بسرعة. للحصول على أحدث ما توصلت إليه تكنولوجيا اكتشاف الأشياء، قدمت Ultralytics طراز YOLO26 الجديد. تم إصداره في يناير 2026، ويبني YOLO26 على نجاحات أسلافه لتقديم كفاءة ودقة غير مسبوقة.

ابتكارات YOLO26 الرئيسية:

  • تصميم من طرف إلى طرف خالٍ من NMS: يلغي YOLO26 أصلاً معالجة ما بعد الاكتشاف Non-Maximum Suppression (NMS). هذا يسرع الاستدلال بشكل كبير ويبسط منطق النشر، وهي قفزة معمارية تم ريادتها لأول مرة في YOLOv10.
  • استدلال أسرع على وحدة المعالجة المركزية بما يصل إلى 43%: تم تحسينه خصيصاً للأجهزة الطرفية التي لا تحتوي على وحدات GPU، مما يضمن أداءً في الوقت الفعلي على الأجهزة ذات الطاقة المنخفضة.
  • مُحسِّن MuSGD: مستوحى من استقرار تدريب النماذج اللغوية الكبيرة (LLM)، يضمن هذا الهجين من SGD وMuon تقارباً أسرع وتدريباً أكثر استقراراً.
  • ProgLoss + STAL: تعمل دوال الخسارة المحسنة على تحسين التعرف على الأشياء الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لـ تطبيقات الطائرات بدون طيار والمراقبة الأمنية.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط تصدير النموذج وتحسين التوافق بشكل كبير عبر مجموعة واسعة من الأجهزة الطرفية.

للمشاريع الجديدة التي تعطي الأولوية للسرعة، والتصدير السلس، وأقصى قدر من الدقة، نوصي بشدة بالاستفادة من قدرات YOLO26 عبر منصة Ultralytics.

إذا كنت تقيم معماريات أخرى، فقد تكون مهتماً أيضاً بمقارنة YOLO11 بـ RT-DETR أو استكشاف مدى صمود YOLOv8 القديم في الاختبارات القياسية الحديثة.

تعليقات