تخطي إلى المحتوى

YOLO11 PP-YOLOE+: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي

يعد اختيار بنية الشبكة العصبية المثلى أمرًا بالغ الأهمية عند نشر تطبيقات الرؤية الحاسوبية في الإنتاج. في هذه المقارنة الفنية، ندرس نموذجين بارزين في مجال الكشف عن الكائنات في الوقت الفعلي: Ultralytics YOLO11 و PP-YOLOE+ من Baidu. توفر كلتا البنيتين أداءً قويًا، ولكنهما تتعاملان مع تحديات الدقة وسرعة الاستدلال ونظام المطورين بشكل مختلف تمامًا.

فيما يلي مخطط تفاعلي يعرض حدود أداء هذه النماذج لمساعدتك في تحديد الأنسب لقيود الأجهزة لديك.

أصول النموذج وسلسلة التقنيات

إن فهم أصول هذه النماذج وفلسفات تصميمها يوفر سياقًا قيمًا لفهم نقاط قوتها وحالات الاستخدام المثالية لكل منها.

YOLO11

تم تطوير YOLO11 بواسطة Ultralytics YOLO11 نسخة مطورة للغاية من YOLO حيث يركز على تحقيق التوازن بين الاستدلال عالي السرعة وكفاءة المعلمات القصوى وسهولة الاستخدام التي لا مثيل لها. وهو معروف على نطاق واسع بقدراته المتعددة المهام الموحدة Python سهلة الاستخدام للمطورين.

تعرف على المزيد حول YOLO11

تفاصيل PP-YOLOE+

PP-YOLOE+ هو إصدار مطور من PP-YOLOv2، تم بناؤه على PaddlePaddle . ويقدم تغييرات في البنية مثل العمود الفقري CSPRepResNet وتعلم محاذاة المهام (TAL) لتوسيع حدود الدقة، خاصة على وحدات معالجة الرسومات (GPU) المتطورة.

تعرف على المزيد حول PP-YOLOE+

الاختلافات المعمارية

تعكس التصميمات المعمارية الأساسية لـ YOLO11 PP-YOLOE+ أولوياتهما المختلفة في مجال الرؤية الحاسوبية.

YOLO11 يعتمد على بنية أساسية محسّنة للغاية ورأس كشف بدون مرساة. ويستخدم كتل C3k2 و Spatial Pyramid Pooling - Fast (SPPF) لالتقاط ميزات متعددة المقاييس بأقل قدر من الحمل الحسابي. هذا التصميم مفيد للغاية لتقليل زمن الاستدلال على الأجهزة ذات الموارد المحدودة مثل وحدات المعالجة العصبية الطرفية (NPU) ووحدات المعالجة المركزية (CPU) المحمولة. علاوة على ذلك، YOLO11 تصميم YOLO11 أصلاً للتعلم متعدد المهام، حيث يدعم تقسيم المثيلات وتقدير الوضع والكشف عن المربعات المحددة (OBB) فور تشغيله.

يقدم PP-YOLOE+ العمود الفقري CSPRepResNet ورأسًا فعالًا ومتوافقًا مع المهام (ET-head). ويستخدم بشكل مكثف تقنيات معايرة التكرار لزيادة القدرة التمثيلية أثناء التدريب مع دمج تلك المعلمات في التلافيف القياسية للاستدلال. على الرغم من أن هذا ينتج متوسط دقة متوسط (mAP) مثير للإعجاب، إلا أن النماذج الناتجة تميل إلى أن تكون أثقل من حيث المعلمات ومساحة الذاكرة، مما يجعلها أكثر ملاءمة للنشر على وحدات معالجة الرسومات (GPU) القوية للخوادم بدلاً من الأجهزة الطرفية خفيفة الوزن.

تعدد المهام وتعدد الاستخدامات

إذا كان مشروعك يتطلب توسيع نطاقه إلى ما وراء المربعات المحددة القياسية، فإن Ultralytics YOLO11 دعمًا أصليًا للتجزئة وتقدير الوضع والتصنيف ضمن نفس واجهة برمجة التطبيقات (API) بالضبط، مما يقلل بشكل كبير من تكاليف التطوير مقارنة بدمج عدة مستودعات مختلفة.

الأداء والمعايير

عند تقييم الأداء، ننظر إلى الدقة (mAP) وسرعة الاستدلال عبر الأجهزة المختلفة وكفاءة النموذج (المعلمات و FLOPs). يوضح الجدول أدناه المقاييس المقارنة، مع إبراز القيم الأكثر كفاءة أو الأعلى أداءً بالخط العريض.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

تحليل

YOLO11 ميزة واضحة في توازن الأداء وكفاءة المعلمات. على سبيل المثال، YOLO11m يحقق mAP أعلى mAP 51.5) من PP-YOLOE+m (49.8) مع استخدام عدد أقل من المعلمات (20.1 مليون مقابل 23.43 مليون) وتحقيق سرعات استدلال أسرع بشكل ملحوظ على TensorRT 4.7 مللي ثانية مقابل 5.56 مللي ثانية). إن الطبيعة الخفيفة YOLO11 تترجم بطبيعتها إلى متطلبات ذاكرة أقل أثناء كل من تدريب النموذج والتنفيذ.

نظام التدريب وسهولة الاستخدام

غالبًا ما تكمن القيمة الحقيقية للنموذج في سهولة تدريبه على مجموعات بيانات الرؤية الحاسوبية المخصصة ونشره في الإنتاج.

ميزة Ultralytics

Ultralytics لتجربة مطور مبسطة. YOLO11 إدارة تدريب YOLO11 من خلال Python أو CLI بسيطة، مما يزيل الحاجة إلى استخدام أكواد نمطية معقدة. تعزز Ultralytics ذلك من خلال توفير تدريب بدون أكواد، وإدارة آلية لمجموعات البيانات، وتصدير بنقرة واحدة إلى تنسيقات مثل ONNXو CoreML و TensorRT.

علاوة على ذلك، تتميز YOLO بكفاءة عالية في استخدام الذاكرة أثناء التدريب، مما يتيح تجنب الأعباء الضخمة على ذاكرة VRAM التي عادة ما تصاحب البنى القائمة على المحولات أو النماذج الثقيلة ذات المعلمات المتكررة، مما يتيح التدريب على أجهزة من فئة المستهلكين.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

نظام PP-YOLOE+ البيئي

يعمل PP-YOLOE+ ضمن نظام PaddleDetection البيئي. على الرغم من أن هذا الإطار قوي ومتكامل بشكل عميق مع حلول Baidu الصناعية، إلا أنه يتطلب من المطورين اعتماد إطار التعلم PaddlePaddle المحدد. قد يؤدي ذلك إلى زيادة صعوبة التعلم بالنسبة للفرق التي تعتمد بالفعل على PyTorch. بالإضافة إلى ذلك، قد يتطلب تصدير نماذج PP-YOLOE+ إلى تنسيقات عالمية قياسية للأجهزة الطرفية خطوات تحويل إضافية مقارنة بخطوط التصدير الأصلية الموجودة في Ultralytics .

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج على بيئة النشر الخاصة بك.

  • اختر YOLO11 للتطوير السريع والحوسبة المتطورة والتطبيقات المحمولة. إن سرعة الاستدلال العالية والذاكرة المنخفضة وقدرات التصدير الواسعة تجعله مثاليًا لمهام مثل إدارة مخزون التجزئة في الوقت الفعلي على وحدات المعالجة المركزية القياسية وتحليل الصور الجوية باستخدام الطائرات بدون طيار وخطوط الأنابيب المعقدة متعددة المهام.
  • اختر PP-YOLOE+ إذا كان خط إنتاجك بالكامل يستثمر بالفعل بشكل كبير في PaddlePaddle أو إذا كنت تقوم بالنشر على خوادم استدلال مخصصة عالية الجودة حيث لا تشكل قيود الذاكرة وتوافق الأجهزة (خارج الأجهزة المُحسّنة من Paddle) مصدر قلق رئيسي.

الجيل القادم: تقديم YOLO26

في حين أن YOLO11 قوياً للغاية، إلا أن مجال الذكاء الاصطناعي يتطور بسرعة. من أجل تحقيق أحدث ما توصلت إليه التكنولوجيا في مجال الكشف عن الأشياء، Ultralytics منتجها الجديد YOLO26. تم إصدار YOLO26 في يناير 2026، وهو يعتمد على نجاحات سابقيه لتقديم كفاءة ودقة غير مسبوقة.

أهم ابتكارات YOLO26:

  • تصميم NMS من البداية إلى النهاية: يزيل YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يسرع بشكل كبير من الاستدلال ويبسط منطق النشر، وهو قفزة معمارية رائدة لأول مرة في YOLOv10.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسينه خصيصًا للأجهزة الطرفية التي لا تحتوي على وحدات معالجة رسومات، مما يضمن الأداء في الوقت الفعلي على الأجهزة منخفضة الطاقة.
  • MuSGD Optimizer: مستوحى من استقرار تدريب LLM، يضمن هذا المزيج من SGD Muon تقاربًا أسرع وتدريبًا أكثر استقرارًا.
  • ProgLoss + STAL: تعمل وظائف الخسارة المحسّنة على تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لتطبيقات الطائرات بدون طيار والمراقبة الأمنية.
  • إزالة DFL: تعمل إزالة فقدان بؤرة التوزيع على تبسيط تصدير النموذج وتحسين التوافق بشكل كبير عبر مجموعة واسعة من الأجهزة الطرفية.

بالنسبة للمشاريع الجديدة التي تعطي الأولوية للسرعة والتصدير السلس والدقة القصوى، نوصي بشدة بالاستفادة من إمكانات YOLO26 عبر Ultralytics .

إذا كنت تقوم بتقييم بنى أخرى، فقد تكون مهتمًا أيضًا بمقارنة YOLO11 RT-DETR أو استكشاف كيفية عمل YOLOv8 في المعايير الحديثة.


تعليقات