YOLOv5 في مقابل PP-YOLOE+: تحليل تقني معمق للكشف الحديث عن الأشياء

يعد اختيار بنية الشبكة العصبية المناسبة أمراً أساسياً لأي مشروع رؤية حاسوبية حديث. عندما يقوم المطورون والباحثون بتقييم نماذج الكشف عن الأشياء في الوقت الفعلي، غالباً ما يتلخص القرار في الموازنة بين الدقة وسرعة الاستدلال وسهولة النشر. تدرس هذه المقارنة التقنية كلاً من YOLOv5 و PP-YOLOE+، وتستكشف بنيتيهما ومقاييس الأداء ومنهجيات التدريب لمساعدتك في اختيار الحل الأمثل لتطبيقك.

فهم البنيات

ترك كلا النموذجين تأثيراً كبيراً على مشهد الذكاء الاصطناعي البصري، لكنهما يتعاملان مع تحديات الكشف عن الأشياء من خلال منهجيات هيكلية واعتمادات إطارية مختلفة.

Ultralytics YOLOv5: معيار الصناعة

تم إطلاق Ultralytics YOLOv5 في منتصف عام 2020، وقد أحدث ثورة في إمكانية الوصول إلى نماذج الرؤية الحديثة. وبكونه أول تنفيذ أصلي لـ PyTorch في عائلة YOLO، فقد قلل بشكل كبير من حاجز الدخول لمطوري Python ومهندسي تعلم الآلة في جميع أنحاء العالم.

تفاصيل YOLOv5:

يستخدم YOLOv5 بنية عمود فقري معدلة من CSPDarknet، والتي تلتقط تمثيلات ميزات غنية بكفاءة مع الحفاظ على عدد معلمات خفيف الوزن. قدم النموذج صناديق تثبيت ذاتية التعلم، تحسب تلقائياً أبعاد التثبيت المثلى لمجموعات البيانات المخصصة قبل بدء التدريب. علاوة على ذلك، فإن دمج تقنية تعزيز بيانات الموزاييك (mosaic data augmentation) يعزز بشكل كبير قدرة النموذج على اكتشاف الأشياء الصغيرة والتعميم عبر سياقات مكانية معقدة.

تعد براعة YOLOv5 الهائلة إحدى أكبر نقاط قوته. فعلى عكس كواشف الأشياء القياسية، تدعم عائلة YOLOv5 بسلاسة تصنيف الصور، تجزئة المثيلات، والكشف عن صناديق التحديد ضمن واجهة برمجية موحدة. كما تترجم بنيته المحسنة للغاية إلى استخدام أقل بكثير للذاكرة أثناء التدريب والاستدلال مقارنة بالشبكات الثقيلة القائمة على Transformer.

اعرف المزيد حول YOLOv5

PP-YOLOE+: المنافس من PaddlePaddle

تم تقديمه بعد عامين تقريباً، ويعتمد PP-YOLOE+ على أساس إصدارات PP-YOLO السابقة. تم تطويره لعرض قدرات إطار تعلم الآلة العميق الخاص بـ Baidu، ويقدم العديد من التحسينات الهيكلية لتعزيز متوسط الدقة (mAP).

تفاصيل PP-YOLOE+:

يعتمد PP-YOLOE+ على نموذج خالٍ من التثبيت (anchor-free) ويستخدم بنية عمود فقري من نوع CSPRepResNet. كما يدمج تقنية قوية لتعلم محاذاة المهام (Task Alignment Learning) ورأساً فعالاً لمحاذاة المهام لتحسين الدقة. وعلى الرغم من تحقيق PP-YOLOE+ درجات دقة مبهرة، إلا أن نقطة ضعفه الأساسية تكمن في اعتماده الصارم على إطار PaddlePaddle. وهذا يؤدي غالباً إلى منحنى تعلم حاد واحتكاك في النظام البيئي لفرق البحث والمؤسسات المستثمرة بعمق بالفعل في بيئات PyTorch أو TensorFlow.

تعرف على المزيد حول PP-YOLOE+

الأداء والمعايير

عند تقييم هذه النماذج للإنتاج، يعد فهم المقايضات بين الدقة وسرعة الاستدلال والبصمة البرمجية أمراً بالغ الأهمية. يوضح الجدول أدناه مقاييس الأداء الرئيسية عبر مختلف متغيرات الحجم.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

في حين يحقق PP-YOLOE+ حدوداً عالية من الدقة، يظهر YOLOv5 باستمرار كفاءة فائقة في المعلمات واستدلالاً أسرع على الأجهزة المحدودة. بالنسبة لعمليات النشر على الحافة حيث تكون الذاكرة شحيحة، يوفر YOLOv5n سرعة لا تضاهى وبصمة صغيرة للغاية.

كفاءة الذاكرة

تم تصميم نماذج Ultralytics خصيصاً لكفاءة التدريب. ومقارنة بنماذج رؤية Transformer الثقيلة مثل RT-DETR، يستخدم YOLOv5 ذاكرة CUDA أقل بكثير، مما يمكنك من التدريب على أحجام دفعات أكبر أو أجهزة بمواصفات تجارية.

ميزة Ultralytics: النظام البيئي وسهولة الاستخدام

تمتد القيمة الحقيقية لبنية تعلم الآلة إلى ما هو أبعد من الأرقام الخام؛ فهي تشمل تجربة المطور بأكملها. توفر منصة Ultralytics وأدواتها مفتوحة المصدر المقابلة نظاماً بيئياً محسناً ومصاناً جيداً يسرع دورات التطوير بشكل كبير.

  • سهولة الاستخدام: تقوم Ultralytics بتجريد التعليمات البرمجية المعقدة المتكررة. يمكنك تدريب النماذج والتحقق منها واختبارها عبر واجهة برمجية لـ Python بديهية أو CLI.
  • مرونة النشر: تصدير النماذج مباشر جداً. بأمر واحد، يمكنك تحويل أوزان YOLOv5 المدربة إلى تنسيقات مثل ONNX، TensorRT، أو OpenVINO، مما يضمن توافقاً واسعاً عبر بيئات الحافة والسحابة.
  • مجتمع نشط: يضمن المجتمع النابض بالحياة تحديثات متكررة، وتوثيقاً شاملاً، وحلولاً قوية لتحديات الرؤية الحاسوبية الشائعة.

على النقيض من ذلك، يعتمد PP-YOLOE+ بشكل كبير على ملفات تهيئة معقدة خاصة بـ PaddleDetection، والتي يمكن أن تبطئ النماذج الأولية السريعة وتعقد التكامل في خطوط أنابيب MLOps الحديثة.

التطبيقات العملية وأمثلة التعليمات البرمجية

البدء مع Ultralytics بسيط للغاية. إليك مثال كامل وقابل للتشغيل حول كيفية تحميل نموذج YOLOv5 مدرب مسبقاً، وتدريبه على مجموعة بيانات مخصصة، وتصدير النتائج:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv5 و PP-YOLOE+ على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv5

YOLOv5 هو خيار قوي لـ:

  • أنظمة الإنتاج المثبتة: عمليات النشر الحالية التي يتم فيها تقدير سجل YOLOv5 الطويل من الاستقرار، والتوثيق المكثف، والدعم المجتمعي الهائل.
  • التدريب بموارد محدودة: البيئات ذات موارد GPU المحدودة حيث يكون خط أنابيب التدريب الفعال ومتطلبات الذاكرة الأقل لـ YOLOv5 ميزة كبيرة.
  • دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX، و TensorRT، و CoreML، و TFLite.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ لـ:

  • تكامل نظام PaddlePaddle البيئي: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل Baidu's PaddlePaddle والأدوات المرتبطة به.
  • نشر حافة Paddle Lite: النشر على أجهزة تحتوي على نوى استدلال مُحسَّنة للغاية خصيصًا لمحرك Paddle Lite أو محرك استدلال Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار العمل مصدر قلق.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

نماذج بديلة حديثة يجب مراعاتها

بينما يعد YOLOv5 معياراً قوياً ومثبتاً، إلا أن مجال الرؤية الحاسوبية يتحرك بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة، نوصي بشدة باستكشاف بنياتنا الأحدث.

Ultralytics YOLO26

تم إطلاق YOLO26 في يناير 2026، وهو يمثل ذروة أبحاثنا. إنه يقدم تحسينات هائلة في كل من الدقة والسرعة. تشمل الابتكارات الرئيسية ما يلي:

  • تصميم شامل بدون NMS: بناءً على مفاهيم من YOLOv10، يلغي YOLO26 محلياً معالجة ما بعد عدم الحد الأقصى (NMS)، مما يقلل من زمن الانتقال ويبسط منطق النشر.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، يحقق YOLO26 استدلالاً على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%، مما يجعله قوياً بشكل لا يصدق لأجهزة الحافة منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) المتقدمة، يضمن هذا الهجين من SGD و Muon عمليات تدريب مستقرة بشكل استثنائي وتقارباً أسرع.
  • ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأشياء الصغيرة، وهو أمر بالغ الأهمية لـ صور الطائرات بدون طيار والزراعة الذكية.

بالإضافة إلى ذلك، قد ترغب في التفكير في YOLO11، الذي يقدم أداءً ممتازاً ويعمل كجسر موثوق للغاية بين الأنظمة القديمة وقدرات YOLO26 المتطورة.

حالات الاستخدام الواقعية

يعتمد الاختيار بين YOLOv5 و PP-YOLOE+ في النهاية على بيئة النشر وقيود المشروع.

تطبيقات YOLOv5 المثالية: تجعل متطلبات الموارد الدنيا لـ YOLOv5 وسهولة استخدامه المذهلة الخيار الأول لـ الذكاء الاصطناعي للحافة. إنه يتفوق في التطبيقات التي تتطلب معدلات إطارات عالية على أجهزة محدودة، مثل الروبوتات في الوقت الفعلي، وتكامل تطبيقات الجوال، وأنظمة مراقبة حركة المرور متعددة الكاميرات. إن قدرته على التعامل في وقت واحد مع تقدير الوضعية و صندوق التحديد الموجه (OBB) ضمن نفس الإطار تجعله قابلاً للتكيف بشكل كبير.

تطبيقات PP-YOLOE+ المثالية: يعد PP-YOLOE+ الأنسب للسيناريوهات التي يتم فيها إعطاء الأولوية لأقصى دقة مطلقة في الصور الثابتة على قيود المعالجة في الوقت الفعلي. يجد استخداماً متخصصاً في خطوط أنابيب الفحص الصناعي، لا سيما داخل قطاعات التصنيع الآسيوية التي لديها تقنيات ثابتة مستثمرة بكثافة في نظام Baidu و PaddlePaddle البيئي.

باختصار، في حين يقدم PP-YOLOE+ معايير دقة قوية، توفر نماذج Ultralytics YOLO مزيجاً لا يضاهى من توازن الأداء، والنشر السلس، والتصميم الصديق للمطورين الذي يدفع مشاريع الرؤية الحاسوبية الناجحة من المفهوم إلى الإنتاج.

تعليقات