YOLOv5 PP-YOLOE+: دراسة تقنية متعمقة حول الكشف الحديث عن الأجسام

يُعد اختيار بنية الشبكة العصبية الصحيحة أمرًا أساسيًا لأي مشروع حديث لرؤية الكمبيوتر. عندما يقوم المطورون والباحثون بتقييم النماذج لاكتشاف الكائنات في الوقت الفعلي، غالبًا ما يتوقف القرار على الموازنة بين الدقة وسرعة الاستدلال وسهولة النشر. تدرس هذه المقارنة التقنية YOLOv5 و PP-YOLOE+، مستكشفةً بنياتهما ومقاييس أدائهما ومنهجيات تدريبهما لمساعدتك في اختيار الحل الأمثل لتطبيقك.

فهم البنى

أثر كلا النموذجين بشكل كبير على مشهد الذكاء الاصطناعي للرؤية، لكنهما يتعاملان مع تحديات اكتشاف الكائنات من خلال منهجيات هيكلية مختلفة واعتماديات أطر عمل متباينة.

Ultralytics YOLOv5: معيار الصناعة

صدر في منتصف عام 2020، Ultralytics YOLOv5 ثورة في إمكانية الوصول إلى أحدث نماذج الرؤية. كونه أول PyTorch في YOLO فقد خفض بشكل كبير حاجز الدخول Python ومهندسي ML في جميع أنحاء العالم.

YOLOv5 :

المؤلفون: غلين جوشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: yolov5
المستندات: YOLOv5

YOLOv5 هيكل CSPDarknet معدل، والذي يلتقط بشكل فعال تمثيلات الميزات الغنية مع الحفاظ على عدد معلمات خفيف الوزن. وقد أدخل صناديق ربط للتعلم التلقائي، تحسب تلقائيًا الأبعاد المثلى للربط لمجموعات البيانات المخصصة قبل بدء التدريب. علاوة على ذلك، فإن دمج زيادة البيانات الفسيفسائية يعزز بشكل كبير من قدرة النموذج على detect الأجسام detect وتعميمها عبر سياقات مكانية معقدة.

YOLOv5 إحدى أكبر نقاط قوة YOLOv5 تنوعها المذهل. على عكس أجهزة الكشف عن الكائنات القياسية، تدعم YOLOv5 بسلاسة تصنيف الصور وتجزئة المثيلات وكشف المربعات المحيطة ضمن واجهة برمجة تطبيقات موحدة. كما أن بنيتها المُحسّنة للغاية تؤدي إلى انخفاض كبير في استخدام الذاكرة أثناء التدريب والاستدلال مقارنة بالشبكات الثقيلة القائمة على المحولات.

تعرف على المزيد حول YOLOv5

PP-YOLOE+: PaddlePaddle

تم طرح PP-YOLOE+ بعد حوالي عامين، وهو يعتمد على أساسYOLO السابقة منYOLO . تم تطويره لإظهار قدرات إطار عمل التعلم العميق من Baidu، ويقدم العديد من التحسينات المعمارية لزيادة متوسط الدقة.

تفاصيل PP-YOLOE+:

المؤلفون: PaddlePaddle Authors
المنظمة: Baidu
التاريخ: 2022-04-02
Arxiv: 2203.16250
GitHub: PaddlePaddle
المستندات: PP-YOLOE+ README

يعتمد PP-YOLOE+ على نموذج بدون مرساة ويستخدم العمود الفقري CSPRepResNet. وهو يدمج تقنية قوية لتعلم محاذاة المهام ورأس فعال ومحاذي للمهام لتحسين الدقة. في حين يحقق PP-YOLOE+ درجات دقة مذهلة، فإن نقطة ضعفه الأساسية تكمن في اعتماده الشديد على PaddlePaddle . وغالبًا ما يؤدي ذلك إلى منحنى تعلم حاد وتوتر في النظام البيئي لفرق البحث والمؤسسات التي استثمرت بالفعل بشكل كبير في TensorFlow PyTorch TensorFlow .

تعرف على المزيد حول PP-YOLOE+

الأداء والمعايير

عند تقييم هذه النماذج للإنتاج، من الضروري فهم المفاضلة بين الدقة وسرعة الاستدلال وبصمة المعلمات. يوضح الجدول أدناه مقاييس الأداء الرئيسية عبر مختلف المتغيرات الحجمية.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

بينما يحقق PP-YOLOE+ حدود دقة عالية، يظهر YOLOv5 كفاءة معلمات فائقة واستنتاج أسرع على الأجهزة المقيدة. بالنسبة لعمليات النشر الطرفية حيث الذاكرة شحيحة، يوفر YOLOv5n سرعة لا مثيل لها ومساحة صغيرة للغاية.

كفاءة الذاكرة

تم تصميم Ultralytics خصيصًا لتحقيق الكفاءة في التدريب. مقارنةً بمحولات الرؤية الثقيلة مثل RT-DETR، YOLOv5 CUDA أقل بكثير، مما يتيح لك التدريب على أحجام دفعات أكبر أو أجهزة من فئة المستهلكين.

Ultralytics : النظام البيئي وسهولة الاستخدام

تتجاوز القيمة الحقيقية لهيكل التعلم الآلي الأرقام الأولية؛ فهي تشمل تجربة المطور بالكامل. توفر Ultralytics والأدوات مفتوحة المصدر المرتبطة بها نظامًا بيئيًا متطورًا للغاية ومُحسّنًا بشكل جيد، مما يؤدي إلى تسريع دورات التطوير بشكل كبير.

سهولة الاستخدام: تجرد Ultralytics التعليمات البرمجية المتكررة المعقدة. يمكنك تدريب النماذج والتحقق منها واختبارها عبر واجهة برمجة تطبيقات Python بديهية أو CLI.
مرونة النشر: يعد تصدير النماذج أمرًا سهلاً للغاية. بأمر واحد، يمكنك تحويل أوزان YOLOv5 المدربة إلى تنسيقات مثل ONNX أو TensorRT أو OpenVINO، مما يضمن توافقًا واسعًا عبر بيئات الحوسبة الطرفية والسحابية.
مجتمع نشط: يضمن المجتمع النابض بالحياة تحديثات متكررة، ووثائق شاملة، وحلولًا قوية لتحديات رؤية الكمبيوتر الشائعة.

في المقابل، يعتمد PP-YOLOE+ بشكل كبير على ملفات التكوين المعقدة الخاصة بـ PaddleDetection، مما قد يؤدي إلى إبطاء عملية النمذجة السريعة وتعقيد عملية التكامل في خطوط أنابيب MLOps الحديثة.

تطبيقات عملية وأمثلة على الأكواد

البدء في Ultralytics بسيط للغاية. فيما يلي مثال كامل وقابل للتنفيذ لكيفية تحميل YOLOv5 المدرب مسبقًا وتدريبه على مجموعة بيانات مخصصة وتصدير النتائج:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv5 و PP-YOLOE+ على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv5

YOLOv5 خيار قوي لـ:

أنظمة الإنتاج المثبتة: العمليات المنشورة الحالية حيث تُقدر سجل YOLOv5 الطويل في الاستقرار، والتوثيق الشامل، والدعم المجتمعي الهائل.
التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خطة تدريب YOLOv5 الفعالة ومتطلبات الذاكرة الأقل مفيدة.
دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ في الحالات التالية:

تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

نماذج بديلة حديثة للنظر فيها

على الرغم من أن YOLOv5 معيار قوي ومثبت، إلا أن مجال الرؤية الحاسوبية يتطور بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة، نوصي بشدة باستكشاف هياكلنا الأحدث.

Ultralytics YOLO26

صدر YOLO26 في يناير 2026، وهو يمثل ذروة أبحاثنا. ويقدم تحسينات هائلة في الدقة والسرعة. وتشمل الابتكارات الرئيسية ما يلي:

تصميم شامل خالٍ من NMS: استنادًا إلى مفاهيم من YOLOv10، يلغي YOLO26 بشكل أصيل معالجة ما بعد التثبيط غير الأقصى (NMS)، مما يقلل زمن الانتقال ويبسط منطق النشر.
إزالة DFL: بإزالة خسارة التركيز التوزيعي، يحقق YOLO26 استدلالاً أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU)، مما يجعله قويًا بشكل لا يصدق للأجهزة الطرفية منخفضة الطاقة.
مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) المتقدمة، يضمن هذا الهجين من SGD و Muon عمليات تدريب مستقرة بشكل استثنائي وتقاربًا أسرع.
ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لـ صور الطائرات بدون طيار والزراعة الذكية.

بالإضافة إلى ذلك، قد تفكر في YOLO11، والذي يقدم أداءً ممتازًا ويعمل كجسر موثوق للغاية بين الأنظمة القديمة وقدرات YOLO26 المتطورة.

حالات الاستخدام في العالم الحقيقي

يعتمد الاختيار بين YOLOv5 PP-YOLOE+ في النهاية على بيئة النشر وقيود المشروع.

تطبيقات YOLOv5 المثالية: متطلبات موارد YOLOv5 الدنيا وسهولة استخدامه الفائقة تجعله الخيار الأول للذكاء الاصطناعي على الحافة. يتفوق في التطبيقات التي تتطلب معدلات إطارات عالية على أجهزة محدودة، مثل الروبوتات في الوقت الفعلي، وتكامل تطبيقات الهاتف المحمول، وأنظمة مراقبة حركة المرور متعددة الكاميرات. قدرته على التعامل مع مهام تقدير الوضعيات وصناديق الإحاطة الموجهة (OBB) في نفس الإطار يجعله قابلاً للتكيف بدرجة كبيرة.

تطبيقات PP-YOLOE+ المثالية: PP-YOLOE+ هو الأنسب للسيناريوهات التي تُعطى فيها الأولوية للحد الأقصى المطلق من الدقة على الصور الثابتة على حساب قيود المعالجة في الوقت الفعلي. يجد استخدامًا متخصصًا في خطوط أنابيب الفحص الصناعي، لا سيما في قطاعات التصنيع الآسيوية التي لديها حزم تقنية راسخة تستثمر بكثافة في نظام Baidu وPaddlePaddle البيئي.

باختصار، في حين أن PP-YOLOE+ يوفر معايير دقة قوية، فإنYOLO Ultralytics YOLO توفر مزيجًا لا مثيل له من التوازن في الأداء، والنشر السلس، والتصميم السهل الاستخدام للمطورين، مما يدفع مشاريع الرؤية الحاسوبية الناجحة من مرحلة التصور إلى مرحلة الإنتاج.