YOLOv5 PP-YOLOE+: دراسة تقنية متعمقة حول الكشف الحديث عن الأجسام
يعد اختيار بنية الشبكة العصبية المناسبة أمرًا ضروريًا لأي مشروع حديث في مجال الرؤية الحاسوبية. عندما يقوم المطورون والباحثون بتقييم النماذج الخاصة بالكشف عن الكائنات في الوقت الفعلي، غالبًا ما يتوقف القرار على تحقيق التوازن بين الدقة وسرعة الاستدلال وسهولة النشر. تبحث هذه المقارنة الفنية في YOLOv5 و PP-YOLOE+ ، وتستكشف هندستهما ومقاييس أدائهما ومنهجيات التدريب لمساعدتك في اختيار الحل الأمثل لتطبيقك.
فهم البنى
لقد أثر كلا النموذجين بشكل كبير على مشهد الذكاء الاصطناعي للرؤية، لكنهما يتعاملان مع تحديات اكتشاف الأجسام من خلال منهجيات هيكلية مختلفة واعتمادات إطارية مختلفة.
Ultralytics YOLOv5: معيار الصناعة
صدر في منتصف عام 2020، Ultralytics YOLOv5 ثورة في إمكانية الوصول إلى أحدث نماذج الرؤية. كونه أول PyTorch في YOLO فقد خفض بشكل كبير حاجز الدخول Python ومهندسي ML في جميع أنحاء العالم.
YOLOv5 :
- المؤلفون: جلين جوشر
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: yolov5
- المستندات: YOLOv5
YOLOv5 هيكل CSPDarknet معدل، والذي يلتقط بشكل فعال تمثيلات الميزات الغنية مع الحفاظ على عدد معلمات خفيف الوزن. وقد أدخل صناديق ربط للتعلم التلقائي، تحسب تلقائيًا الأبعاد المثلى للربط لمجموعات البيانات المخصصة قبل بدء التدريب. علاوة على ذلك، فإن دمج زيادة البيانات الفسيفسائية يعزز بشكل كبير من قدرة النموذج على detect الأجسام detect وتعميمها عبر سياقات مكانية معقدة.
YOLOv5 إحدى أكبر نقاط قوة YOLOv5 تنوعها المذهل. على عكس أجهزة الكشف عن الكائنات القياسية، تدعم YOLOv5 بسلاسة تصنيف الصور وتجزئة المثيلات وكشف المربعات المحيطة ضمن واجهة برمجة تطبيقات موحدة. كما أن بنيتها المُحسّنة للغاية تؤدي إلى انخفاض كبير في استخدام الذاكرة أثناء التدريب والاستدلال مقارنة بالشبكات الثقيلة القائمة على المحولات.
PP-YOLOE+: PaddlePaddle
تم طرح PP-YOLOE+ بعد حوالي عامين، وهو يعتمد على أساسYOLO السابقة منYOLO . تم تطويره لإظهار قدرات إطار عمل التعلم العميق من Baidu، ويقدم العديد من التحسينات المعمارية لزيادة متوسط الدقة.
تفاصيل PP-YOLOE+:
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle
- المستندات: PP-YOLOE+ README
يعتمد PP-YOLOE+ على نموذج بدون مرساة ويستخدم العمود الفقري CSPRepResNet. وهو يدمج تقنية قوية لتعلم محاذاة المهام ورأس فعال ومحاذي للمهام لتحسين الدقة. في حين يحقق PP-YOLOE+ درجات دقة مذهلة، فإن نقطة ضعفه الأساسية تكمن في اعتماده الشديد على PaddlePaddle . وغالبًا ما يؤدي ذلك إلى منحنى تعلم حاد وتوتر في النظام البيئي لفرق البحث والمؤسسات التي استثمرت بالفعل بشكل كبير في TensorFlow PyTorch TensorFlow .
الأداء والمعايير
عند تقييم هذه النماذج للإنتاج، من الضروري فهم المفاضلة بين الدقة وسرعة الاستدلال وبصمة المعلمات. يوضح الجدول أدناه مقاييس الأداء الرئيسية عبر مختلف المتغيرات الحجمية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
بينما يحقق PP-YOLOE+ حدود دقة عالية، يظهر YOLOv5 كفاءة معلمات فائقة واستنتاج أسرع على الأجهزة المقيدة. بالنسبة لعمليات النشر الطرفية حيث الذاكرة شحيحة، يوفر YOLOv5n سرعة لا مثيل لها ومساحة صغيرة للغاية.
كفاءة الذاكرة
تم تصميم Ultralytics خصيصًا لتحقيق الكفاءة في التدريب. مقارنةً بمحولات الرؤية الثقيلة مثل RT-DETR، YOLOv5 CUDA أقل بكثير، مما يتيح لك التدريب على أحجام دفعات أكبر أو أجهزة من فئة المستهلكين.
Ultralytics : النظام البيئي وسهولة الاستخدام
تتجاوز القيمة الحقيقية لهيكل التعلم الآلي الأرقام الأولية؛ فهي تشمل تجربة المطور بالكامل. توفر Ultralytics والأدوات مفتوحة المصدر المرتبطة بها نظامًا بيئيًا متطورًا للغاية ومُحسّنًا بشكل جيد، مما يؤدي إلى تسريع دورات التطوير بشكل كبير.
- سهولة الاستخدام: Ultralytics الكود النمطي المعقد. يمكنك تدريب النماذج والتحقق من صحتها واختبارها عبر Python أو CLI سهلة الاستخدام.
- مرونة النشر: تصدير النماذج أمر في غاية البساطة. بأمر واحد، يمكنك تحويل YOLOv5 المدربة إلى تنسيقات مثل ONNXو TensorRTأو OpenVINO، مما يضمن توافقًا واسعًا عبر بيئات الحافة والسحابة.
- مجتمع نشط: يضمن المجتمع النشط تحديثات متكررة ووثائق شاملة وحلول قوية للتحديات الشائعة في مجال الرؤية الحاسوبية.
في المقابل، يعتمد PP-YOLOE+ بشكل كبير على ملفات التكوين المعقدة الخاصة بـ PaddleDetection، مما قد يؤدي إلى إبطاء عملية النمذجة السريعة وتعقيد عملية التكامل في خطوط أنابيب MLOps الحديثة.
تطبيقات عملية وأمثلة على الأكواد
البدء في Ultralytics بسيط للغاية. فيما يلي مثال كامل وقابل للتنفيذ لكيفية تحميل YOLOv5 المدرب مسبقًا وتدريبه على مجموعة بيانات مخصصة وتصدير النتائج:
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")
# Export the optimized model to ONNX format
path = model.export(format="onnx")
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 PP-YOLOE+ على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 خيار قوي لـ:
- أنظمة إنتاج مجربة: عمليات النشر الحالية التي تُقدّر فيها track YOLOv5 الطويل في الاستقرار، والوثائق الشاملة، والدعم المجتمعي الهائل.
- التدريب المحدود الموارد: البيئات ذات GPU المحدودة حيث يكون خط التدريب الفعال YOLOv5 ومتطلبات الذاكرة المنخفضة ميزة.
- دعم واسع النطاق لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNXو TensorRTو CoreMLو TFLite.
متى تختار PP-YOLOE+
يوصى باستخدام PP-YOLOE+ في الحالات التالية:
- تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
نماذج بديلة متطورة يجب أخذها في الاعتبار
على الرغم من أن YOLOv5 معيار قوي ومثبت، إلا أن مجال الرؤية الحاسوبية يتطور بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة، نوصي بشدة باستكشاف هياكلنا الأحدث.
Ultralytics YOLO26
صدر YOLO26 في يناير 2026، وهو يمثل ذروة أبحاثنا. ويقدم تحسينات هائلة في الدقة والسرعة. وتشمل الابتكارات الرئيسية ما يلي:
- تصميم شامل NMS: بناءً على مفاهيم من YOLOv10، يزيل YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يقلل من زمن الاستجابة ويبسط منطق النشر.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله قويًا للغاية للأجهزة الطرفية منخفضة الطاقة.
- MuSGD Optimizer: مستوحى من تقنيات التدريب المتقدمة LLM، يضمن هذا المزيج من SGD Muon عمليات تدريب مستقرة بشكل استثنائي وتقارب أسرع.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لصور الطائرات بدون طيار والزراعة الذكية.
بالإضافة إلى ذلك، قد ترغب في النظر في YOLO11، الذي يقدم أداءً ممتازًا ويشكل جسرًا موثوقًا للغاية بين الأنظمة القديمة والإمكانيات المتطورة لـ YOLO26.
حالات الاستخدام في العالم الحقيقي
يعتمد الاختيار بين YOLOv5 PP-YOLOE+ في النهاية على بيئة النشر وقيود المشروع.
YOLOv5 المثالية YOLOv5 : تجعل متطلباتYOLOv5 المحدودة من الموارد وسهولة استخدامها المذهلة منها الخيار الأول للذكاء الاصطناعي المتطور. وهي تتفوق في التطبيقات التي تتطلب معدلات إطارات عالية على أجهزة محدودة، مثل الروبوتات في الوقت الفعلي، وتكامل التطبيقات المحمولة، وأنظمة مراقبة حركة المرور متعددة الكاميرات. وقدرتها على التعامل في وقت واحد مع مهام تقدير الوضع ومربع الحدود الموجه (OBB) ضمن نفس الإطار يجعلها قابلة للتكيف بدرجة عالية.
التطبيقات المثالية لـ PP-YOLOE+: يعد PP-YOLOE+ الأنسب للسيناريوهات التي تعطي الأولوية للدقة القصوى المطلقة في الصور الثابتة على قيود المعالجة في الوقت الفعلي. ويجد استخدامًا متخصصًا في خطوط الأنابيب الصناعية، لا سيما في قطاعات التصنيع الآسيوية التي لديها مجموعات تقنية مسبقة الاستخدام تستثمر بكثافة في نظام Baidu و PaddlePaddle .
باختصار، في حين أن PP-YOLOE+ يوفر معايير دقة قوية، فإنYOLO Ultralytics YOLO توفر مزيجًا لا مثيل له من التوازن في الأداء، والنشر السلس، والتصميم السهل الاستخدام للمطورين، مما يدفع مشاريع الرؤية الحاسوبية الناجحة من مرحلة التصور إلى مرحلة الإنتاج.