تخطي إلى المحتوى

PP-YOLOE+ ضد YOLOv5: استعراض الدقة العالية في الكشف والاستعداد للإنتاج

غالبًا ما ينطوي اختيار نموذج الكشف عن الكائنات الأمثل على مفاضلة بين المقاييس الأكاديمية الأولية وقدرات النشر العملية. تدرس هذه المقارنة الفنية PP-YOLOE+، وهو كاشف متطور بدون مرساة من نظام PaddlePaddle البيئي، و Ultralytics YOLOv5، وهو النموذج القياسي في الصناعة المشهور بتوازنه بين السرعة والدقة وسهولة الاستخدام. في حين أن PP-YOLOE+ تدفع حدود متوسط دقة الخريطة (mAP)، إلا أن YOLOv5 تظل قوة مهيمنة في تطبيقات الاستدلال في الوقت الفعلي نظرًا لتجربة المطور التي لا مثيل لها وتنوع النشر.

PP-YOLOE+: هندسة دقيقة في PaddlePaddle

PP-YOLOE+ هو إصدار مطور من PP-YOLOE، تم تطويره بواسطة باحثين في Baidu كجزء من مجموعة PaddleDetection. تم تصميمه ليكون كاشفًا صناعيًا فعالًا وحديثًا للأجسام مع التركيز على المهام عالية الدقة. من خلال الاستفادة من هندسة معمارية خالية من المرساة، فإنه يبسط خط أنابيب التدريب ويقلل من ضبط المعلمات الفائقة المرتبطة غالبًا بالطرق القائمة على المرساة.

المؤلفون: PaddlePaddle Authors
المنظمة: Baidu
التاريخ: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

الهيكلة والابتكار

تقدم بنية PP-YOLOE+ العديد من الآليات المتقدمة لتحسين تمثيل الميزات وتحديد الموقع:

  • العمود الفقري: يستخدم CSPRepResNet، وهو عمود فقري يجمع بين فوائد تدفق التدرج لشبكات Cross Stage Partial (CSP) وتقنيات إعادة تحديد المعلمات لـ RepVGG.
  • رأس خالٍ من المرتكزات (Anchor-Free Head): يتم استخدام رأس فعال ومحاذي للمهام (ET-Head) لفصل مهام التصنيف والانحدار، مما يحسن سرعة التقارب والدقة.
  • استراتيجية التدريب: تتضمن Task Alignment Learning (TAL) لتعيين عينات إيجابية ديناميكيًا، مما يضمن إعطاء الأولوية لأعلى جودة من التنبؤات أثناء التدريب.
  • دوال الخسارة: تستخدم VariFocal Loss (VFL) و Distribution Focal Loss (DFL) للتعامل مع عدم توازن الفئات وتحسين دقة المربعات المحيطة.

نقاط القوة والضعف

يتفوق PP-YOLOE+ في السيناريوهات التي تكون فيها الدقة القصوى بالغة الأهمية. يزيل تصميمه الخالي من الـ anchor الحاجة إلى تجميع anchor boxes، مما يجعله قابلاً للتكيف مع مجموعات البيانات ذات أشكال الكائنات المختلفة. ومع ذلك، فإن اعتماده الشديد على إطار عمل PaddlePaddle يمكن أن يكون عقبة أمام الفرق التي تستخدم PyTorch أو TensorFlow بشكل قياسي. على الرغم من وجود أدوات لتحويل النماذج، إلا أن دعم النظام البيئي الأصلي أقل شمولاً من دعم الأطر المعتمدة عالميًا.

اعتبارات النظام الإيكولوجي

في حين أن PP-YOLOE+ يقدم أداءً نظريًا مثيرًا للإعجاب، إلا أن اعتماده غالبًا ما يتطلب الإلمام ببناء PaddlePaddle المحدد وأدوات النشر الخاصة به، والتي قد تختلف اختلافًا كبيرًا عن سير عمل PyTorch القياسي.

تعرف على المزيد حول PP-YOLOE+

Ultralytics YOLOv5: المعيار العالمي للرؤية الاصطناعية

تم إصداره بواسطة Glenn Jocher في عام 2020، Ultralytics YOLOv5 غير بشكل جذري مشهد رؤية الكمبيوتر من خلال جعل أحدث اكتشاف الكائنات في متناول المطورين من جميع مستويات المهارة. تم بناء YOLOv5 أصلاً في PyTorch، ويركز على "كفاءة التدريب" و "سهولة الاستخدام"، مما يوفر مسارًا سلسًا من تنظيم مجموعة البيانات إلى نشر الإنتاج.

المؤلفون: Glenn Jocher
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
المستندات: https://docs.ultralytics.com/models/yolov5/

البنية والميزات الرئيسية

تستخدم YOLOv5 بنية قائمة على المرساة ومحسّنة للغاية توازن بين العمق والعرض لزيادة الإنتاجية إلى أقصى حد:

  • العمود الفقري CSPDarknet: يقلل تصميم الشبكة الجزئية عبر المراحل من معلومات التدرج الزائدة، مما يعزز القدرة على التعلم مع تقليل المعلمات.
  • PANet Neck: تعمل شبكة تجميع المسار (PANet) على تحسين تدفق المعلومات، مما يساعد النموذج على تحديد موقع الكائنات بدقة عبر مقاييس مختلفة.
  • زيادة Mosaic: تقنية زيادة البيانات المتقدمة التي تجمع أربع صور تدريبية في صورة واحدة، مما يحسن بشكل كبير قدرة النموذج على detect الكائنات الصغيرة والتعميم على البيئات الجديدة.
  • الخوارزميات الجينية: يسمح التطور الآلي للمعلمات الفائقة للنموذج بضبط نفسه للحصول على الأداء الأمثل على مجموعات البيانات المخصصة.

نقاط القوة والنظام البيئي

يتم الاحتفاء بـ YOLOv5 لـ سهولة الاستخدام. واجهة برمجة التطبيقات بديهية، مما يسمح للمستخدمين بتحميل نموذج وتشغيل الاستدلال في بضعة أسطر فقط من كود python.

import torch

# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

بالإضافة إلى التعليمات البرمجية، فإن النظام البيئي الذي تتم صيانته جيدًا يميز YOLOv5. يستفيد المستخدمون من التحديثات المتكررة ومنتدى مجتمعي ضخم وعمليات تكامل سلسة مع أدوات MLOps مثل Comet و ClearML. تمتد براعة النموذج إلى ما هو أبعد من الاكتشاف البسيط، حيث تدعم تقسيم المثيلات ومهام تصنيف الصور ضمن نفس الإطار. علاوة على ذلك، تُظهر نماذج YOLOv5 عمومًا متطلبات ذاكرة أقل أثناء التدريب مقارنة بالبنى القائمة على المحولات، مما يجعلها في متناول الجميع على وحدات معالجة الرسومات (GPUs) من الدرجة الاستهلاكية.

تعرف على المزيد حول YOLOv5

مقارنة الأداء الفني

عند مقارنة النموذجين، من الضروري النظر إلى المقاييس التي تؤثر على الاستخدام الواقعي، مثل سرعة الاستدلال وعدد المعلمات، جنبًا إلى جنب مع مقاييس الدقة القياسية مثل mAP.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

تحليل النتائج

  • الدقة مقابل السرعة: يُظهر PP-YOLOE+ درجات mAP أعلى، خاصة في المتغيرات الأكبر (l و x)، مستفيدًا من رأسه الخالي من المرساة واستراتيجية TAL. ومع ذلك، يقدم YOLOv5 توازن أداء فائقًا، حيث يقدم دقة تنافسية للغاية مع زمن انتقال أقل بكثير (انظر سرعات TensorRT). وهذا يجعل YOLOv5 مناسبًا بشكل خاص لتطبيقات الذكاء الاصطناعي المتطورة حيث يكون لكل مللي ثانية أهمية.
  • كفاءة الموارد: YOLOv5n (Nano) خفيف الوزن للغاية مع 2.6 مليون معلمة فقط، مما يجعله مثاليًا للأجهزة المحمولة وأجهزة إنترنت الأشياء. في حين أن PP-YOLOE+ لديها هياكل أساسية فعالة، إلا أن التعقيد المعماري يمكن أن يؤدي إلى زيادة استخدام الذاكرة أثناء التدريب مقارنة بالتصميم المبسط لـ YOLOv5.
  • كفاءة التدريب: يستخدم YOLOv5 خاصية AutoAnchor وتطوير المعلمات الفائقة لتحقيق أقصى قدر من الأداء منذ البداية. يتيح توفر الأوزان المدربة مسبقًا عالية الجودة التعلم بالنقل السريع، مما يقلل بشكل كبير من وقت التطوير.

حالات الاستخدام في العالم الحقيقي

غالبًا ما يعتمد الاختيار بين هذه النماذج على بيئة النشر المحددة.

تطبيقات PP-YOLOE+

غالبًا ما يُفضل PP-YOLOE+ في الأبحاث الأكاديمية والسيناريوهات الصناعية تحديدًا داخل السوق الآسيوية حيث تسود البنية التحتية لـ Baidu.

  • الكشف الآلي عن العيوب: تساعد الدقة العالية في تحديد الخدوش الدقيقة على خطوط التصنيع.
  • مراقبة حركة المرور: القدرة على التمييز بين أنواع المركبات المتشابهة في تدفق حركة المرور الكثيف.

تطبيقات YOLOv5

إن تعدد استخدامات YOLOv5 يجعلها الحل الأمثل لمجموعة واسعة من الصناعات العالمية.

  • الزراعة الذكية: تُستخدم في المراقبة الآنية لصحة المحاصيل وروبوتات قطف الفاكهة نظرًا لسرعتها على الأجهزة الطرفية.
  • تحليلات البيع بالتجزئة: تشغيل أنظمة عد الكائنات وإدارة المخزون، والتي تعمل بكفاءة على أجهزة خادم المتجر.
  • الروبوتات الذاتية: يسمح زمن الوصول المنخفض للطائرات بدون طيار والروبوتات بالتنقل في البيئات المعقدة بأمان.
  • أنظمة الأمن: تتكامل بسهولة مع أنظمة إنذار الأمان لاكتشاف التسلل.

مرونة النشر

يتم تصدير YOLOv5 بسلاسة إلى العديد من التنسيقات بما في ذلك ONNX و TensorRT و CoreML و TFLite باستخدام export الوضع. وهذا يضمن أنه بمجرد تدريب النموذج، يمكن نشره في أي مكان تقريبًا، من iPhone إلى خادم سحابي.

الخلاصة

في حين أن PP-YOLOE+ يمثل إنجازًا كبيرًا في الكشف الخالي من المرساة بدقة رائعة في المعايير مثل COCO، تظل Ultralytics YOLOv5 الخيار الأفضل لمعظم المطورين والتطبيقات التجارية. إن مجموعتها الفائزة من سهولة الاستخدام، و النظام البيئي القوي الذي تتم صيانتة جيدًا، و توازن الأداء الممتاز تضمن انتقال المشاريع من المفهوم إلى الإنتاج بسرعة وموثوقية.

بالنسبة للمستخدمين الذين يبحثون عن أحدث التقنيات في مجال رؤية الكمبيوتر، تقدم Ultralytics أيضًا YOLO11، الذي يعتمد على إرث YOLOv5 بكفاءة وقدرة أكبر عبر مهام الكشف والتقسيم وتقدير الوضعيات.

اكتشف المزيد

لاستكشاف البدائل الحديثة التي تقدم ميزات أداء محسنة، ضع في اعتبارك مراجعة ما يلي:

  • Ultralytics YOLO11: أحدث نموذج متطور يقدم دقة وسرعة فائقتين.
  • Ultralytics YOLOv8: نموذج متعدد الاستخدامات قدم أطر عمل موحدة للكشف والتقسيم والتصنيف classify.
  • RT-DETR: كاشف في الوقت الفعلي يعتمد على المحولات لتلبية متطلبات الدقة العالية.

تفضل بزيارة صفحة النماذج الخاصة بنا للاطلاع على المجموعة الكاملة من حلول رؤية الذكاء الاصطناعي المتاحة لمشروعك التالي.


تعليقات