PP-YOLOE+ مقابل YOLOv5: التنقل في الكشف عالي الدقة وجاهزية الإنتاج
غالبًا ما ينطوي اختيار النموذج الأمثل للكشف عن الأجسام على مفاضلة بين المقاييس الأكاديمية الأولية وقدرات النشر العملية. تبحث هذه المقارنة التقنية في نموذج PP-YOLOE+، وهو كاشف مطور خالٍ من المرساة من منظومة PaddlePaddle و Ultralytics YOLOv5وهو النموذج القياسي في هذا المجال والمعروف بتوازنه بين السرعة والدقة وسهولة الاستخدام. بينما يدفع PP-YOLOE+ حدود متوسط الدقةmAP)، يظل YOLOv5 قوة مهيمنة في تطبيقات الاستدلال في الوقت الفعلي نظرًا لتجربة المطورين التي لا مثيل لها وتعدد استخداماته التي لا مثيل لها.
PP-YOLOE+: هندسة دقيقة في PaddlePaddle
PP-YOLOE+ هو نسخة مطورة من PP-YOLOE، طورها باحثون في Baidu كجزء من مجموعة PaddleDetection. تم تصميمه ليكون كاشفًا صناعيًا فعالاً ومتطورًا للأجسام الصناعية مع التركيز على المهام عالية الدقة. ومن خلال الاستفادة من البنية الخالية من الارتكاز، فإنه يبسّط خط أنابيب التدريب ويقلل من ضبط المعلمة الفائقة المرتبطة غالبًا بالطرق القائمة على الارتكاز.
المؤلفون: PaddlePaddle المؤلفون
المنظمة: بايدو
التاريخ: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250https://arxiv.org/abs/2203.16250
GitHub: PaddlePaddle
المستندات: https:PaddlePaddle
الهندسة المعمارية والابتكار
تُقدِّم بنية PP-YOLOE+ العديد من الآليات المتقدمة لتحسين تمثيل الميزات وتحديد موقعها:
- العمود الفقري: يستخدم CSPRepResResNet، وهو العمود الفقري الذي يجمع بين مزايا التدفق المتدرج للشبكات الجزئية المتقاطعة (CSP) وتقنيات إعادة تحديد المعلمات الخاصة بـ RepVGG.
- الرأس الخالي من المرساة: يتم استخدام الرأس الفعال المتوافق مع المهام (ET-Head) لفصل مهام التصنيف والانحدار، مما يحسن سرعة التقارب والدقة.
- استراتيجية التدريب: تتضمن تعلم محاذاة المهام (TAL) لتعيين عينات إيجابية بشكل ديناميكي، مما يضمن إعطاء الأولوية للتنبؤات الأعلى جودة أثناء التدريب.
- وظائف الخسارة: توظف دالة الخسارة البؤرية المتغيرة (VFL) ودالة الخسارة البؤرية للتوزيع (DFL) للتعامل مع عدم توازن الفئات وتحسين دقة الصندوق المحدود.
نقاط القوة والضعف
تتفوق PP-YOLOE+ في السيناريوهات التي تكون فيها الدقة القصوى أمرًا بالغ الأهمية. يزيل تصميمه الخالي من المرتكزات الحاجة إلى تجميع مربعات الارتكاز، مما يجعله قابلاً للتكيف مع مجموعات البيانات ذات الأشكال المختلفة للأجسام. ومع ذلك، فإن اعتماده الكبير على PaddlePaddle يمكن أن يشكّل عقبة أمام الفرق التي تعتمد على إطار عمل PyTorch أو TensorFlow. على الرغم من وجود أدوات لتحويل النماذج، إلا أن دعم النظام البيئي الأصلي أقل شمولاً من دعم الأطر الأكثر اعتماداً عالمياً.
اعتبارات النظام البيئي
بينما يوفر PP-YOLOE+ أداءً نظريًا مثيرًا للإعجاب، إلا أن اعتماده يتطلب غالبًا الإلمام بصيغة PaddlePaddle وأدوات النشر الخاصة بـ PaddlePaddle والتي قد تختلف بشكل كبير عن سير عمل PyTorch القياسي.
Ultralytics YOLOv5: المعيار العالمي للذكاء الاصطناعي للرؤية
أصدره جلين جوشر في عام 2020, Ultralytics YOLOv5 تغييرًا جذريًا في مجال الرؤية الحاسوبية من خلال إتاحة أحدث ما توصلت إليه التكنولوجيا في مجال اكتشاف الأجسام للمطورين من جميع مستويات المهارة. يركز YOLOv5 المصمم أصلاً في PyTorch على "كفاءة التدريب" و"سهولة الاستخدام"، مما يوفر مسارًا سلسًا من تنظيم مجموعة البيانات إلى نشر الإنتاج.
المؤلفون: جلين جوشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: yolov5
المستندات: https:yolov5
البنية والميزات الرئيسية
يستخدم YOLOv5 بنية محسّنة للغاية قائمة على الارتكاز توازن بين العمق والعرض لزيادة الإنتاجية إلى أقصى حد:
- شبكة CSPDarknet الخلفية: يقلل تصميم الشبكة الجزئية عبر المراحل المتقاطعة من معلومات التدرج الزائدة عن الحاجة، مما يعزز القدرة على التعلم مع تقليل المعلمات.
- شبكة تجميع المسار (PANet): تعمل شبكة تجميع المسارات (PANet) على تحسين تدفق المعلومات، مما يساعد النموذج على تحديد موقع الأجسام بدقة عبر مقاييس مختلفة.
- تعزيز الفسيفساء: تقنية متقدمة لزيادة البيانات تجمع بين أربع صور تدريبية في صورة واحدة، مما يحسن بشكل كبير من قدرة النموذج على detect الأجسام الصغيرة والتعميم على البيئات الجديدة.
- الخوارزميات الجينية: يسمح التطوّر الآلي للمُعرِّف الفائق بضبط النموذج ذاتيًا لتحقيق الأداء الأمثل على مجموعات البيانات المخصصة.
نقاط القوة والنظام البيئي
يشتهر YOLOv5 بسهولة استخدامه. واجهة برمجة التطبيقات بديهية، مما يسمح للمستخدمين بتحميل نموذج وتشغيل الاستدلال في بضعة أسطر فقط من كود Python .
import torch
# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Print results
results.print()
بعيدًا عن الكود البرمجي، فإن النظام الإيكولوجي الذي يتم صيانته جيدًا يميز YOLOv5 . يستفيد المستخدمون من التحديثات المتكررة، ومنتدى مجتمعي ضخم، وتكامل سلس مع أدوات MLOps مثل Comet و ClearML. تمتد براعة النموذج إلى ما هو أبعد من مجرد الاكتشاف البسيط، حيث يدعم مهام تجزئة النماذج وتصنيف الصور في نفس الإطار. علاوةً على ذلك، تُظهر نماذج YOLOv5 بشكل عام متطلبات ذاكرة أقل أثناء التدريب مقارنةً بالبنى القائمة على المحولات، مما يجعلها متاحة على وحدات معالجة الرسومات من فئة المستهلك.
مقارنة الأداء الفني
عند المقارنة بين النموذجين، من الضروري النظر إلى المقاييس التي تؤثر على المنفعة في العالم الحقيقي، مثل سرعة الاستدلال وعدد البارامترات، إلى جانب مقاييس الدقة القياسية مثل mAP.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تحليل النتائج
- الدقة مقابل السرعة: يُظهِر PP-YOLOE+ درجات أعلى mAP خاصةً في المتغيرات الأكبر (l وx)، مستفيدًا من رأس خالي من المراسي واستراتيجية TAL. ومع ذلك، يقدم YOLOv5 توازن أداء متفوق، حيث يقدم دقة تنافسية للغاية مع زمن انتقال أقل بكثير (انظر سرعات TensorRT ). وهذا يجعل YOLOv5 مناسبًا بشكل خاص لتطبيقات الذكاء الاصطناعي المتطورة حيث يكون لكل جزء من الثانية أهمية.
- كفاءة الموارد: YOLOv5n (نانو) خفيف الوزن للغاية مع 2.6 مليون معلمة فقط، مما يجعله مثاليًا للأجهزة المحمولة وأجهزة إنترنت الأشياء. على الرغم من أن PP-YOLOE+ يتمتع بعمود فقري فعال، إلا أن التعقيد المعماري يمكن أن يؤدي إلى استخدام أعلى للذاكرة أثناء التدريب مقارنةً بالتصميم المبسط لـ YOLOv5.
- كفاءة التدريب: يستخدم YOLOv5 خاصية AutoAnchor وتطور المعلمة الفائقة لتحقيق أقصى قدر من الأداء منذ البداية. يتيح توافر أوزان عالية الجودة مُدرَّبة مسبقًا إمكانية التعلُّم السريع للنقل، مما يقلل من وقت التطوير بشكل كبير.
حالات الاستخدام في العالم الحقيقي
غالباً ما يعتمد الاختيار بين هذه النماذج على بيئة النشر المحددة.
تطبيقات PP-YOLOE+
غالبًا ما يتم تفضيل PP-YOLOE+ في سيناريوهات البحث الأكاديمي والسيناريوهات الصناعية وتحديدًا في السوق الآسيوية حيث تنتشر البنية التحتية لشركة Baidu.
- الكشف الآلي عن العيوب: تساعد الدقة العالية في تحديد الخدوش الدقيقة على خطوط التصنيع.
- مراقبة حركة المرور: قادرة على التمييز بين أنواع المركبات المتشابهة في التدفق المروري الكثيف.
تطبيقات YOLOv5
إن تعدد استخدامات YOLOv5 يجعل منه الحل الأمثل لطيف واسع من الصناعات العالمية.
- الزراعة الذكية: تُستخدم لمراقبة صحة المحاصيل في الوقت الحقيقي وروبوتات قطف الفاكهة نظراً لسرعتها على الأجهزة المتطورة.
- تحليلات البيع بالتجزئة: يعمل على تشغيل أنظمة عد الكائنات وإدارة المخزون، ويعمل بكفاءة على أجهزة خادم المتجر.
- الروبوتات المستقلة: يسمح الكمون المنخفض للطائرات بدون طيار والروبوتات بالتنقل في البيئات المعقدة بأمان.
- أنظمة الأمن: يندمج بسهولة في أنظمة الإنذار الأمني للكشف عن التسلل.
مرونة النشر
يقوم YOLOv5 بتصدير YOLOv5 بسلاسة إلى العديد من التنسيقات بما في ذلك ONNX TensorRT CoreML TFLite باستخدام export الوضع. وهذا يضمن أنه بمجرد تدريب النموذج، يمكن نشره في أي مكان تقريباً، من جهاز iPhone إلى خادم سحابي.
الخلاصة
في حين يمثل PP-YOLOE+ إنجازًا كبيرًا في الكشف الخالي من الارتكاز مع دقة مذهلة على معايير مثل COCO, Ultralytics YOLOv5 يظل الخيار الأفضل لمعظم المطورين والتطبيقات التجارية. ويضمن مزيجها الرابح من سهولة الاستخدام، والنظام الإيكولوجي القوي الذي يتم صيانته بشكل جيد، وتوازن الأداء الممتاز انتقال المشاريع من المفهوم إلى الإنتاج بسرعة وموثوقية.
بالنسبة للمستخدمين الذين يبحثون عن أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية على الإطلاق، تقدم Ultralytics أيضًا YOLO11الذي يعتمد على إرث YOLOv5 بكفاءة وقدرة أكبر في مهام الكشف والتجزئة وتقدير الوضعية.
اكتشف المزيد
لاستكشاف البدائل الحديثة التي توفر ميزات أداء محسّنة، فكّر في مراجعة ما يلي:
- Ultralytics YOLO11: أحدث طراز متطور يوفر دقة وسرعة فائقة.
- Ultralytics YOLOv8: نموذج متعدد الاستخدامات قدم أطر عمل موحدة للكشف والتجزئة والتصنيف.
- RT-DETR: كاشف قائم على المحول في الوقت الحقيقي لمتطلبات الدقة العالية.
قم بزيارة صفحة النماذج الخاصة بنا للاطلاع على المجموعة الكاملة من حلول الذكاء الاصطناعي للرؤية المتاحة لمشروعك القادم.