YOLOv7 ضد PP-YOLOE+: مقارنة فنية لكشف الأجسام
يُعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية في رؤية الكمبيوتر، ويتطلب موازنة دقيقة بين الدقة والسرعة والموارد الحسابية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOv7 و PP-YOLOE+، وهما نموذجان مؤثران وضعا معايير عالية في هذا المجال. سوف نستكشف تصميماتهما المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ خيار مستنير لمشاريعك.
YOLOv7: مُحسَّنة للسرعة والدقة
يمثل YOLOv7 علامة فارقة مهمة في عائلة YOLO، ويشتهر بتوازنه الاستثنائي بين سرعة الاستدلال في الوقت الفعلي والدقة العالية. لقد قدم تحسينات معمارية وتدريبية جديدة دفعت حدود ما كان ممكنًا لأجهزة الكشف عن الأجسام في وقت إصداره.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- ArXiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- المستندات: https://docs.ultralytics.com/models/yolov7/
البنية والميزات الرئيسية
يتضمن هيكل YOLOv7 العديد من الابتكارات الرئيسية المفصلة في الورقة. إحدى مساهماته الرئيسية هي شبكة تجميع الطبقات الفعالة الممتدة (E-ELAN)، وهي تصميم العمود الفقري جديد يعزز قدرة الشبكة على التعلم دون تعطيل مسار التدرج، مما يؤدي إلى استخراج ميزات أكثر فعالية.
علاوة على ذلك، تستخدم YOLOv7 نهج "حقيبة الحيل المجانية القابلة للتدريب". يتضمن ذلك استخدام تقنيات التحسين المتقدمة واستراتيجيات التدريب، مثل فقدان توجيه الرصاص من الخشن إلى الدقيق، مما يحسن دقة الكشف دون إضافة أي تكلفة حسابية أثناء الاستدلال. يستفيد النموذج أيضًا من تقنيات إعادة المعلمات لإنشاء بنية أكثر كفاءة للنشر بعد اكتمال التدريب.
الأداء وحالات الاستخدام
يشتهر YOLOv7 بأدائه المتميز، لا سيما في السيناريوهات التي تتطلب معالجة عالية السرعة دون المساس بالدقة بشكل كبير. كفاءته تجعله خيارًا ممتازًا لـ الاستدلال في الوقت الفعلي على أجهزة GPU.
تشمل التطبيقات المثالية:
- الأنظمة الذاتية: تشغيل أنظمة الإدراك في المركبات ذاتية القيادة والطائرات بدون طيار حيث يكون زمن الوصول المنخفض أمرًا بالغ الأهمية للسلامة.
- الأمن والمراقبة: يستخدم في أنظمة الأمان المتقدمة للكشف الفوري عن التهديدات في بث الفيديو المباشر.
- الروبوتات: تمكين الروبوتات من إدراك بيئتها والتفاعل معها في الوقت الفعلي، وهو أمر بالغ الأهمية لأتمتة التصنيع والخدمات اللوجستية.
نقاط القوة والضعف
- نقاط القوة: أحدث ما توصلت إليه التكنولوجيا في تحقيق التوازن بين السرعة والدقة، تصميم معماري عالي الكفاءة للاستدلال على GPU، واستراتيجيات تدريب متقدمة تعزز الأداء.
- نقاط الضعف: كنموذج يعتمد على المرساة، قد يتطلب ضبطًا دقيقًا لتكوينات مربعات المرساة لتحقيق الأداء الأمثل على مجموعات البيانات المخصصة. يمكن أن تكون عملية التدريب للنماذج الأكبر حجمًا مكثفة من الناحية الحسابية.
PP-YOLOE+: خالٍ من المرساة ومتعدد الاستخدامات
PP-YOLOE+، الذي تم تطويره بواسطة Baidu، هو كاشف عالي الأداء بدون نقاط ارتكاز من مجموعة PaddleDetection. يتميز بقابليته للتوسع وأدائه القوي عبر مجموعة من أحجام النماذج، مع تبسيط خط أنابيب الكشف عن طريق إزالة مربعات الارتكاز.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- ArXiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
وثائق PP-YOLOE+ (PaddleDetection)
البنية والميزات الرئيسية
يكمن الابتكار الأساسي في PP-YOLOE+ في تصميمه الخالي من المرساة، والذي يبسط النموذج عن طريق إزالة الحاجة إلى مربعات الارتساء المحددة مسبقًا والمعلمات الفائقة المرتبطة بها. وهذا يجعل النموذج أكثر مرونة وأسهل في التكيف مع أشكال وأحجام الكائنات المختلفة. يتميز برأس منفصل لمهام التصنيف والتوطين، مما يساعد على حل تعارضات التحسين بين الاثنين. يستخدم النموذج أيضًا VariFocal Loss، وهي دالة خسارة متخصصة، لتحديد أولويات الأمثلة الصعبة أثناء التدريب. يتضمن الإصدار "+" تحسينات على backbone والعنق (شبكة تجميع المسارات) والرأس لتحسين الأداء.
الأداء وحالات الاستخدام
توفر PP-YOLOE+ مجموعة من النماذج (t, s, m, l, x) التي تقدم موازنة مرنة بين السرعة والدقة. هذه القابلية للتوسع تجعلها قابلة للتكيف مع مختلف قيود الأجهزة، من الأجهزة الطرفية محدودة الموارد إلى خوادم الحوسبة السحابية القوية.
تشمل التطبيقات المثالية:
- الأتمتة الصناعية: مناسب للتفتيش على الجودة في التصنيع حيث يلزم تحقيق توازن بين السرعة والدقة.
- تحليلات البيع بالتجزئة: يمكن استخدامه لـ إدارة مخزون الرفوف وتحليل سلوك العملاء.
- المراقبة البيئية: كفاءته مفيدة لتطبيقات مثل إعادة التدوير الآلية وفرز النفايات.
نقاط القوة والضعف
- نقاط القوة: تصميم خالٍ من الارتكازات يبسط التصميم المعماري وعملية التدريب. يوفر قابلية توسع ممتازة مع أحجام نماذج متعددة ويحقق توازنًا قويًا بين الدقة والسرعة.
- نقاط الضعف: تم تصميم النموذج بشكل أساسي لإطار عمل التعلم العميق PaddlePaddle، مما قد يتطلب جهدًا إضافيًا للتكامل في سير العمل القائم على PyTorch. يعد دعم المجتمع وأدوات الطرف الثالث أقل شمولاً من دعم عائلة YOLO.
مقارنة الأداء وجهاً لوجه
عند مقارنة YOLOv7 و PP-YOLOE+، غالبًا ما يعتمد الاختيار على متطلبات الأداء المحددة والأجهزة. يتفوق YOLOv7 عمومًا في تقديم أقصى إنتاجية على وحدات معالجة الرسومات (GPUs)، كما هو موضح في مقاييس FPS العالية الخاصة به. من ناحية أخرى، يوفر PP-YOLOE+ مجموعة أكثر دقة من النماذج، مما يسمح للمطورين باختيار نقطة التوازن التي يحتاجونها بالضبط. على سبيل المثال، PP-YOLOE+s سريع بشكل استثنائي، بينما يحقق PP-YOLOE+x mAP عاليًا جدًا على حساب السرعة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
لماذا Ultralytics YOLO هو الخيار الأفضل
في حين أن كلاً من YOLOv7 و PP-YOLOE+ هما نموذجان قويان، سيجد المطورون والباحثون الذين يبحثون عن إطار عمل حديث ومتعدد الاستخدامات وسهل الاستخدام قيمة فائقة في نظام Ultralytics البيئي، لا سيما مع نماذج مثل Ultralytics YOLOv8 وأحدث YOLO11.
إليك سبب تميز نماذج Ultralytics YOLO:
- سهولة الاستخدام: توفر Ultralytics واجهة Python API و CLI مبسطة تجعل التدريب والتحقق والنشر في غاية السهولة. ويدعم ذلك توثيق شامل والعديد من البرامج التعليمية.
- نظام بيئي مُدار بشكل جيد: تعد النماذج جزءًا من نظام بيئي شامل يتضمن تطويرًا نشطًا ومجتمعًا كبيرًا مفتوح المصدر وتكاملاً مع أدوات مثل Ultralytics HUB لـ MLOps سلس.
- تنوع الاستخدامات: نماذج Ultralytics مثل YOLOv8 و YOLO11 لا تقتصر على اكتشاف الكائنات. إنها توفر دعمًا مدمجًا لمهام الرؤية الرئيسية الأخرى، بما في ذلك تجزئة المثيلات، و تقدير الوضعية، و التصنيف، و اكتشاف الكائنات الموجهة (OBB)، مما يوفر حلاً موحدًا.
- الأداء والكفاءة: تم تصميم نماذج Ultralytics لتحقيق توازن مثالي بين السرعة والدقة. كما أنها فعالة من حيث الذاكرة، وغالبًا ما تتطلب ذاكرة CUDA أقل للتدريب والاستدلال مقارنةً بالبنى الأخرى، وهو ما يمثل ميزة كبيرة.
- كفاءة التدريب: بفضل الأوزان المُدرَّبة مسبقًا المتاحة بسهولة على مجموعات البيانات مثل COCO وعمليات التدريب الفعالة، أصبح الحصول على نموذج مخصص عالي الأداء أسرع وأكثر سهولة.
الخلاصة
يعد YOLOv7 خيارًا هائلاً للتطبيقات التي تكون فيها أولوية أداء GPU في الوقت الفعلي هي الأولوية القصوى. يوفر PP-YOLOE+ قابلية تطوير ممتازة ونهجًا مبسطًا خاليًا من المرساة، ولكن اعتماده على إطار PaddlePaddle يمكن أن يكون قيدًا للعديد من المطورين.
ومع ذلك، بالنسبة لمعظم التطبيقات الحديثة، تقدم نماذج Ultralytics مثل YOLOv8 و YOLO11 خيارًا أكثر إقناعًا ومستقبليًا. فهي تجمع بين أحدث أداء وتجربة مستخدم لا مثيل لها ودعم واسع النطاق للمهام ونظام بيئي قوي يتم صيانته جيدًا. وهذا يجعلها الخيار الأمثل للمطورين والباحثين الذين يتطلعون إلى بناء ونشر حلول رؤية حاسوبية عالية الجودة بكفاءة.
استكشف نماذج أخرى
للمزيد من الاستكشاف، ضع في اعتبارك هذه المقارنات التي تتضمن YOLOv7 و PP-YOLOE+ ونماذج رائدة أخرى:
- YOLOv7 ضد YOLOv8
- PP-YOLOE+ مقابل YOLOv8
- YOLOX ضد YOLOv7
- RT-DETR مقابل YOLOv7
- استكشف أحدث النماذج مثل YOLOv10 و YOLO11.