تخطي إلى المحتوى

YOLOv9 مقابل YOLOv5: مقارنة مفصلة

تقدم هذه الصفحة مقارنة تقنية بين YOLOv9 و YOLOv5 وهما نموذجان شائعان في سلسلة YOLO مع التركيز على قدراتهما في اكتشاف الأجسام. نتعمق في الاختلافات المعمارية ومقاييس الأداء ومنهجيات التدريب وحالات الاستخدام المناسبة لمساعدتك في اختيار النموذج المناسب لمهام الرؤية الحاسوبية الخاصة بك.

YOLOv9: معلومات التدرج القابلة للبرمجة

يمثل نموذج YOLOv9، الذي قدمه تشين ياو وانغ وهونغ يوان مارك لياو من معهد علوم المعلومات في الأكاديمية الصينية في تايوان في فبراير 2024، تقدماً كبيراً في الكشف عن الأجسام في الوقت الحقيقي. تم تفصيل النموذج في ورقتهم البحثية"YOLOv9: تعلم ما تريد تعلمه باستخدام معلومات التدرج القابلة للبرمجة" والرمز متاح على GitHub.

البنية والابتكارات: يقدم YOLOv9 ابتكارين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تعالج PGI فقدان المعلومات في الشبكات العميقة، مما يسمح للنموذج بالتعلم بشكل أكثر فعالية، بينما تعمل GELAN على تحسين بنية الشبكة لتحسين استخدام المعلمات والكفاءة الحسابية. يؤدي هذا المزيج إلى تحسين الدقة دون زيادة متناسبة في التكلفة الحسابية.

الأداء: يُحقّق YOLOv9 أحدث أداء على مجموعة بيانات MS COCO، مما يدل على دقة وكفاءة فائقة مقارنةً بإصدارات YOLO السابقة وأجهزة الكشف عن الأجسام الأخرى في الوقت الحقيقي. على سبيل المثال، يحقق YOLOv9c دقة 53.0 mAPval50-95 مع 25.3 مليون معلمة.

حالات الاستخدام: YOLOv9 مناسب بشكل مثالي للتطبيقات التي تتطلب دقة وكفاءة عالية، مثل

  • اكتشاف الأجسام عالية الدقة: السيناريوهات التي تكون فيها الدقة بالغة الأهمية، مثل القيادة الذاتية والمراقبة المتقدمة والرؤية الروبوتية.
  • البيئات المحدودة الموارد: في حين أن التدريب يتطلب موارد أكثر من YOLOv5 فإن البنية الفعالة تسمح بالنشر على الأجهزة المتطورة مع سرعة استدلالية محسّنة.

نقاط القوة:

  • دقة عالية: يحقق نتائج متفوقة في MAP، خاصةً في نماذج مثل YOLOv9e.
  • تصميم فعال: يساهم GELAN و PGI في تحسين كفاءة المعلمات والفعالية الحسابية مقارنةً بالنماذج السابقة بدقة مماثلة.

نقاط الضعف:

  • طلب أعلى على موارد التدريب: يتطلب تدريب نماذج YOLOv9 المزيد من الموارد الحاسوبية والوقت مقارنةً بنماذج YOLOv5.
  • نموذج أحدث نسبيًا: نظرًا لكونه نموذجًا أحدث، لا يزال المجتمع والتوثيق يتطوران مقارنةً بنموذج YOLOv5 الأكثر رسوخًا.

اعرف المزيد عن YOLOv9

YOLOv5: تعدد الاستخدامات والسرعة

تشتهر برمجية Ultralytics YOLOv5 التي ألفها جلين جوشر وصدرت في يونيو 2020، بسرعتها وسهولة استخدامها وتعدد استخداماتها. على الرغم من عدم وجود ورقة بحثية محددة من arXiv، إلا أن المعلومات التفصيلية متاحة في وثائقUltralytics YOLOv5 ومستودع GitHub.

البنية والميزات: صُمم YOLOv5 مع التركيز على السرعة وسهولة الوصول، باستخدام بنيات مثل CSP Bottleneck وPANet. وهو يقدم مجموعة من أحجام النماذج (YOLOv5n، s، m، l، x) لتلبية الميزانيات الحسابية واحتياجات الأداء المختلفة. يتم تنفيذ YOLOv5 في PyTorch مما يجعله سهل الاستخدام وقابل للتكيف بدرجة كبيرة.

الأداء: يوفر YOLOv5 توازنًا بين السرعة والدقة، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات الواقعية. يحقق YOLOv5s، وهو متغير صغير، 37.4 ميجابايت في 50-95 مع سرعات استنتاج عالية.

حالات الاستخدام: YOLOv5 متعدد الاستخدامات بشكل استثنائي ويناسب بشكل جيد السيناريوهات التي تكون فيها السرعة وسهولة النشر أمرًا بالغ الأهمية:

  • تطبيقات الوقت الحقيقي: مثالية للتطبيقات التي تتطلب استدلالاً سريعاً، مثل معالجة الفيديو المباشر، والروبوتات، ورؤية الطائرات بدون طيار.
  • النشر على الحافة: تعد النماذج الأصغر (YOLOv5n و YOLOv5s) مناسبة تمامًا للنشر على الأجهزة الطرفية والمنصات المحمولة نظرًا لانخفاض متطلباتها الحسابية.
  • النماذج الأولية والتطوير السريع: سهولة استخدامه وتوثيقه الشامل يجعل YOLOv5 ممتازًا لدورات التطوير السريع والأغراض التعليمية.

نقاط القوة:

  • سرعة عالية: توفر سرعات استنتاج عالية، خاصةً مع متغيرات النماذج الأصغر حجماً.
  • سهولة الاستخدام: موثقة بشكل جيد مع مجتمع كبير ونشط، مما يجعلها سهلة الاستخدام والتنفيذ.
  • تعدد الاستخدامات: متوفر بأحجام متعددة وقابل للتكيف مع مختلف المهام بما في ذلك الكشف والتجزئة والتصنيف.

نقاط الضعف:

  • دقة أقل مقارنةً بـ YOLOv9: بشكل عام، لا تحقق نماذج YOLOv5 نفس مستوى الدقة التي يحققها أحدث إصدار من YOLOv9، خاصةً في السيناريوهات الصعبة.
  • بنية أقل ابتكارًا من YOLOv9: على الرغم من فعاليتها، إلا أن بنيتها لا تتضمن ابتكارات PGI وGELAN الجديدة الموجودة في YOLOv9.

اعرف المزيد عن YOLOv5


الطراز الحجم(بكسل) mAPval50-95 السرعةCPU ONNX(مللي ثانية) سرعةT4TensorRT10(مللي ثانية) بارامز(م) الآفاق(ب)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
يولوف 9 م 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
يولوف 9 هـ 640 55.6 - 16.77 57.3 189.0
يولوف5ن 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
يولوف5م 640 45.4 233.9 4.03 25.1 64.2
يولوف5ل 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

الخاتمة

يعتمد الاختيار بين YOLOv9 و YOLOv5 على أولويات مشروعك. إذا كانت الدقة أمرًا بالغ الأهمية وكانت موارد التدريب متاحة، فإن YOLOv9 هو الخيار الأفضل. أما بالنسبة للتطبيقات التي تعطي الأولوية للسرعة وسهولة الاستخدام ومرونة النشر، خاصةً على الأجهزة المتطورة، يظل YOLOv5 خيارًا ممتازًا ومعتمدًا على نطاق واسع.

بالنسبة للمستخدمين المهتمين باستكشاف نماذج أخرى، تقدم Ultralytics أيضًا YOLOv8 و YOLOv7 و YOLOv6 و YOLO11 الذي تم إصداره حديثًا، ولكل منها نقاط قوته وتحسيناته الخاصة. استكشف وثائق نماذجUltralytics لاكتشاف مجموعة كاملة من الخيارات.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات