تخطي إلى المحتوى

YOLOv9 ضد YOLOv5: مقارنة تفصيلية

تقدم هذه الصفحة مقارنة فنية بين نموذجين مهمين لاكتشاف الكائنات: YOLOv9 و Ultralytics YOLOv5. كلا النموذجين جزء من سلسلة YOLO (You Only Look Once) المؤثرة، والمعروفة بتحقيق التوازن بين السرعة والدقة في اكتشاف الكائنات في الوقت الفعلي. يستكشف هذا التحليل الاختلافات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار النموذج الأنسب لمشاريع رؤية الكمبيوتر الخاصة بك.

YOLOv9: تعزيز الدقة مع بنية جديدة

تم تقديم YOLOv9 في فبراير 2024، مما جلب ابتكارات معمارية كبيرة إلى طليعة الكشف عن الأجسام. ويهدف إلى حل مشكلة فقدان المعلومات في الشبكات العصبية العميقة، وهو تحد حاسم لتدريب نماذج فعالة للغاية.

المؤلفون: Chien-Yao Wang, Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
التوثيق: https://docs.ultralytics.com/models/yolov9/

الهندسة المعمارية والابتكارات

يقدم YOLOv9 مفهومين رائدين تم تفصيلهما في ورقته البحثية، "YOLOv9: تعلم ما تريد تعلمه باستخدام معلومات التدرج القابلة للبرمجة":

  • معلومات التدرج القابلة للبرمجة (PGI): تم تصميم هذا النهج الجديد لمعالجة مشكلة عنق الزجاجة المعلوماتي التي تحدث أثناء تدفق البيانات عبر طبقات الشبكة العميقة. يضمن PGI توفر معلومات إدخال كاملة لحساب دالة الخسارة، وبالتالي الحفاظ على البيانات الهامة لتحديثات التدرج الأكثر دقة وتدريب النموذج بشكل أكثر فعالية.
  • شبكة تجميع الطبقات الفعالة المعممة (GELAN): يتميز YOLOv9 أيضًا بشبكة GELAN، وهي بنية شبكة جديدة مُحسَّنة لتحقيق استخدام فائق للمعلمات وكفاءة حسابية. وهي تعتمد على مبادئ CSPNet و ELAN لإنشاء هيكل يحقق دقة أعلى مع عدد أقل من المعلمات والتكاليف الحسابية (FLOPs).

نقاط القوة

  • دقة محسنة: يسجل YOLOv9 نتائج حديثة وممتازة على مجموعة بيانات COCO، متجاوزًا العديد من كاشفات الأجسام السابقة في الوقت الفعلي في متوسط الدقة (mAP).
  • كفاءة محسّنة: تؤدي مجموعة PGI و GELAN إلى نماذج ليست دقيقة فحسب، بل أيضًا فعالة من الناحية الحسابية، مما يجعلها قوية للمهام التي يكون فيها الأداء بالغ الأهمية.
  • الحفاظ على المعلومات: من خلال معالجة عنق الزجاجة المعلوماتي بشكل مباشر، يسمح PGI بتدريب شبكات أعمق وأكثر تعقيدًا دون التدهور النموذجي في الأداء، مما يؤدي إلى نماذج أكثر قوة.

نقاط الضعف

  • موارد التدريب: كما هو مذكور في وثائق YOLOv9، قد يكون تدريب نماذج YOLOv9 أكثر استهلاكًا للموارد ويستغرق وقتًا أطول مقارنة بالنماذج الأكثر رسوخًا مثل YOLOv5.
  • نظام بيئي أحدث: باعتباره نموذجًا أحدث من مجموعة بحثية مختلفة، فإن نظامه البيئي ودعم المجتمع وعمليات تكامل الطرف الثالث أقل نضجًا من تلك الخاصة بـ Ultralytics YOLOv5 الراسخ.
  • تنوع المهام: يركز YOLOv9 الأصلي بشكل أساسي على اكتشاف الكائنات. ويفتقر إلى الدعم المدمج لمهام الرؤية الأخرى مثل تقسيم المثيلات و تصنيف الصور و تقدير الوضع، والتي يتم دعمها أصلاً في نماذج Ultralytics.

حالات الاستخدام

  • التطبيقات التي تتطلب أعلى دقة ممكنة في الكشف عن الأجسام، مثل تحليلات الفيديو المتقدمة والفحص الصناعي عالي الدقة.
  • السيناريوهات التي يجب فيها موازنة الكفاءة الحسابية مع الأداء المتميز، كما هو الحال في الذكاء الاصطناعي لإدارة حركة المرور.
  • البحث والتطوير في رؤية الكمبيوتر المتقدمة حيث يكون استكشاف البنى الجديدة أولوية.

تعرف على المزيد حول YOLOv9

Ultralytics YOLOv5: المعيار الراسخ والمتعدد الاستخدامات

تم إصدار Ultralytics YOLOv5 في عام 2020، وسرعان ما أصبح معيارًا صناعيًا نظرًا لتوازنه الاستثنائي بين السرعة والدقة وسهولة الاستخدام. تم تطويره بالكامل في PyTorch، وقد تم تحسينه باستمرار ويدعمه نظام بيئي قوي.

المؤلف: جلين جوتشر
المنظمة: Ultralytics
التاريخ: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
التوثيق: https://docs.ultralytics.com/models/yolov5/

البنية والميزات

تستخدم YOLOv5 بنية مُثبتة تتميز بهيكل CSPDarknet53 و PANet لتجميع الميزات بشكل فعال. رأس الكشف القائم على المرساة الخاص به فعال للغاية. يتوفر النموذج بأحجام مختلفة (n, s, m, l, x)، مما يسمح للمطورين باختيار المقايضة المثالية بين الأداء وقيود الموارد.

نقاط القوة

  • سرعة وكفاءة استثنائيتان: تم تحسين YOLOv5 بشكل كبير للاستدلال السريع، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي على نطاق واسع من الأجهزة، بدءًا من وحدات معالجة الرسوميات القوية (GPUs) إلى الأجهزة الطرفية ذات الموارد المحدودة.
  • سهولة الاستخدام: يشتهر YOLOv5 بتجربة المستخدم المبسطة، ويوفر واجهات Python و CLI بسيطة، بالإضافة إلى وثائق شاملة وواضحة.
  • نظام بيئي مُدار بشكل جيد: يستفيد YOLOv5 من نظام Ultralytics البيئي الشامل، والذي يتضمن التطوير النشط، ومجتمع كبير وداعم على Discord، والتحديثات المتكررة، والأدوات القوية مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
  • موازنة الأداء: يحقق توازنًا قويًا بين سرعة الاستدلال ودقة الكشف، مما يجعله مناسبًا لمجموعة متنوعة من سيناريوهات النشر في العالم الحقيقي.
  • تنوع الاستخدامات: على عكس العديد من النماذج المتخصصة، يدعم YOLOv5 مهام متعددة خارج الصندوق، بما في ذلك الكشف عن الكائنات، وتجزئة المثيلات، وتصنيف الصور.
  • كفاءة التدريب: يوفر YOLOv5 عمليات تدريب فعالة، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، ومتطلبات ذاكرة أقل عمومًا مقارنة بالعديد من البنى الأخرى، وخاصة النماذج القائمة على المحولات.

نقاط الضعف

  • ذروة الدقة: على الرغم من دقتها العالية في وقتها، يمكن لنماذج أحدث مثل YOLOv9 تحقيق درجات mAP أعلى في المعايير مثل COCO.
  • تصميم قائم على المرساة: يعتمد على مربعات مرساة محددة مسبقًا، والتي قد تتطلب المزيد من الضبط لمجموعات البيانات ذات الكائنات ذات الأشكال غير العادية مقارنةً بالأساليب الحديثة الخالية من المرساة.

حالات الاستخدام

تعرف على المزيد حول YOLOv5

الأداء والمعايير: YOLOv9 ضد YOLOv5

تسلط مقارنة الأداء بين YOLOv9 و YOLOv5 الضوء على التطورات في بنية النموذج على مر السنين. تحقق نماذج YOLOv9 باستمرار درجات mAP أعلى من نظيراتها في YOLOv5، غالبًا مع استخدام أكثر كفاءة للمعلمات وعمليات النقطة العائمة في الثانية (FLOPs) في الطرف الأعلى. على سبيل المثال، تحقق YOLOv9-C نسبة mAP تبلغ 53.0% مع 25.3 مليون معلمة، متفوقة على نسبة mAP لـ YOLOv5x البالغة 50.7% مع 86.7 مليون معلمة.

ومع ذلك، يتفوق YOLOv5 في السرعة، خاصةً متغيراته الأصغر مثل YOLOv5n و YOLOv5s، التي توفر أوقات استدلال سريعة للغاية على كل من وحدة المعالجة المركزية CPU ووحدة معالجة الرسومات GPU، مما يجعلها لا تقبل المنافسة للعديد من تطبيقات الحافة في الوقت الفعلي.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

الخلاصة: أي نموذج يجب أن تختاره؟

يعتمد الاختيار بين YOLOv9 و YOLOv5 بشكل كبير على الاحتياجات المحددة لمشروعك.

  • YOLOv9 هو الخيار الأفضل للتطبيقات التي يكون فيها أقصى دقة هو الهدف الأساسي، ولديك موارد حسابية كافية للتدريب. تجعلها بنيتها المبتكرة مثالية لتجاوز حدود أداء الكشف عن الكائنات في المجالات المتخصصة.

  • Ultralytics YOLOv5 لا يزال الخيار الأكثر عملية وتنوعًا لمجموعة واسعة من التطبيقات. إن مزاياه الرئيسية - سهولة الاستخدام والسرعة ودعم المهام المتعددة ونظام بيئي ناضج ومدعوم جيدًا - تجعله النموذج المفضل للمطورين الذين يحتاجون إلى بناء حلول قوية وواقعية بسرعة وكفاءة. بالنسبة للمشاريع التي تتطلب النشر على الأجهزة الطرفية أو تحقيق التوازن بين السرعة والدقة، غالبًا ما يكون YOLOv5 هو الخيار الأمثل.

بالنسبة لأولئك الذين يبحثون عن حل وسط أو حتى ميزات أكثر تقدمًا، تقدم Ultralytics مجموعة كاملة من النماذج. ضع في اعتبارك استكشاف YOLOv8، الذي يجمع بين العديد من مزايا سهولة استخدام YOLOv5 مع architecture خالية من المرساة وتنوع أكبر، أو أحدث YOLO11 للحصول على أحدث أداء في النظام البيئي Ultralytics. يمكنك العثور على مزيد من المقارنات على صفحة مقارنة النماذج الخاصة بنا.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات