تخطي إلى المحتوى

YOLOv9 مقارنة بـ YOLOv7: مقارنة فنية تفصيلية

عند اختيار نموذج YOLO للكشف عن الكائنات، فإن فهم الفروق الدقيقة بين الإصدارات المختلفة أمر بالغ الأهمية. تقدم هذه الصفحة مقارنة فنية مفصلة بين YOLOv7 و YOLOv9، وهما نموذجان مهمان في سلسلة YOLO تم تطويرهما بواسطة باحثين في معهد علوم المعلومات، أكاديميا سينيكا، تايوان. سوف نستكشف ابتكاراتهم المعمارية ومعايير الأداء والملاءمة للتطبيقات المختلفة لمساعدتك في اتخاذ قرار مستنير لمشاريع الرؤية الحاسوبية الخاصة بك.

YOLOv9: معلومات التدرج القابلة للبرمجة للتعلم المحسن

تمثل YOLOv9، التي تم تقديمها في فبراير 2024، تقدمًا كبيرًا من خلال معالجة فقدان المعلومات في الشبكات العصبية العميقة، وهي مشكلة شائعة يمكن أن تقلل من أداء النموذج.

المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2024-02-21
Arxiv: https://arxiv.org/abs/2402.13616
GitHub: https://github.com/WongKinYiu/yolov9
المستندات: https://docs.ultralytics.com/models/yolov9/

البنية والميزات الرئيسية

يقدم YOLOv9 مفاهيم جديدة لتحسين تدفق المعلومات وكفاءة التعلم، مما يميزه عن سابقاته.

  • معلومات التدرج القابلة للبرمجة (PGI): هذا هو الابتكار الأساسي في YOLOv9. يعالج مشكلة عنق الزجاجة المعلوماتي في الشبكات العميقة عن طريق إنشاء تدرجات موثوقة من خلال فروع عكسية مساعدة. وهذا يضمن الحفاظ على المعلومات الهامة عبر جميع الطبقات، مما يؤدي إلى تدريب أكثر فعالية للنموذج ودقة نهائية أفضل.
  • شبكة تجميع الطبقات الفعالة المعممة (GELAN): يتميز YOLOv9 ببنية شبكة جديدة تعمل على تحسين استخدام المعلمات والكفاءة الحسابية. GELAN هي بنية خفيفة الوزن تعتمد على تخطيط مسار التدرج وتعتمد على نجاحات تصميمات مثل CSPNet، التي كانت أساسية في نماذج مثل YOLOv5.

نقاط القوة

  • دقة محسنة: يتيح الجمع بين PGI و GELAN استخلاص ميزات فائقة ونتائج متوسط الدقة (mAP) أعلى مقارنةً بـ YOLOv7، ويظهر ذلك بشكل خاص في متغيرات النموذج الأكبر.
  • كفاءة محسّنة: تحقق YOLOv9 دقة أفضل مع عدد أقل من المعلمات والحسابات (FLOPs) من YOLOv7. على سبيل المثال، تحقق YOLOv9-C خريطة mAP مماثلة لـ YOLOv7x مع عدد أقل من المعلمات بنسبة 66٪ وعدد أقل من FLOPs بنسبة 46٪.
  • الأفضل على الإطلاق: يمثل أحدث الابتكارات من مؤلفي YOLO الأصليين، مما يدفع حدود الممكن في الكشف عن الكائنات في الوقت الفعلي.

نقاط الضعف

  • المتطلبات الحسابية: على الرغم من كفاءة البنية المتقدمة من حيث الدقة، إلا أنها لا تزال تتطلب موارد حسابية كبيرة للتدريب والنشر، خاصةً المتغيرات الأكبر مثل YOLOv9-E.
  • نموذج أحدث: باعتباره إصدارًا أحدث، قد يكون دعم المجتمع والبرامج التعليمية الخاصة بالنشر المتاحة بسهولة أقل شمولاً من YOLOv7 الراسخ. ومع ذلك، فإن تنفيذ Ultralytics YOLOv9 يخفف من ذلك من خلال توفير بيئة مبسطة وموثقة جيدًا ومدعومة.

حالات الاستخدام

يعد YOLOv9 مثاليًا للتطبيقات التي تتطلب أعلى دقة وكفاءة، حيث يكون اكتشاف الكائنات بدقة أمرًا بالغ الأهمية.

تعرف على المزيد حول YOLOv9

YOLOv7: مُحسَّن للسرعة والكفاءة

كانت YOLOv7، التي تم إصدارها في يوليو 2022، نموذجًا بارزًا يهدف إلى تحسين المفاضلة بين السرعة والدقة بشكل كبير من أجل الاستدلال في الوقت الفعلي.

المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
المستندات: https://docs.ultralytics.com/models/yolov7/

البنية والميزات الرئيسية

ركز YOLOv7 على تحسين البنية وعملية التدريب لجعل النماذج أسرع وأكثر دقة دون زيادة تكلفة الاستدلال.

  • شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN): يعزز هذا البلوك المعماري قدرة الشبكة على التعلم من خلال السماح لها بتعلم المزيد من الميزات المتنوعة، وتحسين الأداء دون تعطيل مسار التدرج الأصلي.
  • توسيع النموذج: قدم YOLOv7 أساليب توسيع مركبة لعمق النموذج وعرضه، مما يسمح بتحسينه بفعالية ليناسب أحجام النماذج المختلفة والميزانيات الحسابية.
  • حقيبة الحيل المجانية القابلة للتدريب: يتضمن هذا المفهوم تقنيات تحسين متنوعة أثناء التدريب، مثل زيادة البيانات المتقدمة واستراتيجيات تعيين التسميات. تعمل هذه التقنيات على تحسين الدقة دون إضافة أي أعباء حسابية أثناء الاستنتاج.

نقاط القوة

  • سرعة استنتاج عالية: تم تحسين YOLOv7 بشكل كبير للسرعة ولا يزال أحد أسرع كاشفات الكائنات المتاحة، مما يجعله ممتازًا للتطبيقات في الوقت الفعلي على مختلف الأجهزة.
  • أداء قوي: يحقق درجات mAP تنافسية، مما يجعله خيارًا موثوقًا وقويًا للعديد من مهام الكشف عن الكائنات القياسية.
  • نموذج راسخ: نظرًا لكونه متاحًا لفترة أطول، يستفيد YOLOv7 من اعتماد أوسع، وموارد مجتمعية واسعة النطاق، والعديد من أمثلة النشر المثبتة عبر مختلف الصناعات.

نقاط الضعف

  • دقة قصوى أقل: على الرغم من سرعته، قد يُظهر دقة قصوى أقل قليلاً مقارنة بـ YOLOv9 الأحدث في السيناريوهات المعقدة التي تحتوي على كائنات صعبة.
  • قائم على المرساة: يعتمد على مربعات مرساة محددة مسبقًا، والتي يمكن أن تكون في بعض الأحيان أقل مرونة من الأساليب الخالية من المرساة لاكتشاف الكائنات ذات نسب العرض إلى الارتفاع غير العادية.

حالات الاستخدام

يعد YOLOv7 مناسبًا تمامًا للتطبيقات التي تكون فيها سرعة الاستدلال هي العامل الأكثر أهمية.

  • تحليل الفيديو والمراقبة في الوقت الفعلي على أجهزة الحافة الذكية (Edge AI).
  • أنظمة ذات إنتاجية عالية مثل مراقبة الجودة على خط إنتاج سريع الحركة.
  • النماذج الأولية السريعة لأنظمة الكشف عن الأجسام حيث يكون النشر السريع ضروريًا.

تعرف على المزيد حول YOLOv7

الأداء والكفاءة: نظرة مباشرة

يكمن الاختلاف الأساسي بين YOLOv9 و YOLOv7 في المفاضلة بين الدقة وحجم النموذج والتكلفة الحسابية. تدفع YOLOv9 حدود الكفاءة، وتقدم دقة أعلى مع عدد أقل من المعلمات وعمليات الفاصلة العائمة. على سبيل المثال، تحقق YOLOv9-M نفس نسبة mAP البالغة 51.4٪ مثل YOLOv7l ولكن مع عدد أقل من المعلمات بنسبة 46٪ وعمليات فاصلة عائمة أقل بنسبة 27٪. يستمر هذا الاتجاه صعودًا، حيث تحدد YOLOv9-E حالة جديدة من أحدث التقنيات بنسبة 55.6٪ mAP، متجاوزة جميع متغيرات YOLOv7.

تعني هذه الكفاءة المحسنة أنه بالنسبة لهدف دقة معين، يقدم YOLOv9 نموذجًا أصغر وأسرع وأكثر كفاءة في استخدام الطاقة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

الخلاصة: ما هو النموذج المناسب لك؟

يعتبر كل من YOLOv7 و YOLOv9 من النماذج القوية، لكنهما يخدمان أولويات مختلفة قليلًا.

  • اختر YOLOv9 إذا كان تطبيقك يتطلب أعلى دقة وكفاءة ممكنة. إن التطورات المعمارية تجعله متفوقًا للمشاهد المعقدة وعمليات النشر ذات الموارد المحدودة حيث تحتاج إلى أفضل أداء من نموذج أصغر.

  • اختر YOLOv7 إذا كنت بحاجة إلى نموذج سريع للغاية ومختبر في المعركة لتطبيقات الوقت الفعلي القياسية وتفضل العمل مع بنية أكثر رسوخًا مع موارد مجتمعية واسعة.

بالنسبة للمطورين والباحثين الذين يبحثون عن أفضل تجربة شاملة، نوصي باستخدام هذه النماذج داخل نظام Ultralytics البيئي. لا تقدم النماذج الأحدث مثل Ultralytics YOLOv8 و YOLO11 أداءً تنافسيًا فحسب، بل تأتي أيضًا مع مزايا كبيرة:

  • سهولة الاستخدام: تجربة مستخدم مبسطة مع واجهة برمجة تطبيقات Python بسيطة و توثيق شامل.
  • نظام بيئي مُدار جيدًا: تطوير نشط، ودعم مجتمعي قوي، وتكامل مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
  • تنوع الاستخدامات: دعم مهام متعددة تتجاوز الاكتشاف، بما في ذلك تجزئة المثيلات، و تقدير الوضعية، والتصنيف، كل ذلك ضمن إطار عمل واحد.
  • كفاءة التدريب: عمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة ومتطلبات ذاكرة أقل مقارنة بالعديد من أنواع النماذج الأخرى.

استكشف نماذج أخرى

لإجراء المزيد من المقارنات، يرجى الاطلاع على النماذج الأخرى المتوفرة في وثائق Ultralytics:



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات