تخطي إلى المحتوى

YOLO مقابل YOLOv9: مقارنة تقنية مفصلة

يعد اختيار النموذج الأمثل لاكتشاف الأجسام أمرًا بالغ الأهمية لمهام الرؤية الحاسوبية، حيث تقدم النماذج المختلفة مزايا فريدة من حيث الدقة والسرعة والكفاءة. تقدم هذه الصفحة مقارنة تقنية بين YOLO و YOLOv9، وهما نموذجان متقدمان في هذا المجال. نقوم بتحليل بنيتهما ومعايير أدائهما والتطبيقات المناسبة لتوجيه اختيارك للنموذج.

دامو-YOLO

تم تقديم YOLO من قِبل مجموعة علي بابا وتم تقديمه في نوفمبر 2022(arXiv). وهو يركز على التوازن بين السرعة والدقة، مع دمج العمود الفقري للبنية العصبية (NAS) ومكونات الشبكة الفعالة.

الهندسة المعمارية والميزات

تتميز بنية YOLO بالعديد من الابتكارات الرئيسية:

  • العمود الفقري لـ NAS: يوظف عمودًا فقريًا مُحسّنًا من خلال البحث في البنية العصبية لاستخراج الميزات بكفاءة.
  • RepGFPPN: تستخدم شبكة هرم سمات التدرج المتدرج الفعال لدمج السمات (GFPN) لدمج السمات.
  • ZeroHead: رأس كشف خفيف الوزن مصمم لتقليل النفقات الحسابية الزائدة.
  • AlignedOTA: ينفذ تعيين النقل الأمثل المحاذي (OTA) لتحسين تعيين التسمية أثناء التدريب.
  • تعزيز التقطير: يدمج تقنيات تقطير المعرفة لتعزيز الأداء.

مقاييس الأداء

يقدم YOLO أحجامًا مختلفة من الطرازات (صغيرة، صغيرة، متوسطة، متوسطة وكبيرة) لتلبية الاحتياجات الحسابية المختلفة. تشمل مؤشرات الأداء الرئيسية ما يلي:

  • mAP: يحقق متوسط دقة متوسط تنافسي (mAP) على مجموعات بيانات مثل COCO.
  • سرعة الاستدلال: مصمم للاستدلال السريع، ومناسب لمهام اكتشاف الأجسام في الوقت الحقيقي.
  • حجم الطراز: متوفر بأحجام مختلفة، مما يتيح مرونة في النشر.

نقاط القوة والضعف

نقاط القوة:

  • دقة وسرعة عالية: توازن بين الدقة وسرعة الاستدلال الفعالة.
  • بنية مبتكرة: تتضمن مكونات NAS ومكونات فعالة لتحسين الأداء.
  • قابلية التكيف: تقدم أحجام نماذج مختلفة لمتطلبات التطبيقات المتنوعة.

نقاط الضعف:

  • التعقيد: قد تكون البنية المتقدمة أكثر تعقيداً للتخصيص أو التعديل مقارنةً بالنماذج الأبسط.
  • توثيق محدود: قد يكون التوثيق أقل شمولاً مقارنةً بالنماذج الأكثر اعتمادًا مثل سلسلة YOLO (GitHub README).

حالات الاستخدام

YOLO مناسب تمامًا للتطبيقات التي تتطلب مزيجًا من الدقة والسرعة، مثل

  • المراقبة في الوقت الحقيقي: أنظمة الأمن والمراقبة حيث يكون الكشف في الوقت المناسب أمرًا بالغ الأهمية.
  • الروبوتات: التطبيقات في مجال الروبوتات التي تتطلب إدراكاً فعالاً ودقيقاً.
  • الفحص الصناعي: عمليات مراقبة الجودة الآلية في التصنيع.

اعرف المزيد عن YOLO

يولوف 9

YOLOv9 هو الأحدث في سلسلة YOLO وقد تم تقديمه في فبراير 2024(arXiv) من قبل باحثين من معهد علوم المعلومات في الأكاديمية الصينية في تايوان. يركز YOLOv9 على معالجة فقدان المعلومات في الشبكات العميقة لتعزيز كل من الدقة والكفاءة.

الهندسة المعمارية والميزات

يقدم YOLOv9 تقنيات مبتكرة للتغلب على القيود في نماذج التعلم العميق:

  • معلومات التدرج القابلة للبرمجة (PGI): ابتكار رئيسي للحفاظ على المعلومات المهمة في جميع أنحاء الشبكة، مما يخفف من فقدان المعلومات.
  • شبكة تجميع الطبقات الفعالة المعممة (GELAN): توظف شبكة GELAN للحساب الفعال واستخدام المعلمات بكفاءة.
  • تحسينات في العمود الفقري والرأس: التحسينات في العمود الفقري ورأس الكشف من أجل استخراج الميزات واكتشافها بشكل أفضل.

مقاييس الأداء

يُظهر YOLOv9 أحدث أداء في اكتشاف الأجسام في الوقت الحقيقي:

  • mAP: يحقق درجات عالية في mAP على مجموعات البيانات المعيارية مثل COCO، متفوقًا بذلك على النماذج السابقة.
  • سرعة الاستدلال: يحافظ على سرعات استدلال مذهلة مناسبة لتطبيقات الوقت الحقيقي.
  • حجم النموذج: يقدم أحجام نماذج مختلفة (صغير، صغير، متوسط، إلخ) مع اختلاف عدد المعلمات وفلوب.

نقاط القوة والضعف

نقاط القوة:

  • دقة فائقة: يحقق دقة فائقة مقارنة بالعديد من أجهزة الكشف عن الأجسام في الوقت الحقيقي.
  • تصميم فعال: يساهم PGI و GELAN في زيادة الكفاءة وتقليل النفقات الحسابية.
  • تعدد الاستخدامات: قابلة للتكيف مع مختلف مهام الكشف عن الأجسام وسيناريوهات النشر.
  • تكاملUltralytics : سهل الاستخدام معحزمة Ultralytics Python والوثائق الشاملة.

نقاط الضعف:

  • نموذج جديد: كونه نموذجاً جديداً، قد يكون الدعم المجتمعي والموارد المتاحة لا يزال في طور النمو مقارنة بالنماذج الأكثر رسوخاً.
  • الطلب الحاسوبي: لا تزال نماذج YOLOv9 الأكبر حجمًا تتطلب موارد حاسوبية كبيرة.

حالات الاستخدام

يُعدّ YOLOv9 مثاليًا للتطبيقات التي تتطلب دقة عالية ومعالجة في الوقت الحقيقي:

  • أنظمة مساعدة السائق المتقدمة (ADAS): السيارات ذاتية القيادة والأنظمة ذاتية القيادة التي تتطلب اكتشافاً دقيقاً للأجسام.
  • تحليل الصور عالية الدقة: التطبيقات التي تستفيد من الكشف المفصل والدقيق في الصور عالية الدقة، مثل تحليل صور الأقمار الصناعية.
  • الأتمتة الصناعية: مهام الأتمتة المعقدة التي تتطلب دقة وموثوقية عالية.

اعرف المزيد عن YOLOv9

جدول مقارنة النماذج

الطراز الحجم
(بكسل)
مافال
50-95
السرعة
CPU ONNX
(مللي ثانية)
السرعة
T4 T4TensorRT10
(مللي ثانية)
بارامز
(م)

(ب)
دامو يولوت 640 42.0 - 2.32 8.5 18.1
دامو يولو 640 46.0 - 3.45 16.3 37.8
دامو يولوم 640 49.2 - 5.09 28.2 61.8
دامو يولول 640 50.8 - 7.18 42.1 97.3
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
يولوف 9 م 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
يولوف 9 هـ 640 55.6 - 16.77 57.3 189.0

يُمثل كل من YOLO و YOLOv9 تقدمًا كبيرًا في اكتشاف الأجسام. يوفر YOLO توازناً قوياً بين السرعة والدقة من خلال بنيته الفعالة، بينما يدفع YOLOv9 حدود الدقة من خلال تقنيات PGI وGELAN المبتكرة. سيعتمد اختيارك على الاحتياجات المحددة لتطبيقك، سواء كان يعطي الأولوية للدقة المتطورة أو للأداء الشامل.

قد يهتم المستخدمون أيضًا بمقارنة هذه النماذج مع متغيرات YOLO الأخرى مثل YOLOv8و YOLOv7YOLOv5و YOLO11بالإضافة إلى نماذج مثل YOLOX, RT-DETRو PP-YOLOE لمزيد من الاستكشاف لنماذج اكتشاف الأجسام.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات