تخطي إلى المحتوى

YOLOv9 مقارنة بـ YOLOX: مقارنة فنية

يعد اختيار نموذج الكشف عن الكائنات الأمثل أمرًا بالغ الأهمية لتحقيق النتائج المرجوة في مشاريع رؤية الكمبيوتر. تختلف النماذج اختلافًا كبيرًا في البنية والأداء ومتطلبات الموارد. توفر هذه الصفحة مقارنة فنية مفصلة بين YOLOv9 و YOLOX، وتحلل ميزاتهما الرئيسية لمساعدتك في اختيار الأنسب لاحتياجاتك.

YOLOv9: تعزيز الكشف عن الكائنات في الوقت الحقيقي

المؤلفون: Chien-Yao Wang, Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2024-02-21
Arxiv: arXiv:2402.13616
GitHub: github.com/WongKinYiu/yolov9
المستندات: docs.ultralytics.com/models/yolov9/

يمثل Ultralytics YOLOv9 قفزة كبيرة في الكشف عن الأجسام، حيث يقدم تقنيات مبتكرة مثل معلومات التدرج القابلة للبرمجة (PGI) و شبكة تجميع الطبقات الفعالة المعممة (GELAN). تم تطوير YOLOv9 بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao، ويعالج فقدان المعلومات في الشبكات العصبية العميقة، مما يعزز الدقة والكفاءة. بفضل دمجه في نظام Ultralytics البيئي، يستفيد YOLOv9 من تجربة مستخدم مبسطة و وثائق شاملة ودعم مجتمعي قوي.

تعرف على المزيد حول YOLOv9

البنية والميزات الرئيسية

تم تصميم بنية YOLOv9 للحفاظ على تدفق المعلومات الهامة عبر الطبقات العميقة باستخدام PGI. يساعد هذا في تخفيف مشكلة عنق الزجاجة المعلوماتي الشائعة في الشبكات العميقة. تعمل GELAN على تحسين هيكل الشبكة لتحسين استخدام المعلمات والكفاءة الحسابية، بناءً على مفاهيم من CSPNet و ELAN. ينتج عن هذا أداء حديث مع كفاءة ملحوظة. يضمن تطبيق Ultralytics سهولة الاستخدام مع واجهة برمجة تطبيقات Python بسيطة و عمليات تدريب فعالة، والاستفادة من الأوزان المدربة مسبقًا المتاحة بسهولة.

نقاط القوة

  • دقة هي الأحدث: يحقق درجات mAP رائدة في المعايير القياسية مثل COCO، غالبًا ما يتفوق على النماذج الأخرى ذات الأحجام المماثلة.
  • كفاءة عالية: يوفر دقة عالية مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بالعديد من البدائل، مما يجعله مناسبًا لنشر الذكاء الاصطناعي الطرفي (Edge AI).
  • الحفاظ على المعلومات: يقلل PGI بشكل فعال من فقدان المعلومات، مما يحسن قدرة النموذج على التعلم والأداء النهائي.
  • نظام Ultralytics البيئي: يستفيد من التطوير النشط والموارد الواسعة وتكامل Ultralytics HUB لـ MLOps، ومتطلبات الذاكرة المنخفضة أثناء التدريب.
  • تنوع الاستخدامات: في حين أن الورقة الأصلية تركز على الكشف، إلا أن البنية تُظهر إمكانات لمهام مثل تجزئة المثيلات والمزيد، بما يتماشى مع إمكانات المهام المتعددة لنماذج مثل YOLOv8.

نقاط الضعف

  • باعتباره نموذجًا أحدث، قد تظل مجموعة أمثلة النشر التي يحركها المجتمع في طور النمو مقارنةً بالنماذج الراسخة منذ فترة طويلة. ومع ذلك، فإن تكامله داخل إطار Ultralytics يسرع بشكل كبير من اعتماده ويوفر نظام دعم قوي.

YOLOX: كاشف عالي الأداء للأجسام بدون نقاط ارتكاز

المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
المنظمة: Megvii
التاريخ: 2021-07-18
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
المستندات: https://yolox.readthedocs.io/en/latest/

YOLOX، الذي تم تطويره بواسطة Megvii، هو نموذج للكشف عن الأجسام خالٍ من المرساة يهدف إلى البساطة والأداء العالي. من خلال إزالة آلية مربعات المرساة، يبسّط YOLOX خط تدريب النموذج ويقلل من عدد معلمات التصميم، مما قد يحسن التعميم.

تعرف على المزيد حول YOLOX

البنية والميزات الرئيسية

يتميز YOLOX بالعديد من الخيارات المعمارية الرئيسية. الأهم هو تصميمه الخالي من الارتكاز، والذي يعامل اكتشاف الكائنات كمشكلة تنبؤ لكل بكسل. تشمل الميزات الرئيسية الأخرى رأسًا منفصلاً يفصل بين مهام التصنيف والتوطين، واستراتيجية متقدمة لتعيين التسميات تسمى SimOTA، واستخدام تقنيات زيادة البيانات القوية مثل MixUp و Mosaic.

نقاط القوة

  • تصميم بدون مربعات ارتكاز (Anchor-Free): يبسط بنية النموذج وعملية التدريب عن طريق إلغاء الحاجة إلى ضبط مربع الارتكاز.
  • أداء قوي: يحقق توازنًا تنافسيًا بين متوسط الدقة (mAP) وسرعة الاستدلال في وقته.
  • قابلية التوسع: يقدم مجموعة من أحجام النماذج، من YOLOX-Nano إلى YOLOX-X، مما يسمح بالنشر عبر موارد حسابية مختلفة.

نقاط الضعف

  • أداء أفضل من النماذج الأحدث: على الرغم من الابتكار، فقد تم تجاوز YOLOX في كل من الدقة والكفاءة من خلال نماذج أحدث مثل YOLOv9.
  • نظام بيئي مجزأ: على الرغم من أنه مفتوح المصدر، إلا أنه يفتقر إلى النظام البيئي المتكامل والأدوات المبسطة التي توفرها Ultralytics، مثل التكامل السلس مع Ultralytics HUB لـ MLOps.
  • تكلفة حسابية أعلى: بالنسبة لمستوى معين من الدقة، تميل نماذج YOLOX الأكبر حجمًا إلى امتلاك عدد أكبر من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بنماذج YOLOv9 المماثلة.

مقارنة الأداء: YOLOv9 مقابل YOLOX

عند مقارنة الأداء على مجموعة بيانات COCO، يُظهر YOLOv9 ميزة واضحة في كل من الدقة والكفاءة. يوضح الجدول أدناه أن نماذج YOLOv9 تحقق باستمرار درجات mAP أعلى مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنة بنظيراتها في YOLOX. على سبيل المثال، يحقق YOLOv9-C نسبة mAP تبلغ 53.0% مع 25.3 مليون معلمة، متفوقًا على YOLOX-L (بنسبة mAP تبلغ 49.7% مع 54.2 مليون معلمة) و YOLOX-X (بنسبة mAP تبلغ 51.1% مع 99.1 مليون معلمة) مع كونه أكثر كفاءة بشكل ملحوظ. يدفع أكبر نموذج، YOLOv9-E، حدود الدقة إلى 55.6% mAP، وهو مستوى لا تصل إليه YOLOX. هذا الأداء المتفوق لكل عملية حسابية يجعل YOLOv9 خيارًا أكثر قوة وصديقًا للموارد للتطبيقات الحديثة.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

حالات الاستخدام المثالية

YOLOv9

إن دقة وكفاءة YOLOv9 الفائقة تجعلها الخيار الأمثل للتطبيقات الصعبة حيث الأداء أمر بالغ الأهمية. تتفوق في سيناريوهات مثل:

  • أنظمة مساعدة السائق المتقدمة (ADAS): اكتشاف المركبات والمشاة وعلامات الطريق بدقة عالية من أجل القيادة الذاتية.
  • أمان عالي الموثوقية: مراقبة المشاهد المعقدة في أنظمة الأمان مع معدلات إيجابية كاذبة منخفضة.
  • الأتمتة الصناعية: إجراء مراقبة جودة تفصيلية في التصنيع عن طريق تحديد العيوب الصغيرة.
  • التصوير الطبي: المساعدة في تحليل الفحوصات الطبية من خلال توفير اكتشاف الكائنات الدقيق للحالات الشاذة.

YOLOX

يعتبر YOLOX مناسبًا تمامًا للتطبيقات التي تتطلب توازنًا قويًا بين الدقة والسرعة، خاصةً عندما قد يوفر تصميمه الخالي من المرساة فوائد لمجموعات بيانات معينة. تتضمن حالات الاستخدام المثالية ما يلي:

  • التتبع الآني: تطبيقات في الروبوتات وأنظمة المراقبة حيث يلزم تتبع الأجسام في الوقت الفعلي.
  • البحث الأكاديمي: تصميمه المعياري والخالي من المرساة يجعله نموذجًا مثيرًا للاهتمام للبحث والتجريب في هياكل الكشف عن الكائنات.
  • عمليات النشر على الحافة: يمكن نشر المتغيرات الأصغر YOLOX-Nano و YOLOX-Tiny على الأجهزة ذات الموارد المحدودة، على الرغم من أن النماذج الأحدث مثل YOLOv9 غالبًا ما توفر أداءً أفضل لنفس تكلفة الموارد.

الخلاصة والتوصية

ساهم كل من YOLOv9 و YOLOX بشكل كبير في مجال الكشف عن الأجسام. دفع YOLOX الحدود بتصميمه الخالي من نقاط الارتكاز ورأسه المفصول، مما يوفر خط أساس قوي للكشف في الوقت الفعلي. ومع ذلك، فقد وضع YOLOv9 معيارًا جديدًا لكل من الدقة والكفاءة. تسمح له بنيته المعمارية المبتكرة PGI و GELAN بتحقيق أداء فائق مع موارد حسابية أقل.

بالنسبة للمطورين والباحثين الذين يبحثون عن أفضل أداء وكفاءة وسهولة في الاستخدام، يعد YOLOv9 هو الخيار الواضح. يوفر تكامله في نظام Ultralytics البيئي مزايا لا مثيل لها:

  • سهولة الاستخدام: تعمل واجهة برمجة تطبيقات Python مبسطة و وثائق شاملة و استخدام CLI مباشر على تبسيط عملية التطوير.
  • نظام بيئي مُدار جيدًا: تطوير نشط، ودعم مجتمعي قوي، وتحديثات متكررة، وتكامل مع Ultralytics HUB لعمليات MLOps السلسة.
  • موازنة الأداء: مقايضة ممتازة بين السرعة والدقة، مما يجعلها مناسبة لسيناريوهات العالم الحقيقي المتنوعة من الحافة إلى السحابة.
  • كفاءة التدريب: أوقات تدريب أسرع، وأوزان مُدرَّبة مسبقًا متاحة بسهولة، واستخدام فعال للموارد.

استكشف نماذج أخرى

في حين أن هذه الصفحة تركز على YOLOv9 و YOLOX، إلا أن مجال رؤية الكمبيوتر واسع. نحن نشجعك على استكشاف النماذج الأخرى المتطورة المتاحة داخل نظام Ultralytics البيئي. ضع في اعتبارك التحقق من مقارناتنا لـ YOLOv9 مقابل YOLOv8 للحصول على رؤى حول أحدث نماذج Ultralytics، أو YOLOv9 مقابل YOLOv5 لمعرفة مدى تقدم التكنولوجيا من معيار صناعي راسخ. بالنسبة لأولئك المهتمين بالبنى القائمة على المحولات، تقدم مقارنتنا RT-DETR مقابل YOLOv9 تحليلًا تفصيليًا.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات