انتقل إلى المحتوى

YOLOv4: اكتشاف الأشياء عالي السرعة والدقيق

مرحبا بكم في Ultralytics صفحة توثيق ل YOLOv4 ، وهو جهاز حديث للكشف عن الأشياء في الوقت الفعلي تم إطلاقه في عام 2020 بواسطة Alexey Bochkovskiy في https://github.com/AlexeyAB/darknet. تم تصميم YOLOv4 لتوفير التوازن الأمثل بين السرعة والدقة ، مما يجعله خيارا ممتازا للعديد من التطبيقات.

مخطط معماري YOLOv4 مخطط معماري YOLOv4. عرض تصميم الشبكة المعقد ل YOLOv4 ، بما في ذلك مكونات العمود الفقري والرقبة والرأس ، وطبقاتها المترابطة للكشف الأمثل عن الأشياء في الوقت الفعلي.

مقدمة

YOLOv4 تعني أنت تنظر مرة واحدة فقط الإصدار 4. إنه نموذج للكشف عن الكائنات في الوقت الفعلي تم تطويره لمعالجة قيود السابقة YOLO إصدارات مثل YOLOv3 ونماذج الكشف عن الكائنات الأخرى. على عكس أجهزة الكشف عن الكائنات الأخرى القائمة على الشبكة العصبية التلافيفية (CNN) ، فإن YOLOv4 لا ينطبق فقط على أنظمة التوصية ولكن أيضا على إدارة العمليات المستقلة وتقليل المدخلات البشرية. يسمح تشغيلها على وحدات معالجة الرسومات التقليدية (GPUs) بالاستخدام الشامل بسعر مناسب ، وهي مصممة للعمل في الوقت الفعلي على وحدة معالجة الرسومات التقليدية بينما تتطلب وحدة معالجة رسومات واحدة فقط للتدريب.

معمار

يستخدم YOLOv4 العديد من الميزات المبتكرة التي تعمل معا لتحسين أدائه. وتشمل هذه الاتصالات المتبقية المرجحة (WRC) ، والاتصالات عبر المراحل الجزئية (CSP) ، وتطبيع الدفعات المصغرة المتقاطعة (CmBN) ، والتدريب الذاتي (SAT) ، وتنشيط Mish ، وزيادة بيانات الفسيفساء ، وتنظيم DropBlock ، وفقدان CIoU. يتم الجمع بين هذه الميزات لتحقيق أحدث النتائج.

يتكون كاشف الكائن النموذجي من عدة أجزاء بما في ذلك الإدخال والعمود الفقري والرقبة والرأس. يتم تدريب العمود الفقري ل YOLOv4 مسبقا على ImageNet ويستخدم للتنبؤ بالفئات والمربعات المحيطة بالكائنات. يمكن أن يكون العمود الفقري من عدة طرز بما في ذلك VGG أو ResNet أو ResNeXt أو DenseNet. يستخدم الجزء الرقبة من الكاشف لجمع خرائط المعالم من مراحل مختلفة وعادة ما يتضمن عدة مسارات من أسفل إلى أعلى والعديد من المسارات من أعلى إلى أسفل. جزء الرأس هو ما يستخدم لإجراء عمليات الكشف والتصنيفات النهائية للكائنات.

حقيبة من الهدايا المجانية

يستخدم YOLOv4 أيضا طرقا تعرف باسم "حقيبة الهدايا المجانية" ، وهي تقنيات تعمل على تحسين دقة النموذج أثناء التدريب دون زيادة تكلفة الاستدلال. زيادة البيانات هي حقيبة شائعة من تقنية الهدايا المجانية المستخدمة في اكتشاف الكائنات ، مما يزيد من تباين الصور المدخلة لتحسين متانة النموذج. تتضمن بعض الأمثلة على زيادة البيانات التشوهات الضوئية (ضبط السطوع والتباين وتدرج اللون والتشبع والضوضاء للصورة) والتشوهات الهندسية (إضافة قياس عشوائي ، اقتصاص ، قلب ، وتدوير). تساعد هذه التقنيات النموذج على التعميم بشكل أفضل على أنواع مختلفة من الصور.

الميزات والأداء

تم تصميم YOLOv4 لتحقيق السرعة والدقة المثلى في اكتشاف الكائنات. تتضمن بنية YOLOv4 CSPDarknet53 كعمود فقري ، و PANet كرقبة ، و YOLOv3 كرأس كشف. يسمح هذا التصميم ل YOLOv4 بإجراء اكتشاف الكائنات بسرعة مذهلة ، مما يجعله مناسبا للتطبيقات في الوقت الفعلي. يتفوق YOLOv4 أيضا في الدقة ، ويحقق نتائج حديثة في معايير اكتشاف الكائنات.

أمثلة الاستخدام

اعتبارا من وقت كتابة هذا التقرير ، Ultralytics لا يدعم حاليا طرازات YOLOv4. لذلك ، سيحتاج أي مستخدم مهتم باستخدام YOLOv4 إلى الرجوع مباشرة إلى مستودع YOLOv4 GitHub للحصول على إرشادات التثبيت والاستخدام.

فيما يلي نظرة عامة موجزة على الخطوات النموذجية التي قد تتخذها لاستخدام YOLOv4:

  1. قم بزيارة مستودع YOLOv4 GitHub: https://github.com/AlexeyAB/darknet.

  2. اتبع الإرشادات المتوفرة في الملف التمهيدي للتثبيت. يتضمن هذا عادة استنساخ المستودع وتثبيت التبعيات الضرورية وإعداد أي متغيرات بيئة ضرورية.

  3. بمجرد اكتمال التثبيت ، يمكنك تدريب النموذج واستخدامه وفقا لتعليمات الاستخدام الواردة في المستودع. يتضمن هذا عادة إعداد مجموعة البيانات الخاصة بك ، وتكوين معلمات النموذج ، وتدريب النموذج ، ثم استخدام النموذج المدرب لإجراء اكتشاف الكائن.

يرجى ملاحظة أن الخطوات المحددة قد تختلف اعتمادا على حالة الاستخدام المحددة والحالة الحالية لمستودع YOLOv4. لذلك ، يوصى بشدة بالرجوع مباشرة إلى الإرشادات الواردة في مستودع YOLOv4 GitHub.

نأسف لأي إزعاج قد يسببه هذا وسنسعى جاهدين لتحديث هذا المستند بأمثلة استخدام ل Ultralytics بمجرد تنفيذ دعم YOLOv4.

استنتاج

YOLOv4 هو نموذج قوي وفعال للكشف عن الأشياء يحقق التوازن بين السرعة والدقة. يتيح استخدامه للميزات الفريدة وحقيبة تقنيات الهدايا المجانية أثناء التدريب أداء ممتازا في مهام اكتشاف الأشياء في الوقت الفعلي. يمكن تدريب YOLOv4 واستخدامه من قبل أي شخص لديه وحدة معالجة رسومات تقليدية ، مما يجعله متاحا وعمليا لمجموعة واسعة من التطبيقات.

الاستشهادات والشكر

نود أن نعرب عن تقديرنا لمؤلفي YOLOv4 لمساهماتهم الكبيرة في مجال اكتشاف الكائنات في الوقت الفعلي:

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

يمكن العثور على ورقة YOLOv4 الأصلية على arXiv. جعل المؤلفون أعمالهم متاحة للجمهور ، ويمكن الوصول إلى قاعدة التعليمات البرمجية على GitHub. نحن نقدر جهودهم في النهوض بالمجال وجعل عملهم في متناول المجتمع الأوسع.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (7), sergiuwaxmann (1)

التعليقات