انتقل إلى المحتوى

YOLOv4: اكتشاف الأشياء عالي السرعة والدقيق

مرحبا بكم في Ultralytics صفحة توثيق ل YOLOv4 ، وهو جهاز حديث للكشف عن الأشياء في الوقت الفعلي تم إطلاقه في عام 2020 بواسطة Alexey Bochkovskiy في https://github.com/AlexeyAB/darknet. تم تصميم YOLOv4 لتوفير التوازن الأمثل بين السرعة والدقة ، مما يجعله خيارا ممتازا للعديد من التطبيقات.

مخطط معماري YOLOv4 مخطط معماري YOLOv4. عرض تصميم الشبكة المعقد ل YOLOv4 ، بما في ذلك مكونات العمود الفقري والرقبة والرأس ، وطبقاتها المترابطة للكشف الأمثل عن الأشياء في الوقت الفعلي.

مقدمة

يرمز YOLOv4 إلى الإصدار 4 من You Only Look Only One. وهو نموذج للكشف عن الكائنات في الوقت الحقيقي تم تطويره لمعالجة قيود الإصدارات السابقة YOLO مثل YOLOv3 ونماذج الكشف عن الكائنات الأخرى. على عكس أجهزة الكشف عن الكائنات الأخرى القائمة على الشبكة العصبية التلافيفية (CNN)، فإن YOLOv4 لا ينطبق فقط على أنظمة التوصية ولكن أيضًا على إدارة العمليات المستقلة وتقليل المدخلات البشرية. ويسمح تشغيله على وحدات معالجة الرسومات التقليدية (GPUs) بالاستخدام على نطاق واسع وبسعر معقول، وهو مصمم للعمل في الوقت الفعلي على GPU التقليدي بينما يتطلب فقط واحدًا من هذا القبيل GPU للتدريب.

معمار

يستخدم YOLOv4 العديد من الميزات المبتكرة التي تعمل معا لتحسين أدائه. وتشمل هذه الاتصالات المتبقية المرجحة (WRC) ، والاتصالات عبر المراحل الجزئية (CSP) ، وتطبيع الدفعات المصغرة المتقاطعة (CmBN) ، والتدريب الذاتي (SAT) ، وتنشيط Mish ، وزيادة بيانات الفسيفساء ، وتنظيم DropBlock ، وفقدان CIoU. يتم الجمع بين هذه الميزات لتحقيق أحدث النتائج.

يتكون كاشف الكائن النموذجي من عدة أجزاء بما في ذلك الإدخال والعمود الفقري والرقبة والرأس. يتم تدريب العمود الفقري ل YOLOv4 مسبقا على ImageNet ويستخدم للتنبؤ بالفئات والمربعات المحيطة بالكائنات. يمكن أن يكون العمود الفقري من عدة طرز بما في ذلك VGG أو ResNet أو ResNeXt أو DenseNet. يستخدم الجزء الرقبة من الكاشف لجمع خرائط المعالم من مراحل مختلفة وعادة ما يتضمن عدة مسارات من أسفل إلى أعلى والعديد من المسارات من أعلى إلى أسفل. جزء الرأس هو ما يستخدم لإجراء عمليات الكشف والتصنيفات النهائية للكائنات.

حقيبة من الهدايا المجانية

يستخدم YOLOv4 أيضا طرقا تعرف باسم "حقيبة الهدايا المجانية" ، وهي تقنيات تعمل على تحسين دقة النموذج أثناء التدريب دون زيادة تكلفة الاستدلال. زيادة البيانات هي حقيبة شائعة من تقنية الهدايا المجانية المستخدمة في اكتشاف الكائنات ، مما يزيد من تباين الصور المدخلة لتحسين متانة النموذج. تتضمن بعض الأمثلة على زيادة البيانات التشوهات الضوئية (ضبط السطوع والتباين وتدرج اللون والتشبع والضوضاء للصورة) والتشوهات الهندسية (إضافة قياس عشوائي ، اقتصاص ، قلب ، وتدوير). تساعد هذه التقنيات النموذج على التعميم بشكل أفضل على أنواع مختلفة من الصور.

الميزات والأداء

تم تصميم YOLOv4 لتحقيق السرعة والدقة المثلى في اكتشاف الكائنات. تتضمن بنية YOLOv4 CSPDarknet53 كعمود فقري ، و PANet كرقبة ، و YOLOv3 كرأس كشف. يسمح هذا التصميم ل YOLOv4 بإجراء اكتشاف الكائنات بسرعة مذهلة ، مما يجعله مناسبا للتطبيقات في الوقت الفعلي. يتفوق YOLOv4 أيضا في الدقة ، ويحقق نتائج حديثة في معايير اكتشاف الكائنات.

أمثلة الاستخدام

اعتبارا من وقت كتابة هذا التقرير ، Ultralytics لا يدعم حاليا طرازات YOLOv4. لذلك ، سيحتاج أي مستخدم مهتم باستخدام YOLOv4 إلى الرجوع مباشرة إلى مستودع YOLOv4 GitHub للحصول على إرشادات التثبيت والاستخدام.

فيما يلي نظرة عامة موجزة على الخطوات النموذجية التي قد تتخذها لاستخدام YOLOv4:

  1. قم بزيارة مستودع YOLOv4 GitHub: https://github.com/AlexeyAB/darknet.

  2. اتبع الإرشادات المتوفرة في الملف التمهيدي للتثبيت. يتضمن هذا عادة استنساخ المستودع وتثبيت التبعيات الضرورية وإعداد أي متغيرات بيئة ضرورية.

  3. بمجرد اكتمال التثبيت ، يمكنك تدريب النموذج واستخدامه وفقا لتعليمات الاستخدام الواردة في المستودع. يتضمن هذا عادة إعداد مجموعة البيانات الخاصة بك ، وتكوين معلمات النموذج ، وتدريب النموذج ، ثم استخدام النموذج المدرب لإجراء اكتشاف الكائن.

يرجى ملاحظة أن الخطوات المحددة قد تختلف اعتمادا على حالة الاستخدام المحددة والحالة الحالية لمستودع YOLOv4. لذلك ، يوصى بشدة بالرجوع مباشرة إلى الإرشادات الواردة في مستودع YOLOv4 GitHub.

نأسف لأي إزعاج قد يسببه هذا وسنسعى جاهدين لتحديث هذا المستند بأمثلة استخدام ل Ultralytics بمجرد تنفيذ دعم YOLOv4.

استنتاج

YOLOv4 هو نموذج قوي وفعال للكشف عن الأجسام يحقق التوازن بين السرعة والدقة. يتيح له استخدام ميزات فريدة من نوعها وحقيبة من تقنيات المجانية أثناء التدريب أداءً ممتازًا في مهام اكتشاف الأجسام في الوقت الفعلي. يمكن تدريب YOLOv4 واستخدامه من قبل أي شخص لديه GPU تقليدي، مما يجعله متاحًا وعمليًا لمجموعة واسعة من التطبيقات.

الاستشهادات والشكر

نود أن نعرب عن تقديرنا لمؤلفي YOLOv4 لمساهماتهم الكبيرة في مجال اكتشاف الكائنات في الوقت الفعلي:

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

يمكن العثور على ورقة YOLOv4 الأصلية على arXiv. جعل المؤلفون أعمالهم متاحة للجمهور ، ويمكن الوصول إلى قاعدة التعليمات البرمجية على GitHub. نحن نقدر جهودهم في النهوض بالمجال وجعل عملهم في متناول المجتمع الأوسع.

الأسئلة المتداولة

ما هو YOLOv4 ولماذا يجب أن أستخدمه لاكتشاف الأجسام؟

YOLOv4، وهو اختصار لـ "You Only Look Only One الإصدار 4"، هو نموذج متطور للكشف عن الأجسام في الوقت الحقيقي طوره أليكسي بوشكوفسكي في عام 2020. وهو يحقق التوازن الأمثل بين السرعة والدقة، مما يجعله مناسبًا للغاية لتطبيقات الوقت الحقيقي. تشتمل بنية YOLOv4 على العديد من الميزات المبتكرة مثل الاتصالات المرجحة-المتعددة (WRC)، والاتصالات الجزئية-المتقاطعة (CSP)، والتدريب الذاتي-المضاد (SAT)، من بين أمور أخرى، لتحقيق أحدث النتائج. إذا كنت تبحث عن نموذج عالي الأداء يعمل بكفاءة عالية على وحدات معالجة الرسومات التقليدية، فإن YOLOv4 هو خيار ممتاز.

كيف تعمل بنية YOLOv4 على تحسين أدائها؟

تشتمل بنية YOLOv4 على عدة مكونات رئيسية: العمود الفقري والرقبة والرأس. يتم تدريب العمود الفقري، الذي يمكن أن يكون نماذج مثل VGG أو ResNet أو CSPDarknet53، مسبقًا للتنبؤ بالفئات والمربعات المحدودة. يربط العنق، الذي يستخدم PANet، خرائط الميزات من مراحل مختلفة لاستخراج البيانات الشاملة. وأخيرًا، يقوم الرأس، الذي يستخدم تكوينات من YOLOv3، بإجراء عمليات الكشف النهائية عن الكائنات. كما يستخدم YOLOv4 أيضًا تقنيات "حقيبة من المجانية" مثل زيادة البيانات الفسيفسائية وتنظيم DropBlock، مما يزيد من تحسين سرعته ودقته.

ما هي "حقيبة الهدايا المجانية" في سياق YOLOv4؟

تشير "حقيبة المجانية" إلى الأساليب التي تحسّن دقة تدريب YOLOv4 دون زيادة تكلفة الاستدلال. تتضمن هذه التقنيات أشكالًا مختلفة من زيادة البيانات مثل التشوهات الضوئية (تعديل السطوع والتباين وما إلى ذلك) والتشوهات الهندسية (التحجيم والقص والقلب والتدوير). من خلال زيادة تباين الصور المُدخَلة، تساعد هذه التعزيزات YOLOv4 على تعميم YOLOv4 بشكل أفضل على أنواع مختلفة من الصور، وبالتالي تحسين متانتها ودقتها دون المساس بأدائها في الوقت الحقيقي.

لماذا يعتبر YOLOv4 مناسبًا لاكتشاف الأجسام في الوقت الفعلي على وحدات معالجة الرسومات التقليدية؟

تم تصميم YOLOv4 لتحسين كل من السرعة والدقة، مما يجعله مثاليًا لمهام اكتشاف الأجسام في الوقت الفعلي التي تتطلب أداءً سريعًا وموثوقًا. وهو يعمل بكفاءة على وحدات معالجة الرسومات التقليدية، حيث يحتاج إلى وحدة واحدة فقط لكل من التدريب والاستدلال. وهذا يجعله متاحاً وعملياً لمختلف التطبيقات التي تتراوح من أنظمة التوصية إلى إدارة العمليات المستقلة، مما يقلل من الحاجة إلى إعدادات الأجهزة المكثفة ويجعله حلاً فعالاً من حيث التكلفة للكشف عن الكائنات في الوقت الحقيقي.

كيف يمكنني البدء باستخدام YOLOv4 إذا كان Ultralytics لا يدعمه حاليًا؟

للبدء في استخدام YOLOv4، يجب عليك زيارة مستودع YOLOv4 GitHub الرسمي. اتبع تعليمات التثبيت الواردة في ملف README، والتي تتضمن عادةً استنساخ المستودع وتثبيت التبعيات وإعداد متغيرات البيئة. بمجرد التثبيت، يمكنك تدريب النموذج من خلال إعداد مجموعة البيانات الخاصة بك، وتكوين معلمات النموذج، واتباع تعليمات الاستخدام المقدمة. نظرًا لأن Ultralytics لا يدعم YOLOv4 حاليًا، يوصى بالرجوع مباشرةً إلى YOLOv4 GitHub للحصول على أحدث الإرشادات وأكثرها تفصيلاً.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-04
المؤلفون: جلين-جوتشر (9)، سيرجيواواكسمن (1)

التعليقات