YOLOv4: الكشف عن الأجسام بسرعة عالية ودقة عالية

مرحبًا بك في صفحة التوثيق Ultralytics الخاصة بـ YOLOv4، وهو كاشف الأجسام المتطور في الوقت الحقيقي الذي أطلقه أليكسي بوشكوفسكي في عام 2020 على الموقع الإلكتروني https://github.com/AlexeyAB/darknet. تم تصميم YOLOv4 لتوفير التوازن الأمثل بين السرعة والدقة، مما يجعله خيارًا ممتازًا للعديد من التطبيقات.

مخطط بنية YOLOv4. عرض التصميم المعقد لشبكة YOLOv4، بما في ذلك مكونات العمود الفقري والرقبة والرأس وطبقاتها المترابطة للكشف الأمثل عن الأجسام في الوقت الحقيقي.

مقدمة

يرمز YOLOv4 إلى الإصدار 4 من You Only Look Only One. وهو نموذج للكشف عن الكائنات في الوقت الحقيقي تم تطويره لمعالجة قيود الإصدارات السابقة YOLO مثل YOLOv3 ونماذج الكشف عن الكائنات الأخرى. على عكس أجهزة الكشف عن الكائنات الأخرى القائمة على الشبكة العصبية التلافيفية (CNN)، فإن YOLOv4 لا ينطبق فقط على أنظمة التوصية ولكن أيضًا على إدارة العمليات المستقلة وتقليل المدخلات البشرية. ويسمح تشغيله على وحدات معالجة الرسومات التقليدية (GPUs) باستخدامه على نطاق واسع وبسعر معقول، وهو مصمم للعمل في الوقت الفعلي على GPU التقليدي بينما يتطلب فقط واحدًا من هذا القبيل GPU للتدريب.

الهندسة المعمارية

يستخدم YOLOv4 العديد من الميزات المبتكرة التي تعمل معًا لتحسين أدائه. وتشمل هذه الميزات التوصيلات الموزونة-المتعددة المراحل (WRC)، والتوصيلات الجزئية المتقاطعة (CSP)، والتطبيع المتقاطع للدفعات المصغرة (CmBN)، والتدريب الذاتي العكسي (SAT)، والتفعيل الخاطئ، وزيادة بيانات الفسيفساء، وتنظيم دروب بلوك (DropBlock)، وفقدان وحدة التداخلات المتقاطعة. يتم الجمع بين هذه الميزات لتحقيق أحدث النتائج.

يتألف كاشف الكائنات النموذجي من عدة أجزاء بما في ذلك المدخلات والعمود الفقري والرقبة والرأس. يتم تدريب العمود الفقري ل YOLOv4 مسبقًا على ImageNet ويُستخدم للتنبؤ بالفئات والمربعات المحدودة للأجسام. يمكن أن يكون العمود الفقري من عدة نماذج بما في ذلك VGG أو ResNet أو ResNeXt أو DenseNet. يُستخدم جزء الرقبة من الكاشف لجمع خرائط السمات من مراحل مختلفة وعادةً ما يتضمن عدة مسارات من الأسفل إلى الأعلى وعدة مسارات من الأعلى إلى الأسفل. جزء الرأس هو ما يُستخدم لإجراء عمليات الكشف والتصنيفات النهائية للأجسام.

حقيبة الهدايا المجانية

يستفيد YOLOv4 أيضًا من الأساليب المعروفة باسم "حقيبة الرغبات الحرة"، وهي تقنيات تعمل على تحسين دقة النموذج أثناء التدريب دون زيادة تكلفة الاستدلال. زيادة البيانات هي تقنية شائعة تُعرف باسم "حقيبة البيانات المجانية" تُستخدم في الكشف عن الأجسام، والتي تزيد من تنوع الصور المُدخلة لتحسين متانة النموذج. تشمل بعض الأمثلة على زيادة البيانات التشوهات الضوئية (تعديل السطوع والتباين وتدرج الألوان ودرجة اللون والتشبع والتشويش في الصورة) والتشوهات الهندسية (إضافة التحجيم العشوائي والقص والقلب والتدوير). تساعد هذه التقنيات النموذج على التعميم بشكل أفضل على أنواع مختلفة من الصور.

الميزات والأداء

تم تصميم YOLOv4 لتحقيق السرعة والدقة المثلى في اكتشاف الأجسام. تشتمل بنية YOLOv4 على شبكة CSPDarknet53 كعمود فقري، وPANet كعنق، وYOLOv3 كرأس الكشف. يسمح هذا التصميم لـ YOLOv4 بإجراء الكشف عن الأجسام بسرعة مذهلة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي. يتفوق YOLOv4 أيضًا في الدقة، محققًا أحدث النتائج في معايير اكتشاف الأجسام.

أمثلة على الاستخدام

حتى وقت كتابة هذا التقرير، لا يدعم Ultralytics حاليًا نماذج YOLOv4. ولذلك، سيحتاج أي مستخدم مهتم باستخدام YOLOv4 إلى الرجوع مباشرةً إلى مستودع YOLOv4 GitHub للحصول على تعليمات التثبيت والاستخدام.

فيما يلي لمحة موجزة عن الخطوات النموذجية التي قد تتخذها لاستخدام YOLOv4:

قم بزيارة مستودع YOLOv4 GitHub: https://github.com/AlexeyAB/darknet.
اتبع التعليمات الواردة في ملف README للتثبيت. يتضمن هذا عادةً استنساخ المستودع وتثبيت التبعيات الضرورية وإعداد أي متغيرات بيئة ضرورية.
بمجرد اكتمال التثبيت، يمكنك تدريب النموذج واستخدامه وفقًا لتعليمات الاستخدام المتوفرة في المستودع. يتضمن هذا عادةً إعداد مجموعة البيانات الخاصة بك، وتهيئة معلمات النموذج، وتدريب النموذج، ثم استخدام النموذج المُدرَّب لإجراء عملية الكشف عن الكائنات.

يُرجى ملاحظة أن الخطوات المحددة قد تختلف بناءً على حالة الاستخدام الخاصة بك والحالة الحالية لمستودع YOLOv4. لذلك، يوصى بشدة بالرجوع مباشرةً إلى الإرشادات المتوفرة في مستودع YOLOv4 GitHub.

نأسف لأي إزعاج قد يسببه هذا الأمر وسنسعى جاهدين لتحديث هذا المستند بأمثلة استخدام Ultralytics بمجرد تنفيذ دعم YOLOv4.

الخاتمة

YOLOv4 هو نموذج قوي وفعال للكشف عن الأجسام يحقق التوازن بين السرعة والدقة. يتيح له استخدام ميزات فريدة من نوعها وحقيبة من تقنيات المجانية أثناء التدريب أداءً ممتازًا في مهام اكتشاف الأجسام في الوقت الفعلي. يمكن تدريب YOLOv4 واستخدامه من قبل أي شخص لديه GPU تقليدي، مما يجعله متاحًا وعمليًا لمجموعة واسعة من التطبيقات.

الاستشهادات والشكر والتقدير

نود أن نشكر مؤلفي YOLOv4 على مساهماتهم الكبيرة في مجال الكشف عن الأجسام في الوقت الحقيقي:

BibTeX

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

يمكن الاطلاع على ورقة YOLOv4 الأصلية على arXiv. وقد أتاح المؤلفان عملهما للجمهور، ويمكن الوصول إلى قاعدة الرموز على GitHub. نحن نقدر جهودهم في تطوير المجال وإتاحة عملهم للمجتمع الأوسع.

الأسئلة الشائعة

ما هو YOLOv4 ولماذا يجب أن أستخدمه لاكتشاف الأجسام؟

YOLOv4، وهو اختصار لـ "You Only Look Only One الإصدار 4"، هو نموذج متطور لاكتشاف الأجسام في الوقت الحقيقي طوره أليكسي بوشكوفسكي في عام 2020. وهو يحقق التوازن الأمثل بين السرعة والدقة، مما يجعله مناسبًا للغاية لتطبيقات الوقت الحقيقي. تشتمل بنية YOLOv4 على العديد من الميزات المبتكرة مثل الاتصالات المرجحة-المتعددة (WRC)، والاتصالات الجزئية-المتقاطعة (CSP)، والتدريب الذاتي-المضاد (SAT)، من بين أمور أخرى، لتحقيق أحدث النتائج. إذا كنت تبحث عن نموذج عالي الأداء يعمل بكفاءة عالية على وحدات معالجة الرسومات التقليدية، فإن YOLOv4 هو خيار ممتاز.

كيف تعمل بنية YOLOv4 على تحسين أدائها؟

تشتمل بنية YOLOv4 على عدة مكونات رئيسية: العمود الفقري والرقبة والرأس. يتم تدريب العمود الفقري، الذي يمكن أن يكون نماذج مثل VGG أو ResNet أو CSPDarknet53، مسبقًا للتنبؤ بالفئات والمربعات المحدودة. يربط العنق، الذي يستخدم PANet، خرائط الميزات من مراحل مختلفة لاستخراج البيانات الشاملة. أخيرًا، يقوم الرأس، الذي يستخدم تكوينات من YOLOv3، بإجراء عمليات الكشف النهائية عن الكائنات. كما يستخدم YOLOv4 أيضًا تقنيات "حقيبة من المجانية" مثل زيادة البيانات الفسيفسائية وتنظيم DropBlock، مما يزيد من تحسين سرعته ودقته.

ما هي "حقيبة الهدايا المجانية" في سياق YOLOv4؟

تشير "حقيبة المجانية" إلى الأساليب التي تحسّن دقة تدريب YOLOv4 دون زيادة تكلفة الاستدلال. تتضمن هذه التقنيات أشكالًا مختلفة من زيادة البيانات مثل التشوهات الضوئية (تعديل السطوع والتباين وما إلى ذلك) والتشوهات الهندسية (التحجيم والقص والقلب والتدوير). من خلال زيادة تباين الصور المُدخَلة، تساعد هذه التعزيزات YOLOv4 على تعميم YOLOv4 بشكل أفضل على أنواع مختلفة من الصور، وبالتالي تحسين متانتها ودقتها دون المساس بأدائها في الوقت الحقيقي.

لماذا يعتبر YOLOv4 مناسبًا لاكتشاف الأجسام في الوقت الفعلي على وحدات معالجة الرسومات التقليدية؟

صُمم YOLOv4 لتحسين كل من السرعة والدقة، مما يجعله مثاليًا لمهام اكتشاف الأجسام في الوقت الحقيقي التي تتطلب أداءً سريعًا وموثوقًا. وهو يعمل بكفاءة على وحدات معالجة الرسومات التقليدية، حيث يحتاج إلى وحدة واحدة فقط لكل من التدريب والاستدلال. وهذا يجعله متاحاً وعملياً لمختلف التطبيقات التي تتراوح بين أنظمة التوصية وإدارة العمليات المستقلة، مما يقلل من الحاجة إلى إعدادات الأجهزة المكثفة ويجعله حلاً فعالاً من حيث التكلفة للكشف عن الكائنات في الوقت الحقيقي.

كيف يمكنني البدء باستخدام YOLOv4 إذا كان Ultralytics لا يدعمه حاليًا؟

للبدء في استخدام YOLOv4، يجب عليك زيارة مستودع YOLOv4 GitHub الرسمي. اتبع تعليمات التثبيت الواردة في ملف README، والتي تتضمن عادةً استنساخ المستودع وتثبيت التبعيات وإعداد متغيرات البيئة. بمجرد التثبيت، يمكنك تدريب النموذج من خلال إعداد مجموعة البيانات الخاصة بك، وتكوين معلمات النموذج، واتباع تعليمات الاستخدام المقدمة. نظرًا لأن Ultralytics لا يدعم YOLOv4 حاليًا، يوصى بالرجوع مباشرةً إلى YOLOv4 GitHub للحصول على أحدث الإرشادات وأكثرها تفصيلاً.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 2 شهر