YOLOv4: كشف دقيق وعالي السرعة عن الأجسام

Q: What is YOLOv4 and why should I use it for object detection?

YOLOv4، التي تعني "أنت تنظر مرة واحدة الإصدار 4"، هو نموذج متطور للكشف عن الكائنات في الوقت الفعلي تم تطويره بواسطة Alexey Bochkovskiy في عام 2020. يحقق توازنًا مثاليًا بين السرعة والدقة، مما يجعله مناسبًا للغاية للتطبيقات في الوقت الفعلي. تتضمن هيكلية YOLOv4 العديد من الميزات المبتكرة مثل Weighted-Residual-Connections (WRC) وCross-Stage-Partial-connections (CSP) وSelf-adversarial-training (SAT)، من بين أمور أخرى، لتحقيق أحدث النتائج. إذا كنت تبحث عن نموذج عالي الأداء يعمل بكفاءة على وحدات معالجة الرسومات التقليدية (GPUs)، فإن YOLOv4 يعد خيارًا ممتازًا.

مرحبًا بك في صفحة وثائق Ultralytics الخاصة بـ YOLOv4، وهي أداة متطورة للكشف عن الأجسام في الوقت الفعلي تم إطلاقها في عام 2020 بواسطة Alexey Bochkovskiy على https://github.com/AlexeyAB/darknet. تم تصميم YOLOv4 لتوفير التوازن الأمثل بين السرعة والدقة، مما يجعلها خيارًا ممتازًا للعديد من التطبيقات.

مخطط هيكلية YOLOv4. يعرض التصميم الشبكي المعقد لـ YOLOv4، بما في ذلك المكونات الأساسية والعنق والرأس، والطبقات المترابطة الخاصة بها للكشف الأمثل عن الأجسام في الوقت الفعلي.

مقدمة

يرمز YOLOv4 إلى You Only Look Once الإصدار الرابع. وهو نموذج للكشف عن الأجسام في الوقت الفعلي تم تطويره لمعالجة القيود المفروضة على إصدارات YOLO السابقة مثل YOLOv3 ونماذج الكشف عن الأجسام الأخرى. بخلاف أدوات الكشف الأخرى عن الأجسام المستندة إلى شبكة عصبونية التفافية (CNN)، فإن YOLOv4 ليست قابلة للتطبيق فقط لأنظمة التوصية ولكن أيضًا لإدارة العمليات المستقلة وتقليل المدخلات البشرية. يتيح تشغيلها على وحدات معالجة الرسومات (GPUs) التقليدية استخدامها على نطاق واسع وبسعر معقول، وهي مصممة للعمل في الوقت الفعلي على وحدة معالجة رسومات (GPU) تقليدية مع طلب وحدة معالجة رسومات واحدة فقط للتدريب.

البنية

يستخدم YOLOv4 العديد من الميزات المبتكرة التي تعمل معًا لتحسين أدائه. وتشمل هذه الميزات اتصالات الوزن المتبقية (WRC)، واتصالات الأجزاء المتقاطعة (CSP)، والتطبيع المصغر المتقاطع Batch Normalization (CmBN)، والتدريب الذاتي الخصوم (SAT)، وتنشيط Mish، وزيادة البيانات Mosaic، وتسوية DropBlock، وخسارة CIoU. يتم دمج هذه الميزات لتحقيق أحدث النتائج.

يتكون كاشف الكائنات النموذجي من عدة أجزاء بما في ذلك المدخلات، والعمود الفقري (backbone)، والرقبة (neck)، والرأس (head). يتم تدريب العمود الفقري لـ YOLOv4 مسبقًا على ImageNet ويستخدم للتنبؤ بالفئات والمربعات المحيطة (bounding boxes) للكائنات. يمكن أن يكون العمود الفقري من عدة نماذج بما في ذلك VGG أو ResNet أو ResNeXt أو DenseNet. يستخدم جزء الرقبة من الكاشف لجمع خرائط الميزات (feature maps) من مراحل مختلفة وعادة ما يتضمن عدة مسارات من الأسفل إلى الأعلى وعدة مسارات من الأعلى إلى الأسفل. الجزء الرأسي هو ما يستخدم لإجراء عمليات detect الكائنات والتصنيفات النهائية.

حقيبة المكافآت المجانية

تستخدم YOLOv4 أيضًا طرقًا تعرف باسم "حقيبة الأشياء المجانية"، وهي تقنيات تعمل على تحسين دقة النموذج أثناء التدريب دون زيادة تكلفة الاستدلال. زيادة البيانات هي تقنية شائعة في حقيبة الأشياء المجانية المستخدمة في اكتشاف الكائنات، والتي تزيد من تقلب الصور المدخلة لتحسين قوة النموذج. تتضمن بعض أمثلة زيادة البيانات تشويهات قياس ضوئي (تعديل السطوع والتباين واللون والتشبع والضوضاء في الصورة) وتشويهات هندسية (إضافة تحجيم عشوائي واقتصاص وقلب وتدوير). تساعد هذه التقنيات النموذج على التعميم بشكل أفضل لأنواع مختلفة من الصور.

الميزات والأداء

تم تصميم YOLOv4 لتحقيق السرعة والدقة المثلى في الكشف عن الكائنات. تشتمل بنية YOLOv4 على CSPDarknet53 باعتباره العمود الفقري، وPANet باعتباره الرقبة، وYOLOv3 باعتباره رأس الكشف. يتيح هذا التصميم لـ YOLOv4 إجراء الكشف عن الكائنات بسرعة مذهلة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي. يتفوق YOLOv4 أيضًا في الدقة، حيث يحقق أحدث النتائج في معايير الكشف عن الكائنات مثل COCO.

بالمقارنة مع النماذج الأخرى في عائلة YOLO، مثل YOLOv5 و YOLOv7، يحافظ YOLOv4 على مكانة قوية في التوازن بين السرعة والدقة. في حين أن النماذج الأحدث قد تقدم مزايا معينة، إلا أن الابتكارات المعمارية لـ YOLOv4 لا تزال تجعلها ذات صلة بالعديد من التطبيقات التي تتطلب أداءً في الوقت الفعلي.

أمثلة الاستخدام

اعتبارًا من وقت كتابة هذا التقرير، لا تدعم Ultralytics حاليًا نماذج YOLOv4. لذلك، سيحتاج أي مستخدمين مهتمين باستخدام YOLOv4 إلى الرجوع مباشرةً إلى مستودع YOLOv4 GitHub للحصول على إرشادات التثبيت والاستخدام.

فيما يلي نظرة عامة موجزة عن الخطوات النموذجية التي قد تتخذها لاستخدام YOLOv4:

قم بزيارة مستودع YOLOv4 GitHub: https://github.com/AlexeyAB/darknet.
اتبع الإرشادات المتوفرة في ملف README للتثبيت. يتضمن هذا عادةً استنساخ المستودع وتثبيت التبعيات الضرورية وإعداد أي متغيرات بيئية ضرورية.
بمجرد اكتمال التثبيت، يمكنك تدريب النموذج واستخدامه وفقًا لإرشادات الاستخدام المتوفرة في المستودع. يتضمن هذا عادةً إعداد مجموعة البيانات الخاصة بك وتكوين معلمات النموذج وتدريب النموذج ثم استخدام النموذج المدرب لإجراء الكشف عن الأجسام.

يرجى ملاحظة أن الخطوات المحددة قد تختلف وفقًا لحالة الاستخدام المحددة الخاصة بك والحالة الحالية لمستودع YOLOv4. لذلك، يوصى بشدة بالرجوع مباشرةً إلى الإرشادات المتوفرة في مستودع YOLOv4 GitHub.

نأسف لأي إزعاج قد يسببه هذا وسنسعى جاهدين لتحديث هذا المستند بأمثلة استخدام لـ Ultralytics بمجرد تنفيذ دعم YOLOv4.

الخلاصة

YOLOv4 هو نموذج قوي وفعال لاكتشاف الكائنات يحقق توازنًا بين السرعة والدقة. يتيح له استخدامه للميزات الفريدة وتقنيات حقيبة الأشياء المجانية أثناء التدريب الأداء بشكل ممتاز في مهام الكشف عن الكائنات في الوقت الفعلي. يمكن تدريب YOLOv4 واستخدامه من قبل أي شخص لديه وحدة معالجة رسومات تقليدية، مما يجعله في متناول الجميع وعمليًا لمجموعة واسعة من التطبيقات بما في ذلك أنظمة المراقبة و المركبات ذاتية القيادة و الأتمتة الصناعية.

بالنسبة لأولئك الذين يتطلعون إلى تنفيذ الكشف عن الكائنات في مشاريعهم، يظل YOLOv4 منافسًا قويًا، خاصةً عندما تكون الأولوية للأداء في الوقت الفعلي. بينما تركز Ultralytics حاليًا على دعم إصدارات YOLO الأحدث مثل YOLOv8 و YOLO11، فقد أثرت الابتكارات المعمارية التي تم تقديمها في YOLOv4 على تطوير هذه النماذج اللاحقة.

الاقتباسات والإقرارات

نود أن نعرب عن تقديرنا لمؤلفي YOLOv4 لمساهماتهم الكبيرة في مجال الكشف عن الأجسام في الوقت الفعلي:

BibTeX

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

يمكن العثور على ورقة YOLOv4 الأصلية على arXiv. لقد أتاح المؤلفون عملهم للجمهور، ويمكن الوصول إلى قاعدة التعليمات البرمجية على GitHub. نحن نقدر جهودهم في تطوير هذا المجال وإتاحة عملهم للمجتمع الأوسع.

الأسئلة الشائعة

ما هو YOLOv4 ولماذا يجب علي استخدامه في الكشف عن الأجسام؟

YOLOv4، التي تعني "You Only Look Once الإصدار 4"، هو نموذج حديث للكشف عن الأجسام في الوقت الفعلي تم تطويره بواسطة Alexey Bochkovskiy في عام 2020. إنه يحقق توازنًا مثاليًا بين السرعة و الدقة، مما يجعله مناسبًا للغاية للتطبيقات في الوقت الفعلي. يتضمن هيكل YOLOv4 العديد من الميزات المبتكرة مثل Weighted-Residual-Connections (WRC) و Cross-Stage-Partial-connections (CSP) و Self-adversarial-training (SAT)، من بين أمور أخرى، لتحقيق أحدث النتائج. إذا كنت تبحث عن نموذج عالي الأداء يعمل بكفاءة على وحدات معالجة الرسومات (GPUs) التقليدية، فإن YOLOv4 يعد خيارًا ممتازًا.

كيف تعمل هيكلية YOLOv4 على تحسين أدائها؟

تتضمن بنية YOLOv4 عدة مكونات رئيسية: العمود الفقري (backbone)، والرقبة (neck)، والرأس (head). العمود الفقري، الذي يمكن أن يكون نماذج مثل VGG أو ResNet أو CSPDarknet53، مدرب مسبقًا للتنبؤ بالفئات والمربعات المحيطة (bounding boxes). الرقبة، التي تستخدم PANet، تربط خرائط الميزات (feature maps) من مراحل مختلفة لاستخراج البيانات الشامل. أخيرًا، الرأس، الذي يستخدم تكوينات من YOLOv3، يقوم بعمليات detect الكائنات النهائية. تستخدم YOLOv4 أيضًا تقنيات "حقيبة الهدايا المجانية" (bag of freebies) مثل زيادة البيانات الفسيفسائية (mosaic data augmentation) وتنظيم DropBlock، مما يزيد من تحسين سرعتها ودقتها.

ما هي "حزمة الهدايا المجانية" في سياق YOLOv4؟

تشير "حقيبة المكافآت المجانية" إلى الأساليب التي تعمل على تحسين دقة التدريب لـ YOLOv4 دون زيادة تكلفة الاستدلال. تتضمن هذه التقنيات أشكالًا مختلفة من زيادة البيانات مثل التشوهات الضوئية (تعديل السطوع والتباين وما إلى ذلك) والتشوهات الهندسية (التحجيم والقص والقلب والتدوير). من خلال زيادة تقلب صور الإدخال، تساعد هذه الزيادات YOLOv4 على التعميم بشكل أفضل لأنواع مختلفة من الصور، وبالتالي تحسين متانتها ودقتها دون المساس بأدائها في الوقت الفعلي.

لماذا يعتبر YOLOv4 مناسبًا للكشف عن الأجسام في الوقت الفعلي على وحدات معالجة الرسومات (GPUs) التقليدية؟

تم تصميم YOLOv4 لتحسين كل من السرعة والدقة، مما يجعله مثاليًا لمهام الكشف عن الأجسام في الوقت الفعلي التي تتطلب أداءً سريعًا وموثوقًا. إنه يعمل بكفاءة على وحدات معالجة الرسومات (GPUs) التقليدية، ولا يحتاج إلا إلى واحدة لكل من التدريب والاستدلال. وهذا يجعله في متناول الجميع وعمليًا لمختلف التطبيقات التي تتراوح من أنظمة التوصية إلى إدارة العمليات المستقلة، وبالتالي يقلل الحاجة إلى إعدادات الأجهزة المكثفة ويجعله حلاً فعالاً من حيث التكلفة للكشف عن الأجسام في الوقت الفعلي.

كيف يمكنني البدء في استخدام YOLOv4 إذا كانت Ultralytics لا تدعمها حاليًا؟

للبدء في استخدام YOLOv4، يجب عليك زيارة مستودع YOLOv4 GitHub الرسمي. اتبع إرشادات التثبيت المتوفرة في ملف README، والتي تتضمن عادةً استنساخ المستودع وتثبيت التبعيات وإعداد متغيرات البيئة. بمجرد التثبيت، يمكنك تدريب النموذج عن طريق إعداد مجموعة البيانات الخاصة بك وتكوين معلمات النموذج واتباع إرشادات الاستخدام المتوفرة. نظرًا لأن Ultralytics لا تدعم YOLOv4 حاليًا، فمن المستحسن الرجوع مباشرةً إلى YOLOv4 GitHub للحصول على أحدث الإرشادات وأكثرها تفصيلاً.

📅 تم الإنشاء منذ سنتين ✏️ تم التحديث منذ شهر واحد