دليل حول اختبار النموذج

مقدمة

بعد التدريب والتقييم لنموذجك، حان الوقت لاختباره. يتضمن اختبار النموذج تقييم مدى جودة أدائه في سيناريوهات العالم الحقيقي. يأخذ الاختبار في الاعتبار عوامل مثل الدقة والموثوقية والإنصاف ومدى سهولة فهم قرارات النموذج. الهدف هو التأكد من أن النموذج يعمل كما هو مقصود، ويقدم النتائج المتوقعة، ويتناسب مع الهدف العام لتطبيقك أو مشروعك.



Watch: How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀

يشبه اختبار النموذج إلى حد كبير تقييم النموذج، لكنهما خطوتان متميزتان في مشروع الرؤية الحاسوبية. يتضمن تقييم النموذج مقاييس ورسوماً بيانية لتقييم دقة النموذج. من ناحية أخرى، يتحقق اختبار النموذج مما إذا كان سلوك النموذج المكتسب يطابق التوقعات. في هذا الدليل، سنستكشف استراتيجيات لاختبار نماذج الرؤية الحاسوبية الخاصة بك.

اختبار النموذج مقابل تقييم النموذج

أولاً، دعنا نفهم الفرق بين تقييم النموذج واختباره من خلال مثال.

افترض أنك قمت بتدريب نموذج رؤية حاسوبية للتعرف على القطط والكلاب، وتريد نشر هذا النموذج في متجر حيوانات أليفة لمراقبة الحيوانات. خلال مرحلة تقييم النموذج، تستخدم مجموعة بيانات مصنفة لحساب مقاييس مثل الدقة (Accuracy)، والدقة (Precision)، والاستدعاء (Recall)، ودرجة F1. على سبيل المثال، قد يحقق النموذج دقة بنسبة 98% في التمييز بين القطط والكلاب في مجموعة بيانات معينة.

بعد التقييم، تقوم باختبار النموذج باستخدام صور من متجر الحيوانات الأليفة لمعرفة مدى جودة تحديده للقطط والكلاب في ظروف أكثر تنوعاً وواقعية. تتحقق مما إذا كان بإمكانه تصنيف القطط والكلاب بشكل صحيح عندما تكون في حالة حركة، أو في ظروف إضاءة مختلفة، أو محجوبة جزئياً بأشياء مثل الألعاب أو الأثاث. يتحقق اختبار النموذج من أن النموذج يتصرف كما هو متوقع خارج بيئة التقييم الخاضعة للرقابة.

التحضير لاختبار النموذج

تتعلم نماذج الرؤية الحاسوبية من مجموعات البيانات عن طريق اكتشاف الأنماط وإجراء التنبؤات وتقييم أدائها. يتم تقسيم مجموعات البيانات هذه عادةً إلى مجموعات تدريب واختبار لمحاكاة ظروف العالم الحقيقي. تُعلم بيانات التدريب النموذج بينما تتحقق بيانات الاختبار من دقته.

إليك نقطتان يجب مراعاتهما قبل اختبار نموذجك:

  • تمثيل واقعي: يجب أن تكون بيانات الاختبار التي لم يسبق رؤيتها مشابهة للبيانات التي سيتعين على النموذج التعامل معها عند نشره. يساعد هذا في الحصول على فهم واقعي لقدرات النموذج.
  • حجم كافٍ: يجب أن يكون حجم مجموعة بيانات الاختبار كبيراً بما يكفي لتوفير رؤى موثوقة حول مدى جودة أداء النموذج.

اختبار نموذج الرؤية الحاسوبية الخاص بك

إليك الخطوات الرئيسية التي يجب اتخاذها لاختبار نموذج الرؤية الحاسوبية الخاص بك وفهم أدائه.

  • تشغيل التنبؤات: استخدم النموذج لإجراء تنبؤات على مجموعة بيانات الاختبار.
  • مقارنة التنبؤات: تحقق من مدى تطابق تنبؤات النموذج مع التسميات الفعلية (الحقيقة الأرضية).
  • حساب مقاييس الأداء: احسب مقاييس مثل الدقة (Accuracy)، والدقة (Precision)، والاستدعاء (Recall)، ودرجة F1 لفهم نقاط القوة والضعف في النموذج. يركز الاختبار على كيفية انعكاس هذه المقاييس على الأداء في العالم الحقيقي.
  • تصور النتائج: قم بإنشاء وسائل مساعدة مرئية مثل مصفوفات الارتباك ومنحنيات ROC. تساعدك هذه في تحديد مجالات معينة قد لا يؤدي فيها النموذج بشكل جيد في التطبيقات العملية.

بعد ذلك، يمكن تحليل نتائج الاختبار:

  • الصور المصنفة بشكل خاطئ: حدد وراجع الصور التي صنفها النموذج بشكل خاطئ لفهم أين يكمن الخطأ.
  • تحليل الخطأ: قم بإجراء تحليل شامل للأخطاء لفهم أنواع الأخطاء (مثل الإيجابيات الكاذبة مقابل السلبيات الكاذبة) وأسبابها المحتملة.
  • التحيز والإنصاف: تحقق من وجود أي تحيزات في تنبؤات النموذج. تأكد من أن النموذج يؤدي بشكل جيد بالتساوي عبر مجموعات فرعية مختلفة من البيانات، خاصة إذا كانت تتضمن سمات حساسة مثل العرق أو الجنس أو العمر.

اختبار نموذج YOLO26 الخاص بك

لاختبار نموذج YOLO26 الخاص بك، يمكنك استخدام وضع التحقق (validation mode). إنها طريقة مباشرة لفهم نقاط قوة النموذج والمجالات التي تحتاج إلى تحسين. أيضاً، ستحتاج إلى تنسيق مجموعة بيانات الاختبار الخاصة بك بشكل صحيح لـ YOLO26. لمزيد من التفاصيل حول كيفية استخدام وضع التحقق، راجع صفحة مستندات التحقق من صحة النموذج.

استخدام YOLO26 للتنبؤ على صور اختبار متعددة

إذا كنت ترغب في اختبار نموذج YOLO26 المدرب الخاص بك على صور متعددة مخزنة في مجلد، يمكنك القيام بذلك بسهولة دفعة واحدة. بدلاً من استخدام وضع التحقق، الذي يُستخدم عادةً لتقييم أداء النموذج على مجموعة تحقق وتوفير مقاييس مفصلة، قد ترغب فقط في رؤية تنبؤات على جميع الصور في مجموعة الاختبار الخاصة بك. لهذا، يمكنك استخدام وضع التنبؤ.

الفرق بين وضعي التحقق والتنبؤ

  • وضع التحقق: يُستخدم لتقييم أداء النموذج من خلال مقارنة التنبؤات بالتسميات المعروفة (الحقيقة الأرضية). يوفر مقاييس مفصلة مثل الدقة (Accuracy)، والدقة (Precision)، والاستدعاء (Recall)، ودرجة F1.
  • وضع التنبؤ: يُستخدم لتشغيل النموذج على بيانات جديدة غير مرئية لتوليد تنبؤات. لا يوفر مقاييس أداء مفصلة ولكنه يسمح لك برؤية كيف يؤدي النموذج على صور العالم الحقيقي.

تشغيل تنبؤات YOLO26 بدون تدريب مخصص

إذا كنت مهتماً باختبار نموذج YOLO26 الأساسي لفهم ما إذا كان يمكن استخدامه لتطبيقك بدون تدريب مخصص، يمكنك استخدام وضع التنبؤ. بينما يتم تدريب النموذج مسبقاً على مجموعات بيانات مثل COCO، فإن تشغيل التنبؤات على مجموعة البيانات الخاصة بك يمكن أن يمنحك شعوراً سريعاً بمدى جودة أدائه في سياقك الخاص.

فرط التخصيص (Overfitting) ونقص التخصيص (Underfitting) في تعلم الآلة

عند اختبار نموذج تعلم الآلة، خاصة في الرؤية الحاسوبية، من المهم الانتباه إلى فرط التخصيص ونقص التخصيص. يمكن أن تؤثر هذه المشكلات بشكل كبير على مدى جودة عمل نموذجك مع البيانات الجديدة.

فرط التخصيص (Overfitting)

يحدث فرط التخصيص عندما يتعلم نموذجك بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والتفاصيل التي لا تعمم على البيانات الجديدة. في الرؤية الحاسوبية، يعني هذا أن نموذجك قد يؤدي بشكل رائع مع صور التدريب ولكنه يواجه صعوبة مع الصور الجديدة.

علامات فرط التخصيص

  • دقة تدريب عالية، دقة تحقق منخفضة: إذا كان نموذجك يؤدي بشكل جيد جداً في بيانات التدريب ولكن بشكل سيئ في بيانات التحقق أو بيانات الاختبار، فمن المحتمل أنه يعاني من فرط التخصيص.
  • الفحص البصري: في بعض الأحيان، يمكنك رؤية فرط التخصيص إذا كان نموذجك حساساً جداً للتغيرات الطفيفة أو التفاصيل غير ذات الصلة في الصور.

نقص التخصيص (Underfitting)

يحدث نقص التخصيص عندما لا يتمكن نموذجك من التقاط الأنماط الأساسية في البيانات. في الرؤية الحاسوبية، قد لا يتعرف النموذج ناقص التخصيص حتى على الأشياء بشكل صحيح في صور التدريب.

علامات نقص التخصيص

  • دقة تدريب منخفضة: إذا لم يتمكن نموذجك من تحقيق دقة عالية في مجموعة التدريب، فقد يكون يعاني من نقص التخصيص.
  • تصنيف بصري خاطئ: الفشل المستمر في التعرف على الميزات أو الأشياء الواضحة يشير إلى نقص التخصيص.

موازنة فرط التخصيص ونقص التخصيص

المفتاح هو إيجاد توازن بين فرط التخصيص ونقص التخصيص. من الناحية المثالية، يجب أن يؤدي النموذج بشكل جيد على مجموعات بيانات التدريب والتحقق. يمكن أن تساعدك مراقبة أداء نموذجك بانتظام من خلال المقاييس والفحوصات البصرية، بالإضافة إلى تطبيق الاستراتيجيات الصحيحة، في تحقيق أفضل النتائج.

Overfitting vs underfitting visualization

تسرب البيانات في الرؤية الحاسوبية وكيفية تجنبه

أثناء اختبار نموذجك، هناك شيء مهم يجب وضعه في الاعتبار وهو تسرب البيانات. يحدث تسرب البيانات عندما يتم استخدام معلومات من خارج مجموعة بيانات التدريب لتدريب النموذج عن غير قصد. قد يبدو النموذج دقيقاً جداً أثناء التدريب، لكنه لن يؤدي بشكل جيد على البيانات الجديدة غير المرئية عند حدوث تسرب البيانات.

لماذا يحدث تسرب البيانات

يمكن أن يكون تسرب البيانات صعب الاكتشاف وغالباً ما يأتي من تحيزات خفية في بيانات التدريب. فيما يلي بعض الطرق الشائعة التي يمكن أن يحدث بها ذلك في الرؤية الحاسوبية:

  • تحيز الكاميرا: يمكن أن تؤدي الزوايا والإضاءة والظلال وحركات الكاميرا المختلفة إلى إدخال أنماط غير مرغوب فيها.
  • تحيز التراكب: يمكن للشعارات أو الطوابع الزمنية أو التراكبات الأخرى في الصور تضليل النموذج.
  • تحيز الخطوط والأشياء: يمكن لخطوط أو أشياء معينة تظهر بشكل متكرر في فئات معينة أن تؤدي إلى تحريف تعلم النموذج.
  • التحيز المكاني: يمكن أن تؤثر الاختلالات في المقدمة والخلفية، وتوزيعات صندوق الإحاطة، ومواقع الأشياء على التدريب.
  • تحيز التسميات والمجال: يمكن أن تؤدي التسميات غير الصحيحة أو التحولات في أنواع البيانات إلى تسرب.

اكتشاف تسرب البيانات

للعثور على تسرب البيانات، يمكنك:

  • التحقق من الأداء: إذا كانت نتائج النموذج جيدة بشكل مدهش، فقد يكون هناك تسرب.
  • النظر في أهمية الميزات: إذا كانت إحدى الميزات أكثر أهمية بكثير من غيرها، فقد يشير ذلك إلى تسرب.
  • الفحص البصري: تحقق مرة أخرى من أن قرارات النموذج منطقية بديهياً.
  • التحقق من فصل البيانات: تأكد من تقسيم البيانات بشكل صحيح قبل أي معالجة.

تجنب تسرب البيانات

لتجنب تسرب البيانات، استخدم مجموعة بيانات متنوعة مع صور أو فيديوهات من كاميرات وبيئات مختلفة. راجع بياناتك بعناية وتحقق من عدم وجود تحيزات خفية، مثل أن تكون جميع العينات الإيجابية قد تم التقاطها في وقت محدد من اليوم. سيساعد تجنب تسرب البيانات في جعل نماذج الرؤية الحاسوبية الخاصة بك أكثر موثوقية وفعالية في مواقف العالم الحقيقي.

ما الذي يأتي بعد اختبار النموذج

بعد اختبار نموذجك، تعتمد الخطوات التالية على النتائج. إذا كان أداء نموذجك جيداً، يمكنك نشره في بيئة العالم الحقيقي. إذا لم تكن النتائج مرضية، فستحتاج إلى إجراء تحسينات. قد يتضمن ذلك تحليل الأخطاء، وجمع المزيد من البيانات، وتحسين جودة البيانات، وضبط المعلمات الفائقة، وإعادة تدريب النموذج.

انضم إلى محادثة الذكاء الاصطناعي

يمكن أن يساعدك أن تصبح جزءاً من مجتمع عشاق الرؤية الحاسوبية في حل المشكلات والتعلم بكفاءة أكبر. إليك بعض الطرق للتواصل وطلب المساعدة ومشاركة أفكارك.

موارد المجتمع

  • مشكلات GitHub: استكشف مستودع YOLO26 على GitHub واستخدم علامة التبويب Issues لطرح الأسئلة والإبلاغ عن الأخطاء واقتراح ميزات جديدة. المجتمع والقائمون على الصيانة نشطون جداً ومستعدون للمساعدة.
  • خادم Ultralytics Discord: انضم إلى خادم Ultralytics Discord للدردشة مع المستخدمين والمطورين الآخرين، والحصول على الدعم، ومشاركة تجاربك.

التوثيق الرسمي

  • مستندات Ultralytics YOLO26: تحقق من مستندات YOLO26 الرسمية للحصول على أدلة مفصلة ونصائح مفيدة حول مشاريع الرؤية الحاسوبية المختلفة.

ستساعدك هذه الموارد في التغلب على التحديات والبقاء على اطلاع بأحدث الاتجاهات والممارسات داخل مجتمع الرؤية الحاسوبية.

باختصار

يعتمد بناء نماذج رؤية حاسوبية جديرة بالثقة على اختبار النموذج الصارم. من خلال اختبار النموذج ببيانات لم يسبق رؤيتها، يمكننا تحليله واكتشاف نقاط الضعف مثل فرط التخصيص وتسرب البيانات. يساعد معالجة هذه المشكلات قبل النشر النموذج على الأداء الجيد في تطبيقات العالم الحقيقي. من المهم أن تتذكر أن اختبار النموذج لا يقل أهمية عن تقييم النموذج في ضمان نجاح النموذج وفعاليته على المدى الطويل.

الأسئلة الشائعة

ما هي الاختلافات الرئيسية بين تقييم النموذج واختبار النموذج في الرؤية الحاسوبية؟

يعد تقييم النموذج واختبار النموذج خطوتين متميزتين في مشروع الرؤية الحاسوبية. يتضمن تقييم النموذج استخدام مجموعة بيانات مصنفة لحساب مقاييس مثل الدقة، والدقة (Precision)، والاستدعاء (Recall)، ودرجة F1، مما يوفر رؤى حول أداء النموذج مع مجموعة بيانات خاضعة للرقابة. من ناحية أخرى، يقيم اختبار النموذج أداء النموذج في سيناريوهات العالم الحقيقي من خلال تطبيقه على بيانات جديدة غير مرئية، مما يضمن توافق السلوك المكتسب للنموذج مع التوقعات خارج بيئة التقييم. للحصول على دليل مفصل، راجع خطوات مشروع الرؤية الحاسوبية.

كيف يمكنني اختبار نموذج Ultralytics YOLO26 الخاص بي على صور متعددة؟

لاختبار نموذج Ultralytics YOLO26 الخاص بك على صور متعددة، يمكنك استخدام وضع التنبؤ. يسمح لك هذا الوضع بتشغيل النموذج على بيانات جديدة غير مرئية لتوليد تنبؤات دون توفير مقاييس مفصلة. هذا مثالي لاختبار الأداء في العالم الحقيقي على مجموعات صور أكبر مخزنة في مجلد. لتقييم مقاييس الأداء، استخدم وضع التحقق بدلاً من ذلك.

ما الذي يجب علي فعله إذا كان نموذج الرؤية الحاسوبية الخاص بي يظهر علامات فرط التخصيص أو نقص التخصيص؟

لمعالجة فرط التخصيص:

  • تقنيات التنظيم مثل الإسقاط (dropout).
  • زيادة حجم مجموعة بيانات التدريب.
  • تبسيط بنية النموذج.

لمعالجة نقص التخصيص:

  • استخدم نموذجاً أكثر تعقيداً.
  • قدم ميزات أكثر صلة.
  • زيادة تكرارات التدريب أو العصور.

راجع الصور المصنفة بشكل خاطئ، وقم بإجراء تحليل شامل للأخطاء، وتتبع مقاييس الأداء بانتظام للحفاظ على التوازن. لمزيد من المعلومات حول هذه المفاهيم، استكشف قسمنا حول فرط التخصيص ونقص التخصيص.

كيف يمكنني اكتشاف تسرب البيانات وتجنبه في الرؤية الحاسوبية؟

لاكتشاف تسرب البيانات:

  • تحقق من أن أداء الاختبار ليس مرتفعاً بشكل غير عادي.
  • تحقق من أهمية الميزات للحصول على رؤى غير متوقعة.
  • راجع قرارات النموذج بشكل حدسي.
  • تأكد من التقسيم الصحيح للبيانات قبل المعالجة.

لتجنب تسرب البيانات:

  • استخدم مجموعات بيانات متنوعة مع بيئات مختلفة.
  • راجع البيانات بعناية بحثاً عن تحيزات خفية.
  • تأكد من عدم وجود معلومات متداخلة بين مجموعات التدريب والاختبار.

للحصول على استراتيجيات مفصلة حول منع تسرب البيانات، راجع قسمنا حول تسرب البيانات في الرؤية الحاسوبية.

ما هي الخطوات التي يجب علي اتخاذها بعد اختبار نموذج الرؤية الحاسوبية الخاص بي؟

بعد الاختبار، إذا كان أداء النموذج يلبي أهداف المشروع، فتابع عملية النشر. إذا لم تكن النتائج مرضية، فكر في:

اكتسب رؤى من قسم اختبار النموذج مقابل تقييم النموذج لتحسين وتطوير فعالية النموذج في التطبيقات الواقعية.

كيف يمكنني تشغيل تنبؤات YOLO26 بدون تدريب مخصص؟

يمكنك تشغيل التنبؤات باستخدام نموذج YOLO26 المُدرب مسبقاً على مجموعة بياناتك لمعرفة ما إذا كان يلبي احتياجات تطبيقك. استخدم وضع التنبؤ للحصول على تصور سريع لنتائج الأداء دون الخوض في التدريب المخصص.

التعليقات