تخطي إلى المحتوى

دليل حول اختبار النموذج

مقدمة

بعد تدريب و تقييم النموذج الخاص بك، حان الوقت لاختباره. يتضمن اختبار النموذج تقييم مدى جودته في سيناريوهات العالم الحقيقي. يراعي الاختبار عوامل مثل الدقة والموثوقية والإنصاف ومدى سهولة فهم قرارات النموذج. الهدف هو التأكد من أن النموذج يعمل على النحو المنشود، ويقدم النتائج المتوقعة، ويتناسب مع الهدف العام لتطبيقك أو مشروعك.



شاهد: كيفية اختبار نماذج تعلم الآلة | تجنب تسرب البيانات في رؤية الكمبيوتر 🚀

يشبه اختبار النموذج إلى حد كبير تقييم النموذج، ولكنهما خطوتان متميزتان في مشروع رؤية الكمبيوتر. يتضمن تقييم النموذج مقاييس ومخططات لتقييم دقة النموذج. من ناحية أخرى، يتحقق اختبار النموذج مما إذا كان السلوك الذي تعلمه النموذج هو نفسه التوقعات. في هذا الدليل، سوف نستكشف استراتيجيات لاختبار نماذج رؤية الكمبيوتر الخاصة بك.

اختبار النموذج مقابل تقييم النموذج

أولاً، دعنا نفهم الفرق بين تقييم النموذج واختباره بمثال.

لنفترض أنك قمت بتدريب نموذج رؤية حاسوبية للتعرف على القطط والكلاب، وتريد نشر هذا النموذج في متجر للحيوانات الأليفة لمراقبة الحيوانات. خلال مرحلة تقييم النموذج، يمكنك استخدام مجموعة بيانات مصنفة لحساب المقاييس مثل الدقة، والإحكام، والاسترجاع، ودرجة F1. على سبيل المثال، قد يكون للنموذج دقة تبلغ 98٪ في التمييز بين القطط والكلاب في مجموعة بيانات معينة.

بعد التقييم، يمكنك اختبار النموذج باستخدام صور من متجر للحيوانات الأليفة لمعرفة مدى جودة تحديده للقطط والكلاب في ظروف أكثر تنوعًا وواقعية. يمكنك التحقق مما إذا كان بإمكانه تصنيف القطط والكلاب بشكل صحيح عندما تتحرك، أو في ظروف إضاءة مختلفة، أو يتم حجبها جزئيًا بواسطة أشياء مثل الألعاب أو الأثاث. يتحقق اختبار النموذج من أن النموذج يتصرف على النحو المتوقع خارج بيئة التقييم الخاضعة للرقابة.

التحضير لاختبار النموذج

تتعلم نماذج رؤية الكمبيوتر من مجموعات البيانات عن طريق اكتشاف الأنماط وإجراء التنبؤات وتقييم أدائها. عادةً ما يتم تقسيم مجموعات البيانات هذه إلى مجموعات تدريب واختبار لمحاكاة ظروف العالم الحقيقي. تعلم بيانات التدريب النموذج بينما تتحقق بيانات الاختبار من دقته.

فيما يلي نقطتان يجب وضعهما في الاعتبار قبل اختبار النموذج الخاص بك:

  • تمثيل واقعي: يجب أن تكون بيانات الاختبار التي لم يسبق رؤيتها مشابهة للبيانات التي سيتعين على النموذج التعامل معها عند نشرها. يساعد هذا في الحصول على فهم واقعي لقدرات النموذج.
  • حجم كافٍ: يجب أن يكون حجم مجموعة بيانات الاختبار كبيرًا بما يكفي لتوفير رؤى موثوقة حول مدى جودة أداء النموذج.

اختبار نموذج رؤية الكمبيوتر الخاص بك

فيما يلي الخطوات الرئيسية التي يجب اتخاذها لاختبار نموذج الرؤية الحاسوبية الخاص بك وفهم أدائه.

  • تشغيل التنبؤات: استخدم النموذج لعمل تنبؤات على مجموعة بيانات الاختبار.
  • مقارنة التنبؤات: تحقق من مدى تطابق تنبؤات النموذج مع التصنيفات الفعلية (الحقيقة الأساسية).
  • حساب مقاييس الأداء: حساب المقاييس مثل الدقة والاسترجاع والـ F1 score لفهم نقاط القوة والضعف في النموذج. يركز الاختبار على كيفية عكس هذه المقاييس للأداء الواقعي.
  • تصور النتائج: أنشئ وسائل مساعدة بصرية مثل مصفوفات الالتباس ومنحنيات ROC. يساعدك هذا في تحديد مناطق معينة قد لا يكون فيها أداء النموذج جيدًا في التطبيقات العملية.

بعد ذلك، يمكن تحليل نتائج الاختبار:

  • الصور المصنفة خطأ: تحديد ومراجعة الصور التي صنّفها النموذج بشكل خاطئ لفهم الأخطاء التي يقع فيها.
  • تحليل الأخطاء: قم بإجراء تحليل شامل للأخطاء لفهم أنواعها (مثل الإيجابيات الكاذبة مقابل السلبيات الكاذبة) وأسبابها المحتملة.
  • التحيز والإنصاف: تحقق من وجود أي تحيزات في تنبؤات النموذج. تأكد من أن النموذج يعمل بشكل جيد بنفس القدر عبر مجموعات فرعية مختلفة من البيانات، خاصة إذا كانت تتضمن سمات حساسة مثل العرق أو الجنس أو العمر.

اختبار نموذج YOLO11 الخاص بك

لاختبار نموذج YOLO11 الخاص بك، يمكنك استخدام وضع التحقق. إنها طريقة مباشرة لفهم نقاط قوة النموذج والمجالات التي تحتاج إلى تحسين. أيضًا، ستحتاج إلى تنسيق مجموعة بيانات الاختبار الخاصة بك بشكل صحيح لـ YOLO11. لمزيد من التفاصيل حول كيفية استخدام وضع التحقق، راجع صفحة وثائق التحقق من النموذج.

استخدام YOLO11 للتنبؤ على صور اختبار متعددة

إذا كنت ترغب في اختبار نموذج YOLO11 المدرب على صور متعددة مخزنة في مجلد، فيمكنك القيام بذلك بسهولة دفعة واحدة. بدلاً من استخدام وضع التحقق من الصحة، والذي يستخدم عادةً لتقييم أداء النموذج على مجموعة التحقق من الصحة وتقديم مقاييس مفصلة، قد ترغب فقط في رؤية التنبؤات على جميع الصور في مجموعة الاختبار الخاصة بك. لهذا، يمكنك استخدام وضع التنبؤ.

الفرق بين وضعي التحقق والتوقع

  • وضع التحقق (Validation Mode): يُستخدم لتقييم أداء النموذج من خلال مقارنة التنبؤات بالملصقات المعروفة (الحقيقة الأساسية). يوفر مقاييس تفصيلية مثل الدقة (accuracy) والإحكام (precision) والاسترجاع (recall) و F1 score.
  • وضع التنبؤ (Prediction Mode): يُستخدم لتشغيل النموذج على بيانات جديدة غير مرئية لإنشاء تنبؤات. لا يوفر مقاييس أداء تفصيلية ولكنه يسمح لك برؤية كيفية أداء النموذج على صور من العالم الحقيقي.

تشغيل تنبؤات YOLO11 بدون تدريب مخصص

إذا كنت مهتمًا باختبار نموذج YOLO11 الأساسي لفهم ما إذا كان يمكن استخدامه لتطبيقك دون تدريب مخصص، فيمكنك استخدام وضع التنبؤ. في حين أن النموذج مدرب مسبقًا على مجموعات البيانات مثل COCO، إلا أن تشغيل التنبؤات على مجموعة البيانات الخاصة بك يمكن أن يمنحك إحساسًا سريعًا بمدى جودة أدائه في سياقك المحدد.

التدريب المفرط و التحت تدريب في التعلم الآلي

عند اختبار نموذج تعلم الآلة، وخاصة في مجال رؤية الكمبيوتر، من المهم الانتباه إلى مشكلتيّ الإفراط في التخصيص والنقص في التخصيص. يمكن أن تؤثر هاتان المشكلتان بشكل كبير على مدى جودة عمل النموذج الخاص بك مع البيانات الجديدة.

التدريب المفرط

يحدث التدريب المفرط عندما يتعلم النموذج الخاص بك بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والتفاصيل التي لا يمكن تعميمها على بيانات جديدة. في رؤية الكمبيوتر، هذا يعني أن النموذج الخاص بك قد يبلي بلاءً حسناً مع صور التدريب ولكنه يواجه صعوبة مع الصور الجديدة.

علامات الإفراط في التوفيق

  • دقة تدريب عالية، دقة تحقق منخفضة: إذا كان أداء النموذج الخاص بك جيدًا جدًا في بيانات التدريب ولكنه ضعيف في بيانات التحقق أو الاختبار، فمن المحتمل أن يكون هناك تداخل.
  • الفحص البصري: في بعض الأحيان، يمكنك رؤية التحيز الزائد إذا كان النموذج الخاص بك حساسًا جدًا للتغيرات الطفيفة أو التفاصيل غير ذات الصلة في الصور.

نقص الموائمة

يحدث نقص الموائمة عندما لا يتمكن النموذج الخاص بك من التقاط الأنماط الأساسية في البيانات. في رؤية الكمبيوتر، قد لا يتمكن النموذج الذي يعاني من نقص الموائمة من التعرف على الكائنات بشكل صحيح في صور التدريب.

علامات النقص في التوفيق

  • انخفاض دقة التدريب: إذا لم يتمكن النموذج الخاص بك من تحقيق دقة عالية في مجموعة التدريب، فقد يكون غير مناسب.
  • التصنيف الخاطئ المرئي: يشير الفشل المستمر في التعرف على الميزات أو الكائنات الواضحة إلى نقص في التوفيق.

الموازنة بين فرط التخصيص ونقص التخصيص

يكمن الحل في إيجاد توازن بين فرط التخصيص والنقص في التخصيص. من الناحية المثالية، يجب أن يحقق النموذج أداءً جيدًا في كل من مجموعات بيانات التدريب والتحقق. يمكن أن تساعدك المراقبة المنتظمة لأداء النموذج الخاص بك من خلال المقاييس والفحوصات المرئية، جنبًا إلى جنب مع تطبيق الاستراتيجيات الصحيحة، في تحقيق أفضل النتائج.

نظرة عامة على التدريب المفرط والتحت تدريب

تسرب البيانات في رؤية الكمبيوتر وكيفية تجنبه

أثناء اختبار النموذج الخاص بك، هناك شيء مهم يجب وضعه في الاعتبار وهو تسرب البيانات. يحدث تسرب البيانات عندما يتم استخدام معلومات من خارج مجموعة بيانات التدريب عن طريق الخطأ لتدريب النموذج. قد يبدو النموذج دقيقًا للغاية أثناء التدريب، ولكنه لن يعمل بشكل جيد على بيانات جديدة وغير مرئية عند حدوث تسرب للبيانات.

لماذا يحدث تسرب البيانات؟

قد يكون من الصعب اكتشاف تسرب البيانات وغالبًا ما يأتي من التحيزات الخفية في بيانات التدريب. فيما يلي بعض الطرق الشائعة التي يمكن أن تحدث في رؤية الكمبيوتر:

  • تحيز الكاميرا: يمكن أن تدخل الزوايا والإضاءة والظلال وحركات الكاميرا المختلفة أنماطًا غير مرغوب فيها.
  • تحيز التراكب: يمكن أن تضلل الشعارات أو الطوابع الزمنية أو التراكبات الأخرى في الصور النموذج.
  • تحيز الخط والكائن: يمكن أن تؤدي خطوط أو كائنات معينة تظهر بشكل متكرر في فئات معينة إلى تحريف تعلم النموذج.
  • التحيز المكاني: يمكن أن تؤثر الاختلالات في توازن المقدمة والخلفية وتوزيعات الصناديق المحيطة ومواقع الكائنات على التدريب.
  • تحيز التصنيف والمجال: يمكن أن تؤدي التصنيفات غير الصحيحة أو التحولات في أنواع البيانات إلى تسرب.

الكشف عن تسرب البيانات

للعثور على تسرب البيانات، يمكنك:

  • التحقق من الأداء: إذا كانت نتائج النموذج جيدة بشكل مفاجئ، فقد يكون هناك تسرب.
  • النظر في أهمية الميزات: إذا كانت إحدى الميزات أكثر أهمية من غيرها، فقد يشير ذلك إلى وجود تسرب.
  • الفحص البصري: تحقق جيدًا من أن قرارات النموذج منطقية بشكل حدسي.
  • التحقق من فصل البيانات: تأكد من تقسيم البيانات بشكل صحيح قبل أي معالجة.

تجنب تسرب البيانات

لمنع تسرب البيانات، استخدم مجموعة بيانات متنوعة تحتوي على صور أو مقاطع فيديو من كاميرات وبيئات مختلفة. راجع بياناتك بعناية وتحقق من عدم وجود تحيزات خفية، مثل أخذ جميع العينات الإيجابية في وقت محدد من اليوم. سيساعد تجنب تسرب البيانات في جعل نماذج رؤية الكمبيوتر الخاصة بك أكثر موثوقية وفعالية في مواقف العالم الحقيقي.

ما الذي يأتي بعد اختبار النموذج؟

بعد اختبار النموذج الخاص بك، تعتمد الخطوات التالية على النتائج. إذا كان أداء النموذج الخاص بك جيدًا، فيمكنك نشره في بيئة واقعية. إذا كانت النتائج غير مرضية، فستحتاج إلى إجراء تحسينات. قد يتضمن ذلك تحليل الأخطاء، وجمع المزيد من البيانات، وتحسين جودة البيانات، وتعديل المعلمات الفائقة، وإعادة تدريب النموذج.

انضم إلى حوار الذكاء الاصطناعي

يمكن أن تساعد المشاركة في مجتمع من المتحمسين للرؤية الحاسوبية في حل المشكلات والتعلم بكفاءة أكبر. فيما يلي بعض الطرق للتواصل وطلب المساعدة ومشاركة أفكارك.

مصادر المجتمع

  • مشكلات GitHub: استكشف مستودع YOLO11 على GitHub واستخدم علامة التبويب "المشكلات" لطرح الأسئلة والإبلاغ عن الأخطاء واقتراح ميزات جديدة. المجتمع والقائمون على الصيانة نشطون للغاية ومستعدون للمساعدة.
  • خادم Ultralytics Discord: انضم إلى خادم Ultralytics Discord للدردشة مع المستخدمين والمطورين الآخرين، والحصول على الدعم، ومشاركة خبراتك.

الوثائق الرسمية

  • وثائق Ultralytics YOLO11: تحقق من وثائق YOLO11 الرسمية للحصول على أدلة مفصلة ونصائح مفيدة حول مشاريع رؤية الكمبيوتر المختلفة.

ستساعدك هذه الموارد على التغلب على التحديات والبقاء على اطلاع بأحدث الاتجاهات والممارسات داخل مجتمع رؤية الكمبيوتر.

باختصار

يعتمد بناء نماذج رؤية حاسوبية جديرة بالثقة على اختبار النماذج بدقة. من خلال اختبار النموذج ببيانات لم يسبق رؤيتها، يمكننا تحليله واكتشاف نقاط الضعف مثل التدريب الزائد وتسرب البيانات. تساعد معالجة هذه المشكلات قبل النشر على أداء النموذج بشكل جيد في التطبيقات الواقعية. من المهم أن تتذكر أن اختبار النموذج لا يقل أهمية عن تقييم النموذج في ضمان نجاح النموذج وفعاليته على المدى الطويل.

الأسئلة الشائعة

ما هي الاختلافات الرئيسية بين تقييم النموذج واختبار النموذج في رؤية الحاسوب؟

يُعد تقييم النموذج واختبار النموذج خطوتين متميزتين في مشروع رؤية الكمبيوتر. يتضمن تقييم النموذج استخدام مجموعة بيانات مُصنفة لحساب مقاييس مثل الدقة والاسترجاع والـ F1 score، مما يوفر رؤى حول أداء النموذج مع مجموعة بيانات مُراقبة. من ناحية أخرى، يقيّم اختبار النموذج أداء النموذج في سيناريوهات العالم الحقيقي من خلال تطبيقه على بيانات جديدة غير مرئية، مما يضمن توافق السلوك الذي تعلمه النموذج مع التوقعات خارج بيئة التقييم. للحصول على دليل مفصل، ارجع إلى الخطوات في مشروع رؤية الكمبيوتر.

كيف يمكنني اختبار نموذج Ultralytics YOLO11 الخاص بي على صور متعددة؟

لاختبار نموذج Ultralytics YOLO11 الخاص بك على صور متعددة، يمكنك استخدام وضع التنبؤ. يتيح لك هذا الوضع تشغيل النموذج على بيانات جديدة وغير مرئية لإنشاء تنبؤات دون تقديم مقاييس مفصلة. يعد هذا مثاليًا لاختبار الأداء في العالم الحقيقي على مجموعات صور أكبر مخزنة في مجلد. لتقييم مقاييس الأداء، استخدم وضع التحقق بدلاً من ذلك.

ماذا يجب أن أفعل إذا أظهر نموذج الرؤية الحاسوبية الخاص بي علامات الإفراط في التخصيص أو النقص فيه؟

لمعالجة التجاوز في التوفيق:

  • تقنيات التسوية مثل التسرب.
  • قم بزيادة حجم مجموعة بيانات التدريب.
  • تبسيط بنية النموذج.

لمعالجة النقص في التوفيق:

  • استخدم نموذجًا أكثر تعقيدًا.
  • توفير المزيد من الميزات ذات الصلة.
  • زيادة تكرارات التدريب أو الحقب.

راجع الصور المصنفة بشكل خاطئ، وقم بإجراء تحليل شامل للأخطاء، وتتبع مقاييس الأداء بانتظام للحفاظ على التوازن. لمزيد من المعلومات حول هذه المفاهيم، استكشف قسمنا حول المبالغة في التخصيص والنقص في التخصيص.

كيف يمكنني اكتشاف تسرب البيانات وتجنبه في رؤية الكمبيوتر؟

لاكتشاف تسرب البيانات:

  • تحقق من أن أداء الاختبار ليس مرتفعًا بشكل غير عادي.
  • تحقق من أهمية الميزات للحصول على رؤى غير متوقعة.
  • مراجعة قرارات النموذج بشكل حدسي.
  • تأكد من تقسيم البيانات بشكل صحيح قبل المعالجة.

لتجنب تسرب البيانات:

  • استخدم مجموعات بيانات متنوعة ببيئات مختلفة.
  • راجع البيانات بعناية بحثًا عن تحيزات خفية.
  • تأكد من عدم وجود معلومات متداخلة بين مجموعات التدريب والاختبار.

للحصول على استراتيجيات مفصلة حول منع تسرب البيانات، ارجع إلى قسمنا حول تسرب البيانات في رؤية الحاسوب.

ما الخطوات التي يجب علي اتخاذها بعد اختبار نموذج الرؤية الحاسوبية الخاص بي؟

بعد الاختبار، إذا كان أداء النموذج يفي بأهداف المشروع، فتابع النشر. إذا كانت النتائج غير مرضية، ففكر في:

  • تحليل الأخطاء.
  • جمع المزيد من البيانات المتنوعة وعالية الجودة.
  • ضبط المعلمات الفائقة.
  • إعادة تدريب النموذج.

اكتسب رؤى من قسم اختبار النموذج مقابل تقييم النموذج لتحسين وتعزيز فعالية النموذج في التطبيقات الواقعية.

كيف يمكنني تشغيل تنبؤات YOLO11 بدون تدريب مخصص؟

يمكنك تشغيل التوقعات باستخدام نموذج YOLO11 المدرب مسبقًا على مجموعة البيانات الخاصة بك لمعرفة ما إذا كان يناسب احتياجات التطبيق الخاص بك. استخدم وضع التوقع للحصول على إحساس سريع بنتائج الأداء دون الخوض في التدريب المخصص.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ 8 أشهر

تعليقات