دليل حول اختبار النماذج
مقدمة
بعد تدريب النموذج وتقييمه، حان الوقت لاختباره. يتضمن اختبار النموذج تقييم مدى جودة أدائه في سيناريوهات العالم الحقيقي. يراعي الاختبار عوامل مثل الدقة والموثوقية والإنصاف ومدى سهولة فهم قرارات النموذج. الهدف هو التأكد من أن النموذج يعمل على النحو المنشود، ويحقق النتائج المتوقعة، ويتناسب مع الهدف العام لتطبيقك أو مشروعك.
شاهد: How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀
اختبار النموذج مشابه تمامًا لتقييم النموذج، لكنهما خطوتان مختلفتان في مشروع الرؤية الحاسوبية. يتضمن تقييم النموذج مقاييس ومخططات لتقييم دقة النموذج. من ناحية أخرى، يتحقق اختبار النموذج مما إذا كان سلوك النموذج المكتسب مطابقًا للتوقعات. سنستكشف في هذا الدليل استراتيجيات اختبار نماذج الرؤية الحاس وبية الخاصة بك.
اختبار النموذج مقابل تقييم النموذج تقييم النموذج
أولاً، دعنا نفهم الفرق بين تقييم النموذج واختباره بمثال.
لنفترض أنك قمت بتدريب نموذج رؤية حاسوبية للتعرف على القطط والكلاب، وتريد نشر هذا النموذج في متجر للحيوانات الأليفة لمراقبة الحيوانات. أثناء مرحلة تقييم النموذج، تستخدم مجموعة بيانات موسومة لحساب مقاييس مثل الدقة والدقة والاستدعاء ودرجة F1. على سبيل المثال، قد تبلغ دقة النموذج 98% في التمييز بين القطط والكلاب في مجموعة بيانات معينة.
بعد التقييم، تقوم باختبار النموذج باستخدام صور من متجر للحيوانات الأليفة لمعرفة مدى قدرته على تمييز القطط والكلاب في ظروف أكثر تنوعاً وواقعية. يمكنك التحقق مما إذا كان بإمكانه تصنيف القطط والكلاب بشكل صحيح عندما تتحرك، أو في ظروف إضاءة مختلفة، أو عندما تكون محجوبة جزئياً بأشياء مثل الألعاب أو الأثاث. يتحقق اختبار النموذج من أن النموذج يتصرف كما هو متوقع خارج بيئة التقييم المضبوطة.
التحضير لاختبار النموذج
تتعلم نماذج الرؤية الحاسوبية من مجموعات البيانات من خلال اكتشاف الأنماط وإجراء التنبؤات وتقييم أدائها. تنقسم مجموعات البيانات هذه عادةً إلى مجموعات تدريب واختبار لمحاكاة ظروف العالم الحقيقي. تقوم بيانات التدريب بتعليم النموذج بينما تقوم بيانات الاختبار بالتحقق من دقته.
فيما يلي نقطتان يجب وضعها في الاعتبار قبل اختبار النموذج الخاص بك:
- التمثيل الواقعي: يجب أن تكون بيانات الاختبار غير المرئية سابقًا مشابهة للبيانات التي سيتعين على النموذج التعامل معها عند نشره. يساعد ذلك في الحصول على فهم واقعي لقدرات النموذج.
- الحجم الكافي: يجب أن يكون حجم مجموعة بيانات الاختبار كبيرًا بما يكفي لتوفير رؤى موثوقة حول مدى جودة أداء النموذج.
اختبار نموذج رؤية الكمبيوتر الخاص بك
فيما يلي الخطوات الأساسية التي يجب اتخاذها لاختبار نموذج رؤية الكمبيوتر وفهم أدائه.
- تشغيل التنبؤات: استخدم النموذج لعمل تنبؤات على مجموعة بيانات الاختبار.
- مقارنة التنبؤات: تحقق من مدى تطابق تنبؤات النموذج مع التسميات الفعلية (الحقيقة الأساسية).
- احسب مقاييس الأداء: احسب مقاييس مثل الدقة والدقة والاستدعاء ودرجة F1 لفهم نقاط القوة والضعف في النموذج. يركز الاختبار على كيف تعكس هذه المقاييس الأداء في العالم الحقيقي.
- تصور النتائج: قم بإنشاء وسائل مرئية مثل مصفوفات الارتباك ومنحنيات ROC. تساعدك هذه على اكتشاف مناطق محددة قد لا يكون أداء النموذج فيها جيداً في التطبيقات العملية.
بعد ذلك، يمكن تحليل نتائج الاختبار:
- الصور التي أسيء تصنيفها: تحديد الصور التي أخطأ النموذج في تصنيفها ومراجعتها لفهم أين يخطئ في تصنيفها.
- تحليل الأخطاء: قم بإجراء تحليل شامل للأخطاء لفهم أنواع الأخطاء (على سبيل المثال، الإيجابيات الكاذبة مقابل السلبيات الكاذبة) وأسبابها المحتملة.
- التحيز والإنصاف: تحقق من وجود أي تحيزات في تنبؤات النموذج. تأكد من أن النموذج يعمل بشكل متساوٍ عبر مجموعات فرعية مختلفة من البيانات، خاصةً إذا كان يتضمن سمات حساسة مثل العرق أو الجنس أو العمر.
اختبار نموذج YOLO11 الخاص بك
لاختبار نموذج YOLO11 الخاص بك، يمكنك استخدام وضع التحقق من الصحة. إنها طريقة مباشرة لفهم نقاط قوة النموذج والمجالات التي تحتاج إلى تحسين. ستحتاج أيضًا إلى تنسيق مجموعة بيانات الاختبار الخاصة بك بشكل صحيح YOLO11. لمزيد من التفاصيل حول كيفية استخدام وضع التحقق من الصحة، راجع صفحة مستندات التحقق من صحة النموذج.
استخدام YOLO11 للتنبؤ على صور اختبارية متعددة
إذا كنت ترغب في اختبار نموذج YOLO11 المدرّب الخاص بك على صور متعددة مخزنة في مجلد، يمكنك القيام بذلك بسهولة دفعة واحدة. بدلاً من استخدام وضع التحقق من الصحة، والذي يُستخدم عادةً لتقييم أداء النموذج على مجموعة التحقق من الصحة وتوفير مقاييس مفصلة، قد ترغب فقط في رؤية التنبؤات على جميع الصور في مجموعة الاختبار الخاصة بك. لهذا، يمكنك استخدام وضع التنبؤ.
الفرق بين وضعي التحقق من الصحة والتنبؤ
- وضع التحقق من الصحة: يُستخدم لتقييم أداء النموذج من خلال مقارنة التنبؤات بالتسميات المعروفة (الحقيقة الأساسية). يوفر مقاييس مفصلة مثل الدقة والدقة والاستدعاء ودرجة F1.
- وضع التنبؤ: يُستخدم لتشغيل النموذج على بيانات جديدة غير مرئية لإنشاء تنبؤات. لا يوفر مقاييس أداء مفصلة ولكنه يسمح لك برؤية كيفية أداء النموذج على صور حقيقية.
تشغيل YOLO11 تنبؤات بدون تدريب مخصص
إذا كنت مهتمًا باختبار نموذج YOLO11 الأساسي لفهم ما إذا كان يمكن استخدامه لتطبيقك دون تدريب مخصص، يمكنك استخدام وضع التنبؤ. في حين أن النموذج مدرب مسبقًا على مجموعات بيانات مثل COCO، فإن تشغيل التنبؤات على مجموعة البيانات الخاصة بك يمكن أن يمنحك إحساسًا سريعًا بمدى جودة أدائه في سياقك المحدد.
الإفراط في الملاءمة والتقصير في التعلم الآلي
عند اختبار نموذج التعلّم الآلي، خاصةً في مجال الرؤية الحاسوبية، من المهم الانتباه إلى الإفراط في التكييف والتقصير في التكييف. يمكن أن تؤثر هذه المشكلات بشكل كبير على مدى جودة عمل نموذجك مع البيانات الجديدة.
الإفراط في التركيب
يحدث الإفراط في التهيئة عندما يتعلم النموذج الخاص بك بيانات التدريب بشكل جيد للغاية، بما في ذلك الضوضاء والتفاصيل التي لا تعمم على البيانات الجديدة. في الرؤية الحاسوبية، هذا يعني أن نموذجك قد يؤدي بشكل جيد مع صور التدريب ولكنه قد يعاني مع الصور الجديدة.
علامات الإفراط في الملاءمة
- دقة تدريب عالية، ودقة تحقق منخفضة: إذا كان أداء نموذجك جيدًا جدًا على بيانات التدريب ولكن أداءه ضعيف على بيانات التحقق أو بيانات الاختبار، فمن المحتمل أن يكون هذا النموذج مفرطًا في التهيئة.
- الفحص البصري: في بعض الأحيان، يمكنك أن ترى الإفراط في الملاءمة إذا كان نموذجك حساسًا جدًا للتغييرات الطفيفة أو التفاصيل غير ذات الصلة في الصور.
غير ملائمة
يحدث عدم الملاءمة عندما لا يستطيع النموذج الخاص بك التقاط الأنماط الأساسية في البيانات. في الرؤية الحاسوبية، قد لا يتعرف النموذج غير الملائم على الأشياء بشكل صحيح في صور التدريب.
علامات عدم الملاءمة
- دقة التدريب المنخفضة: إذا لم يتمكن نموذجك من تحقيق دقة عالية في مجموعة التدريب، فقد يكون غير ملائم بشكل كافٍ.
- Visual Mis-classification: Consistent failure to recognize obvious features or objects suggests underfitting.
تحقيق التوازن بين الإفراط في الملاءمة والتقصير في الملاءمة
يكمن المفتاح في إيجاد توازن بين الإفراط في الملاءمة والتقصير في الملاءمة. من الناحية المثالية، يجب أن يكون أداء النموذج جيدًا على كلٍ من مجموعتي بيانات التدريب والتحقق من الصحة. يمكن أن تساعدك مراقبة أداء نموذجك بانتظام من خلال المقاييس وعمليات الفحص البصري، إلى جانب تطبيق الاستراتيجيات الصحيحة، على تحقيق أفضل النتائج.
تسرب البيانات في الرؤية الحاسوبية وكيفية تجنبها
أثناء اختبار نموذجك، هناك شيء مهم يجب أخذه في الاعتبار وهو تسرب البيانات. يحدث تسرّب البيانات عندما يتم استخدام معلومات من خارج مجموعة بيانات التدريب عن طريق الخطأ لتدريب النموذج. قد يبدو النموذج دقيقًا للغاية أثناء التدريب، لكنه لن يؤدي بشكل جيد على البيانات الجديدة غير المرئية عند حدوث تسرب البيانات.
لماذا يحدث تسرب البيانات
قد يكون من الصعب اكتشاف تسرب البيانات وغالبًا ما يأتي من التحيزات الخفية في بيانات التدريب. فيما يلي بعض الطرق الشائعة التي يمكن أن تحدث في الرؤية الحاسوبية:
- انحياز الكاميرا: يمكن أن يؤدي اختلاف الزوايا والإضاءة والظلال وحركات الكاميرا إلى ظهور أنماط غير مرغوب فيها.
- تحيز التراكب: يمكن أن تؤدي الشعارات أو الطوابع الزمنية أو التراكبات الأخرى في الصور إلى تضليل النموذج.
- انحياز الخط والكائن: يمكن أن تؤدي الخطوط أو الكائنات المحددة التي تظهر بشكل متكرر في فئات معينة إلى تشويه تعلم النموذج.
- التحيز المكاني: يمكن أن تؤثر الاختلالات في الخلفية الأمامية والخلفية وتوزيعات المربع المحيط ومواقع الكائنات على التدريب.
- التسمية والتحيز في المجال: يمكن أن تؤدي التسميات غير الصحيحة أو التحولات في أنواع البيانات إلى التسرب.
الكشف عن تسرب البيانات
للعثور على تسرب البيانات، يمكنك
- تحقق من الأداء: إذا كانت نتائج النموذج جيدة بشكل مدهش، فقد يكون هناك تسريب.
- انظر إلى أهمية الميزة: إذا كانت إحدى الميزات أكثر أهمية من غيرها، فقد يشير ذلك إلى وجود تسرب.
- الفحص البصري: تحقق مرة أخرى من أن قرارات النموذج منطقية بشكل بديهي.
- تحقق من فصل البيانات: تأكد من تقسيم البيانات بشكل صحيح قبل أي معالجة.
تجنب تسرب البيانات
لمنع تسرب البيانات، استخدم مجموعة بيانات متنوعة تحتوي على صور أو مقاطع فيديو من كاميرات وبيئات مختلفة. قم بمراجعة بياناتك بعناية وتحقق من عدم وجود تحيزات خفية، مثل التقاط جميع العينات الإيجابية في وقت محدد من اليوم. سيساعد تجنب تسرب البيانات في جعل نماذج الرؤية الحاسوبية الخاصة بك أكثر موثوقية وفعالية في مواقف العالم الحقيقي.
ما يأتي بعد اختبار النموذج
بعد اختبار نموذجك، تعتمد الخطوات التالية على النتائج. إذا كان أداء نموذجك جيداً، يمكنك نشره في بيئة واقعية. إذا لم تكن النتائج مُرضية، ستحتاج إلى إجراء تحسينات. قد يتضمن ذلك تحليل الأخطاء، وجمع المزيد من البيانات، وتحسين جودة البيانات، وتعديل المعلمات الفائقة، وإعادة تدريب النموذج.
انضم إلى محادثة الذكاء الاصطناعي
أن تصبح جزءًا من مجتمع من المتحمسين للرؤية الحاسوبية يمكن أن يساعدك في حل المشاكل والتعلم بكفاءة أكبر. إليك بعض الطرق للتواصل وطلب المساعدة ومشاركة أفكارك.
موارد المجتمع
- مشكلات GitHub: استكشف مستودعYOLO11 GitHub واستخدم علامة تبويب المشكلات لطرح الأسئلة والإبلاغ عن الأخطاء واقتراح ميزات جديدة. المجتمع والمشرفون نشيطون للغاية ومستعدون للمساعدة.
- Ultralytics خادم ديسكورد: انضم إلى خادمUltralytics Discord للدردشة مع المستخدمين والمطورين الآخرين والحصول على الدعم ومشاركة تجاربك.
الوثائق الرسمية
- Ultralytics YOLO11 التوثيق: اطلع على وثائق YOLO11 الرسمية للحصول على أدلة مفصلة ونصائح مفيدة حول مشاريع الرؤية الحاسوبية المختلفة.
ستساعدك هذه الموارد في التغلب على التحديات والبقاء على اطلاع على أحدث الاتجاهات والممارسات في مجتمع الرؤية الحاسوبية.
الخلاصة
يعتمد بناء نماذج جديرة بالثقة للرؤية الحاسوبية على اختبار صارم للنموذج. فمن خلال اختبار النموذج ببيانات لم يتم الاطلاع عليها من قبل، يمكننا تحليلها واكتشاف نقاط الضعف مثل الإفراط في التركيب وتسريب البيانات. تساعد معالجة هذه المشكلات قبل النشر في مساعدة النموذج على الأداء الجيد في تطبيقات العالم الحقيقي. من المهم أن نتذكر أن اختبار النموذج لا يقل أهمية عن تقييم النموذج في ضمان نجاح النموذج وفعاليته على المدى الطويل.
الأسئلة الشائعة
ما هي الاختلافات الرئيسية بين تقييم النموذج واختبار النموذج في الرؤية الحاسوبية؟
تقييم النموذج واختبار النموذج هما خطوتان مختلفتان في مشروع الرؤية الحاسوبية. يتضمن تقييم النموذج استخدام مجموعة بيانات موسومة لحساب مقاييس مثل الدقة والدقة والاستدعاء ودرجة F1، مما يوفر نظرة ثاقبة لأداء النموذج مع مجموعة بيانات مضبوطة. من ناحية أخرى، يقيّم اختبار النموذج أداء النموذج في سيناريوهات العالم الحقيقي من خلال تطبيقه على بيانات جديدة غير مرئية، مما يضمن توافق سلوك النموذج المكتسب مع التوقعات خارج بيئة التقييم. للحصول على دليل مفصل، راجع خطوات مشروع الرؤية الحاسوبية.
كيف يمكنني اختبار نموذجي Ultralytics YOLO11 على صور متعددة؟
لاختبار نموذج Ultralytics YOLO11 الخاص بك على صور متعددة، يمكنك استخدام وضع التنبؤ. يسمح لك هذا الوضع بتشغيل النموذج على بيانات جديدة غير مرئية لإنشاء تنبؤات دون توفير مقاييس مفصلة. هذا الوضع مثالي لاختبار الأداء في العالم الحقيقي على مجموعات صور أكبر مخزنة في مجلد. لتقييم مقاييس الأداء، استخدم وضع التحقق من الصحة بدلاً من ذلك.
ماذا يجب أن أفعل إذا أظهر نموذج الرؤية الحاسوبية الخاص بي علامات على الإفراط أو النقص في الملاءمة؟
لمعالجة الإفراط في الملاءمة:
- تقنيات التنظيم مثل التسرب.
- زيادة حجم مجموعة بيانات التدريب.
- تبسيط بنية النموذج.
لمعالجة النقص في الملاءمة:
- استخدم نموذجاً أكثر تعقيداً.
- توفير المزيد من الميزات ذات الصلة.
- زيادة تكرارات التدريب أو الحلقات التدريبية.
راجع الصور التي أسيء تصنيفها، وقم بإجراء تحليل شامل للأخطاء، وتتبع مقاييس الأداء بانتظام للحفاظ على التوازن. للمزيد من المعلومات حول هذه المفاهيم، استكشف القسم الخاص بنا حول الإفراط في التصنيف ونقصه.
كيف يمكنني اكتشاف وتجنب تسرب البيانات في الرؤية الحاسوبية؟
للكشف عن تسرب البيانات:
- تحقق من أن أداء الاختبار ليس مرتفعًا بشكل غير عادي.
- تحقق من أهمية الميزة للحصول على رؤى غير متوقعة.
- مراجعة قرارات النموذج بشكل حدسي.
- تأكد من تقسيم البيانات بشكل صحيح قبل المعالجة.
لتجنب تسرب البيانات:
- استخدام مجموعات بيانات متنوعة مع بيئات مختلفة.
- مراجعة البيانات بعناية بحثاً عن التحيزات الخفية.
- تأكد من عدم تداخل المعلومات بين مجموعتي التدريب والاختبار.
للحصول على استراتيجيات مفصلة حول منع تسرب البيانات، راجع القسم الخاص بنا حول تسرب البيانات في الرؤية الحاسوبية.
ما الخطوات التي يجب أن أتخذها بعد اختبار نموذج رؤية الكمبيوتر الخاص بي؟
بعد الاختبار، إذا كان أداء النموذج يفي بأهداف المشروع، فابدأ في النشر. أما إذا كانت النتائج غير مرضية، فينبغي النظر في:
- تحليل الأخطاء.
- جمع بيانات أكثر تنوعاً وعالية الجودة.
- ضبط البارامتر الفائق.
- إعادة تدريب النموذج.
احصل على رؤى من قسم اختبار النموذج مقابل تقييم النموذج. قسم تقييم النموذج لتحسين وتعزيز فعالية النموذج في التطبيقات الواقعية.
كيف يمكنني تشغيل تنبؤات YOLO11 بدون تدريب مخصص؟
يمكنك تشغيل التنبؤات باستخدام نموذج YOLO11 المدرب مسبقًا على مجموعة البيانات الخاصة بك لمعرفة ما إذا كان يناسب احتياجات تطبيقك. استخدم وضع التنبؤ للحصول على فكرة سريعة عن نتائج الأداء دون الغوص في تدريب مخصص.