Meet YOLO26: next-gen vision AI.

Link to this sectionكيفية اختبار نماذج الرؤية الحاسوبية#

Link to this sectionمقدمة#

يتحقق اختبار النموذج من كيفية أداء نموذج مُدرَّب على بيانات واقعية غير مرئية من قبل - مثل الكائنات المتحركة، أو ضعيفة الإضاءة، أو المخفية جزئيًا، بدلاً من الاعتماد على معيار مرجعي محدد. بينما يقيس تقييم النموذج المقاييس على مجموعة بيانات مصنفة، يتحقق الاختبار من أن السلوك الذي تعلمه النموذج يطابق أهداف تطبيقك قبل النشر. يغطي هذا الدليل إعداد بيانات الاختبار، واختبار نماذج YOLO26 من Ultralytics، ورصد الفرط في التخصيص (overfitting)، ونقص التخصيص (underfitting)، وتسرب البيانات.



Watch: How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀

Link to this sectionاختبار النموذج مقابل تقييم النموذج#

يعد اختبار النموذج وتقييم النموذج خطوتين متميزتين في مشروع الرؤية الحاسوبية. يقيس التقييم الأداء باستخدام مقاييس على مجموعة بيانات مصنفة؛ بينما يتحقق الاختبار مما إذا كان السلوك الذي تعلمه النموذج يثبت كفاءته في ظروف تشبه بيئة النشر.

لنفترض أنك قمت بتدريب نموذج رؤية حاسوبية للتعرف على القطط والكلاب، وتريد نشر هذا النموذج في متجر حيوانات أليفة لمراقبة الحيوانات. خلال مرحلة تقييم النموذج، تستخدم مجموعة بيانات مصنفة لحساب مقاييس مثل الدقة، والإحكام، والاستدعاء. على سبيل المثال، قد يكون النموذج دقيقًا بنسبة 98% في التمييز بين القطط والكلاب في مجموعة بيانات معينة.

بعد التقييم، تقوم باختبار النموذج باستخدام صور من متجر الحيوانات الأليفة لمعرفة مدى نجاحه في تحديد القطط والكلاب في ظروف أكثر تنوعًا وواقعية. تتحقق مما إذا كان بإمكانه تصنيف القطط والكلاب بشكل صحيح عندما تكون في حالة حركة، أو في ظروف إضاءة مختلفة، أو محجوبة جزئيًا بواسطة أشياء مثل الألعاب أو الأثاث. يتحقق اختبار النموذج من أن النموذج يتصرف كما هو متوقع خارج بيئة التقييم الخاضعة للرقابة.

Link to this sectionالاستعداد لاختبار النموذج#

عادةً ما يتم تقسيم مجموعات بيانات الرؤية الحاسوبية إلى مجموعات تدريب واختبار لمحاكاة ظروف العالم الحقيقي: تعلم بيانات التدريب النموذج، بينما تتحقق بيانات الاختبار من سلوكه على أمثلة لم يسبق له رؤيتها. تعمل منصة Ultralytics على إبقاء تنظيم مجموعات البيانات والتعليقات التوضيحية في مكان واحد، مما يساعد عند بناء مجموعة اختبار مصنفة.

قبل الاختبار
  • تمثيل واقعي: يجب أن تكون بيانات الاختبار غير المرئية مشابهة للبيانات التي سيتعامل معها النموذج عند نشره. وهذا يعطي صورة واقعية عن قدرات النموذج.
  • حجم كافٍ: يجب أن تكون مجموعة بيانات الاختبار كبيرة بما يكفي لتقديم رؤى موثوقة حول مدى جودة أداء النموذج.

Link to this sectionكيفية اختبار نموذج YOLO26#

يتضمن اختبار نموذج YOLO26 المُدرَّب مساري عمل متكاملين: التحقق من صحة النموذج على تقسيم اختبار مُصنَّف للحصول على مقاييس كمية، والتنبؤ على صور جديدة لفحص السلوك نوعيًا.

Link to this sectionالتحقق من الصحة على تقسيم اختبار مُصنَّف#

يقارن وضع التحقق تنبؤات النموذج مقابل تسميات الحقيقة الأرضية (ground-truth) ويقدم تقارير عن الإحكام، والاستدعاء، وmAP50، وmAP50-95 لنماذج الكشف. كما أنه يحفظ وسائل مساعدة مرئية مثل مصفوفة الارتباك ومنحنى الإحكام-الاستدعاء، والتي تساعدك على تحديد المجالات المحددة التي قد لا يعمل فيها النموذج بشكل جيد.

الاستخدام
from ultralytics import YOLO

# Load a pretrained model or your own trained checkpoint, e.g. "path/to/best.pt"
model = YOLO("yolo26n.pt")

# Validate; add split="test" if your dataset YAML defines a test split
metrics = model.val(data="coco8.yaml")
print(metrics.box.map)  # mAP50-95

افتراضيًا، يعمل التحقق على تقسيم val في مجموعة البيانات. لقياس الأداء على مجموعة اختبار محجوزة، حدد تقسيم test: في ملف YAML الخاص بمجموعة البيانات ومرر split="test".

Link to this sectionالتنبؤ على صور جديدة#

يقوم وضع التنبؤ بتشغيل النموذج على بيانات جديدة غير مرئية دون الحاجة إلى تسميات. لا ينتج هذا الوضع مقاييس أداء، ولكن حفظ المخرجات المشروحة يتيح لك مراجعة كيفية تصرف النموذج على صور العالم الحقيقي - على سبيل المثال، مجلد كامل من صور الاختبار دفعة واحدة.

الاستخدام
from ultralytics import YOLO

# Load a pretrained model or your own trained checkpoint, e.g. "path/to/best.pt"
model = YOLO("yolo26n.pt")

# Run predictions on a folder of test images and save annotated results
results = model.predict(source="path/to/test_images", save=True)
اختبار نموذج مُدرَّب مسبقًا قبل التدريب المخصص

للتحقق مما إذا كان YOLO26 يناسب تطبيقك قبل الاستثمار في التدريب المخصص، قم بتشغيل وضع التنبؤ بنقطة فحص مُدرَّبة مسبقًا على صورك الخاصة. يتم تدريب النماذج مسبقًا على مجموعات بيانات مثل COCO، لذا تعطي النتائج شعورًا سريعًا بمدى جودة أداء النموذج في سياقك المحدد.

Link to this sectionوضع التحقق مقابل وضع التنبؤ#

النمطالغرضيتطلب تسمياتالمخرجات
التحقققياس الأداء مقابل الحقيقة الأرضيةنعمالإحكام، الاستدعاء، mAP50، mAP50-95، مصفوفة الارتباك، منحنيات PR
التنبؤفحص سلوك النموذج على بيانات جديدة غير مصنفةلاصور مشروحة ونتائج تنبؤ، بدون مقاييس

Link to this sectionكيفية تحليل نتائج الاختبار#

بمجرد الحصول على التنبؤات والمقاييس، تعمق في معرفة أين ولماذا يفشل النموذج:

  • الصور المصنفة بشكل خاطئ: حدد وراجع الصور التي صنفها النموذج بشكل خاطئ لفهم أين يكمن الخطأ.
  • تحليل الخطأ: قم بإجراء تحليل شامل للأخطاء لفهم أنواع الأخطاء (مثل الإيجابيات الكاذبة مقابل السلبيات الكاذبة) وأسبابها المحتملة.
  • التحيز والعدالة: تحقق من وجود أي تحيزات في تنبؤات النموذج. تأكد من أن النموذج يعمل بشكل جيد بالتساوي عبر المجموعات الفرعية المختلفة للبيانات، خاصة إذا كانت تتضمن سمات حساسة مثل العرق أو الجنس أو العمر.

Link to this sectionالفرط في التخصيص ونقص التخصيص في التعلم الآلي#

عند اختبار نموذج تعلم آلي، خاصة في الرؤية الحاسوبية، من المهم مراقبة الفرط في التخصيص (overfitting) ونقص التخصيص (underfitting). يمكن أن تؤثر هذه المشكلات بشكل كبير على مدى نجاح عمل نموذجك مع البيانات الجديدة.

المشكلةعلامات شائعةكيفية معالجتها
الفرط في التخصيص (Overfitting)دقة تدريب عالية ولكن دقة تحقق منخفضة؛ حساسية مفرطة للتغيرات الطفيفة أو التفاصيل غير ذات الصلة في الصورطبّق التنظيم مثل dropout، وزد من حجم مجموعة بيانات التدريب، وقم بتبسيط بنية النموذج
نقص التخصيص (Underfitting)دقة منخفضة حتى في مجموعة التدريب؛ فشل مستمر في التعرف على الميزات أو الكائنات الواضحةاستخدم نموذجًا أكثر تعقيدًا، وقدم ميزات أكثر صلة، وزد من دورات (epochs) التدريب

المفتاح هو إيجاد توازن بحيث يعمل النموذج بشكل جيد على مجموعتي بيانات التدريب والتحقق. تساعد مراقبة المقاييس بانتظام وفحص التنبؤات بصريًا أثناء الاختبار في اكتشاف الانحراف نحو أي من الطرفين.

Comparison of underfitting, appropriate fitting, and overfitting on the same dataset

Link to this sectionتسرب البيانات في الرؤية الحاسوبية وكيفية تجنبه#

يحدث تسرب البيانات عندما يتم استخدام معلومات من خارج مجموعة بيانات التدريب لتدريب النموذج عن طريق الخطأ. قد يبدو النموذج دقيقًا جدًا أثناء التدريب، لكنه لن يعمل بشكل جيد على بيانات جديدة غير مرئية عند حدوث تسرب للبيانات.

قد يكون من الصعب اكتشاف التسرب وغالبًا ما يأتي من تحيزات مخفية في بيانات التدريب:

نوع التحيزكيف يبدو
تحيز الكاميراتُدخل الزوايا والإضاءة والظلال وحركات الكاميرا المختلفة أنماطًا غير مرغوب فيها
تحيز التراكب (Overlay)الشعارات، أو الطوابع الزمنية، أو التراكبات الأخرى في الصور تضلل النموذج
تحيز الخط والكائنالخطوط أو الكائنات المحددة التي تظهر بشكل متكرر في فئات معينة تحرف تعلم النموذج
تحيز مكانيتؤثر الاختلالات في المقدمة-الخلفية، وتوزيعات صندوق الإحاطة، ومواقع الكائنات على التدريب
تحيز التسمية والمجالتؤدي التسميات غير الصحيحة أو التحولات في أنواع البيانات إلى حدوث تسرب

Link to this sectionكيفية اكتشاف وتجنب تسرب البيانات#

للعثور على تسرب البيانات، تحقق مما إذا كانت نتائج النموذج جيدة بشكل مدهش، وانظر ما إذا كانت ميزة واحدة أكثر أهمية من غيرها، وتأكد مرتين من أن قرارات النموذج منطقية بحدس، وتحقق من تقسيم البيانات بشكل صحيح قبل أي معالجة.

ولمنعه، استخدم مجموعة بيانات متنوعة تحتوي على صور أو مقاطع فيديو من كاميرات وبيئات مختلفة، وراجع بياناتك بعناية بحثًا عن تحيزات مخفية - مثل أن تكون جميع العينات الإيجابية قد تم التقاطها في وقت محدد من اليوم. يؤدي تجنب تسرب البيانات إلى جعل نماذج الرؤية الحاسوبية الخاصة بك أكثر موثوقية في مواقف العالم الحقيقي.

Link to this sectionماذا بعد اختبار النموذج؟#

بعد اختبار نموذجك، تعتمد الخطوات التالية على النتائج. إذا كان أداء نموذجك جيدًا، يمكنك نشره في بيئة حقيقية. إذا لم تكن النتائج مرضية، فستحتاج إلى إجراء تحسينات. قد يتضمن ذلك تحليل الأخطاء، أو جمع المزيد من البيانات، أو تحسين جودة البيانات، أو ضبط المعاملات الفائقة، أو إعادة تدريب النموذج.

Link to this sectionالخلاصة#

إن اختبار النموذج الدقيق - التحقق من الصحة على تقسيم اختبار محجوز، والتنبؤ على صور العالم الحقيقي، والتحقق من الفرط في التخصيص وتسرب البيانات - هو ما يحول النموذج الذي تم تقييمه جيدًا إلى نموذج يمكن الاعتماد عليه. عالج المشكلات التي يكشف عنها الاختبار قبل النشر، ومن المرجح أن يعمل نموذجك كما هو مقصود في الإنتاج. إذا ظهرت أسئلة على طول الطريق، فاسأل المجتمع في مستودع Ultralytics على GitHub أو على خادم Discord الخاص بـ Ultralytics.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي الاختلافات الرئيسية بين تقييم النموذج واختبار النموذج في الرؤية الحاسوبية؟#

يقيس تقييم النموذج الأداء باستخدام مقاييس على مجموعة بيانات مصنفة، بينما يتحقق اختبار النموذج من كيفية تصرف النموذج على بيانات جديدة غير مرئية تشبه ظروف النشر. ينتج التقييم أرقامًا مثل الإحكام وmAP من مجموعة بيانات خاضعة للرقابة؛ بينما يكشف الاختبار عما إذا كان السلوك الذي تعلمه النموذج يثبت كفاءته في ظل ظروف متنوعة من الإضاءة أو الحركة أو الانسداد. انظر اختبار النموذج مقابل تقييم النموذج لمثال عملي.

Link to this sectionكيف يمكنني اختبار نموذج YOLO26 الخاص بي على صور متعددة؟#

استخدم وضع التنبؤ ومرر مسار مجلد كـ source - يعمل YOLO26 على كل صورة في المجلد ويمكنه حفظ النتائج المشروحة للمراجعة. لا يقوم وضع التنبؤ بحساب المقاييس؛ لقياس الأداء على مجموعة مصنفة، استخدم وضع التحقق بدلاً من ذلك. يتم عرض كلا مساري العمل في كيفية اختبار نموذج YOLO26.

Link to this sectionما هي المقاييس التي يبلغ عنها التحقق من YOLO26 على مجموعة اختبار؟#

بالنسبة لنماذج الكشف، يبلغ التحقق عن الإحكام، والاستدعاء، وmAP50، وmAP50-95، ويحفظ مخططات تتضمن مصفوفة الارتباك ومنحنى الإحكام-الاستدعاء. للتحقق من الصحة على تقسيم اختبار مخصص بدلاً من تقسيم val الافتراضي، حدد test: في ملف YAML الخاص بمجموعة البيانات ومرر split="test". راجع دليل مقاييس الأداء لمعرفة كيفية تفسير كل مقياس.

Link to this sectionماذا يجب أن أفعل إذا أظهر نموذج الرؤية الحاسوبية الخاص بي علامات الفرط في التخصيص أو نقص التخصيص؟#

بالنسبة للفرط في التخصيص، طبّق تقنيات تنظيم مثل dropout، أو زد من حجم مجموعة بيانات التدريب، أو بسّط بنية النموذج. بالنسبة لنقص التخصيص، استخدم نموذجًا أكثر تعقيدًا، أو قدم ميزات أكثر صلة، أو تدرب لدورات أكثر. تم تلخيص علامات كل مشكلة والإصلاحات المقابلة لها في الفرط في التخصيص ونقص التخصيص في التعلم الآلي.

Link to this sectionكيف يمكنني اكتشاف وتجنب تسرب البيانات في الرؤية الحاسوبية؟#

اشتبه في تسرب البيانات عندما يبدو أداء الاختبار جيدًا بشكل مدهش، أو تهيمن ميزة واحدة على التنبؤات، أو لا تبدو قرارات النموذج منطقية بحدس. امنع ذلك باستخدام مجموعات بيانات متنوعة من كاميرات وبيئات مختلفة، ومراجعة البيانات بحثًا عن تحيزات مخفية، والتحقق من أن تقسيم التدريب/الاختبار قد حدث قبل أي معالجة. راجع تسرب البيانات في الرؤية الحاسوبية لمعرفة أنواع التحيز الشائعة.

Link to this sectionما الخطوات التي يجب أن أتخذها بعد اختبار نموذج الرؤية الحاسوبية الخاص بي؟#

إذا كانت النتائج تلبي أهداف مشروعك، فقم بنشر النموذج؛ وإذا لم تكن كذلك، فقم بتحسينه قبل النشر. قد يعني ذلك تحليل الأخطاء، أو جمع المزيد من البيانات المتنوعة، أو تحسين جودة البيانات، أو ضبط المعاملات الفائقة، أو إعادة التدريب. كرر الاختبار بعد كل جولة من التغييرات للتأكد من أن الإصلاحات قد نجحت.

التعليقات