مجموعة بيانات Caltech-101
مجموعة بيانات Caltech-101 هي مجموعة بيانات مستخدمة على نطاق واسع لمهام التعرف على الأجسام، وتحتوي على حوالي 9000 صورة من 101 فئة من فئات الأجسام. تم اختيار الفئات لتعكس مجموعة متنوعة من الأشياء في العالم الحقيقي، وتم اختيار الصور نفسها بعناية وشرحها لتوفير معيار صعب لخوارزميات التعرف على الأشياء.
الميزات الرئيسية
- تضم مجموعة بيانات Caltech-101 حوالي 9,000 صورة ملونة مقسمة إلى 101 فئة.
- تشمل الفئات مجموعة واسعة من الأشياء، بما في ذلك الحيوانات والمركبات والأدوات المنزلية والأشخاص.
- يتفاوت عدد الصور لكل فئة، حيث يتراوح عدد الصور في كل فئة بين 40 و800 صورة تقريباً.
- الصور متغيرة الأحجام، ومعظم الصور متوسطة الدقة.
- يُستخدم Caltech-101 على نطاق واسع في التدريب والاختبار في مجال التعلم الآلي، خاصةً في مهام التعرف على الأشياء.
هيكلية مجموعة البيانات
على عكس العديد من مجموعات البيانات الأخرى، لا يتم تقسيم مجموعة بيانات Caltech-101 رسميًا إلى مجموعتي تدريب واختبار. يقوم المستخدمون عادةً بإنشاء تقسيماتهم الخاصة بناءً على احتياجاتهم الخاصة. ومع ذلك، فإن الممارسة الشائعة هي استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال، 30 صورة لكل فئة) والصور المتبقية للاختبار.
التطبيقات
تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الأشياء، مثل الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs) وخوارزميات التعلم الآلي الأخرى المختلفة. إن تنوع فئاتها الواسعة وصورها عالية الجودة تجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.
الاستخدام
لتدريب نموذج YOLO على مجموعة بيانات Caltech-101 لـ 100 حقبة، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.
مثال على القطار
عينة من الصور والتعليقات التوضيحية
تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لأجسام مختلفة، مما يوفر مجموعة بيانات جيدة التنظيم لمهام التعرف على الأجسام. فيما يلي بعض الأمثلة لصور من مجموعة البيانات:
يعرض هذا المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101، مما يؤكد على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.
الاستشهادات والشكر والتقدير
إذا كنت تستخدم مجموعة بيانات Caltech-101 في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة التالية:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
نود أن نعرب عن تقديرنا لكل من لي فاي فاي وروب فيرغوس وبيترو بيرونا لإنشاء مجموعة بيانات Caltech-101 والحفاظ عليها كمصدر قيّم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. للمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات Caltech-101.
الأسئلة الشائعة
ما هي مجموعة بيانات Caltech-101 المستخدمة في التعلم الآلي؟
تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع في التعلّم الآلي لمهام التعرّف على الأجسام. وهي تحتوي على حوالي 9,000 صورة عبر 101 فئة، مما يوفر معياراً صعباً لتقييم خوارزميات التعرف على الأشياء. ويستفيد الباحثون منها لتدريب واختبار النماذج، خاصةً الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs)، في مجال الرؤية الحاسوبية.
كيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟
لتدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101، يمكنك استخدام مقتطفات التعليمات البرمجية المتوفرة. على سبيل المثال، للتدريب على 100 حقبة زمنية:
مثال على القطار
لمزيد من الحجج والخيارات التفصيلية، راجع صفحة تدريب النموذج.
ما هي السمات الرئيسية لمجموعة بيانات Caltech-101؟
تتضمن مجموعة بيانات Caltech-101 ما يلي:
- حوالي 9,000 صورة ملونة في 101 فئة.
- فئات تغطي مجموعة متنوعة من الأشياء، بما في ذلك الحيوانات والمركبات والأدوات المنزلية.
- عدد متغير من الصور لكل فئة، يتراوح عادةً بين 40 و800 صورة.
- أحجام الصور متغيرة، ومعظمها متوسطة الدقة.
هذه الميزات تجعله خيارًا ممتازًا لتدريب وتقييم نماذج التعرّف على الكائنات في التعلم الآلي والرؤية الحاسوبية.
لماذا يجب أن أستشهد بمجموعة بيانات Caltech-101 في بحثي؟
إن الاستشهاد بمجموعة بيانات Caltech-101 في بحثك هو اعتراف بمساهمات المبدعين وتوفير مرجع للآخرين الذين قد يستخدمون مجموعة البيانات. الاقتباس الموصى به هو:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
يساعد الاقتباس في الحفاظ على سلامة العمل الأكاديمي ويساعد الأقران في تحديد موقع المصدر الأصلي.
هل يمكنني استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101؟
نعم، يمكنك استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101. Ultralytics يوفر HUB منصة بديهية لإدارة مجموعات البيانات وتدريب النماذج ونشرها دون الحاجة إلى ترميز مكثف. للحصول على دليل تفصيلي، راجع منشور مدونة كيفية تدريب نماذجك المخصصة باستخدام Ultralytics HUB.