مجموعة بيانات معهد كاليفورنيا للتكنولوجيا -101
مجموعة بيانات Caltech-101 هي مجموعة بيانات مستخدمة على نطاق واسع لمهام التعرف على الكائنات ، وتحتوي على حوالي 9000 صورة من 101 فئة كائن. تم اختيار الفئات لتعكس مجموعة متنوعة من كائنات العالم الحقيقي ، وتم اختيار الصور نفسها بعناية وشرحها لتوفير معيار صعب لخوارزميات التعرف على الكائنات.
الميزات الرئيسية
- تضم مجموعة بيانات Caltech-101 حوالي 9000 صورة ملونة مقسمة إلى 101 فئة.
- تشمل الفئات مجموعة متنوعة من الأشياء ، بما في ذلك والمركبات والأدوات المنزلية والأشخاص.
- يختلف عدد الصور لكل فئة ، مع حوالي 40 إلى 800 صورة في كل فئة.
- الصور ذات أحجام متغيرة ، ومعظم الصور متوسطة الدقة.
- يستخدم Caltech-101 على نطاق واسع للتدريب والاختبار في مجال التعلم الآلي ، خاصة لمهام التعرف على الأشياء.
هيكل مجموعة البيانات
على عكس العديد من مجموعات البيانات الأخرى ، لا يتم تقسيم مجموعة بيانات Caltech-101 رسميا إلى مجموعات تدريب واختبار. عادة ما ينشئ المستخدمون تقسيماتهم الخاصة بناء على احتياجاتهم الخاصة. ومع ذلك ، فإن الممارسة الشائعة هي استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال ، 30 صورة لكل فئة) والصور المتبقية للاختبار.
التطبيقات
تستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات ، مثل الشبكات العصبية التلافيفية (CNNs) ، ودعم آلات المتجهات (SVMs) ، والعديد من خوارزميات التعلم الآلي الأخرى. مجموعة متنوعة من الفئات والصور عالية الجودة تجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.
استخدام
لتدريب أ YOLO نموذج على مجموعة بيانات Caltech-101 ل 100 حقبة ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .
مثال القطار
عينة من الصور والتعليقات التوضيحية
تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لكائنات مختلفة ، مما يوفر مجموعة بيانات جيدة التنظيم لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:
يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101 ، مع التركيز على أهمية مجموعة البيانات المتنوعة لتدريب نماذج التعرف على الكائنات القوية.
الاستشهادات والشكر
إذا كنت تستخدم مجموعة بيانات Caltech-101 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
نود أن نعرب عن تقديرنا ل Li Fei-Fei و Rob Fergus و Pietro Perona لإنشاء مجموعة بيانات Caltech-101 والحفاظ عليها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، تفضل بزيارة موقع ويب مجموعة بيانات Caltech-101.
الأسئلة المتداولة
ما هي مجموعة بيانات Caltech-101 المستخدمة في التعلم الآلي؟
تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع في التعلّم الآلي لمهام التعرّف على الأجسام. وهي تحتوي على حوالي 9,000 صورة عبر 101 فئة، مما يوفر معياراً صعباً لتقييم خوارزميات التعرف على الأشياء. ويستفيد الباحثون منها لتدريب واختبار النماذج، خاصةً الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs)، في مجال الرؤية الحاسوبية.
كيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟
لتدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101، يمكنك استخدام مقتطفات التعليمات البرمجية المتوفرة. على سبيل المثال، للتدريب على 100 حقبة زمنية:
مثال القطار
لمزيد من الحجج والخيارات التفصيلية، راجع صفحة تدريب النموذج.
ما هي السمات الرئيسية لمجموعة بيانات Caltech-101؟
The Caltech-101 dataset includes:
- Around 9,000 color images across 101 categories.
- Categories covering a diverse range of objects, including animals, vehicles, and household items.
- Variable number of images per category, typically between 40 and 800.
- Variable image sizes, with most being medium resolution.
هذه الميزات تجعله خيارًا ممتازًا لتدريب وتقييم نماذج التعرّف على الكائنات في التعلم الآلي والرؤية الحاسوبية.
لماذا يجب أن أستشهد بمجموعة بيانات Caltech-101 في بحثي؟
إن الاستشهاد بمجموعة بيانات Caltech-101 في بحثك هو اعتراف بمساهمات المبدعين وتوفير مرجع للآخرين الذين قد يستخدمون مجموعة البيانات. الاقتباس الموصى به هو:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
يساعد الاقتباس في الحفاظ على سلامة العمل الأكاديمي ويساعد الأقران في تحديد موقع المصدر الأصلي.
هل يمكنني استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101؟
نعم، يمكنك استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101. Ultralytics يوفر HUB منصة بديهية لإدارة مجموعات البيانات وتدريب النماذج ونشرها دون الحاجة إلى ترميز مكثف. للحصول على دليل تفصيلي، راجع منشور مدونة كيفية تدريب نماذجك المخصصة باستخدام Ultralytics HUB.