انتقل إلى المحتوى

مجموعة بيانات معهد كاليفورنيا للتكنولوجيا -101

مجموعة بيانات Caltech-101 هي مجموعة بيانات مستخدمة على نطاق واسع لمهام التعرف على الكائنات ، وتحتوي على حوالي 9000 صورة من 101 فئة كائن. تم اختيار الفئات لتعكس مجموعة متنوعة من كائنات العالم الحقيقي ، وتم اختيار الصور نفسها بعناية وشرحها لتوفير معيار صعب لخوارزميات التعرف على الكائنات.

الميزات الرئيسية

  • تضم مجموعة بيانات Caltech-101 حوالي 9000 صورة ملونة مقسمة إلى 101 فئة.
  • تشمل الفئات مجموعة متنوعة من الأشياء ، بما في ذلك والمركبات والأدوات المنزلية والأشخاص.
  • يختلف عدد الصور لكل فئة ، مع حوالي 40 إلى 800 صورة في كل فئة.
  • الصور ذات أحجام متغيرة ، ومعظم الصور متوسطة الدقة.
  • يستخدم Caltech-101 على نطاق واسع للتدريب والاختبار في مجال التعلم الآلي ، خاصة لمهام التعرف على الأشياء.

هيكل مجموعة البيانات

على عكس العديد من مجموعات البيانات الأخرى ، لا يتم تقسيم مجموعة بيانات Caltech-101 رسميا إلى مجموعات تدريب واختبار. عادة ما ينشئ المستخدمون تقسيماتهم الخاصة بناء على احتياجاتهم الخاصة. ومع ذلك ، فإن الممارسة الشائعة هي استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال ، 30 صورة لكل فئة) والصور المتبقية للاختبار.

التطبيقات

تستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات ، مثل الشبكات العصبية التلافيفية (CNNs) ، ودعم آلات المتجهات (SVMs) ، والعديد من خوارزميات التعلم الآلي الأخرى. مجموعة متنوعة من الفئات والصور عالية الجودة تجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.

استخدام

لتدريب أ YOLO نموذج على مجموعة بيانات Caltech-101 ل 100 حقبة ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لكائنات مختلفة ، مما يوفر مجموعة بيانات جيدة التنظيم لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101 ، مع التركيز على أهمية مجموعة البيانات المتنوعة لتدريب نماذج التعرف على الكائنات القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات Caltech-101 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

نود أن نعرب عن تقديرنا ل Li Fei-Fei و Rob Fergus و Pietro Perona لإنشاء مجموعة بيانات Caltech-101 والحفاظ عليها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، تفضل بزيارة موقع ويب مجموعة بيانات Caltech-101.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

التعليقات