انتقل إلى المحتوى

مجموعة بيانات معهد كاليفورنيا للتكنولوجيا -101

مجموعة بيانات Caltech-101 هي مجموعة بيانات مستخدمة على نطاق واسع لمهام التعرف على الكائنات ، وتحتوي على حوالي 9000 صورة من 101 فئة كائن. تم اختيار الفئات لتعكس مجموعة متنوعة من كائنات العالم الحقيقي ، وتم اختيار الصور نفسها بعناية وشرحها لتوفير معيار صعب لخوارزميات التعرف على الكائنات.

الميزات الرئيسية

  • تضم مجموعة بيانات Caltech-101 حوالي 9000 صورة ملونة مقسمة إلى 101 فئة.
  • تشمل الفئات مجموعة متنوعة من الأشياء ، بما في ذلك والمركبات والأدوات المنزلية والأشخاص.
  • يختلف عدد الصور لكل فئة ، مع حوالي 40 إلى 800 صورة في كل فئة.
  • الصور ذات أحجام متغيرة ، ومعظم الصور متوسطة الدقة.
  • يستخدم Caltech-101 على نطاق واسع للتدريب والاختبار في مجال التعلم الآلي ، خاصة لمهام التعرف على الأشياء.

هيكل مجموعة البيانات

على عكس العديد من مجموعات البيانات الأخرى ، لا يتم تقسيم مجموعة بيانات Caltech-101 رسميا إلى مجموعات تدريب واختبار. عادة ما ينشئ المستخدمون تقسيماتهم الخاصة بناء على احتياجاتهم الخاصة. ومع ذلك ، فإن الممارسة الشائعة هي استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال ، 30 صورة لكل فئة) والصور المتبقية للاختبار.

التطبيقات

تستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات ، مثل الشبكات العصبية التلافيفية (CNNs) ، ودعم آلات المتجهات (SVMs) ، والعديد من خوارزميات التعلم الآلي الأخرى. مجموعة متنوعة من الفئات والصور عالية الجودة تجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.

استخدام

لتدريب أ YOLO نموذج على مجموعة بيانات Caltech-101 ل 100 حقبة ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لكائنات مختلفة ، مما يوفر مجموعة بيانات جيدة التنظيم لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101 ، مع التركيز على أهمية مجموعة البيانات المتنوعة لتدريب نماذج التعرف على الكائنات القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات Caltech-101 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

نود أن نعرب عن تقديرنا ل Li Fei-Fei و Rob Fergus و Pietro Perona لإنشاء مجموعة بيانات Caltech-101 والحفاظ عليها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، تفضل بزيارة موقع ويب مجموعة بيانات Caltech-101.

الأسئلة المتداولة

ما هي مجموعة بيانات Caltech-101 المستخدمة في التعلم الآلي؟

تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع في التعلّم الآلي لمهام التعرّف على الأجسام. وهي تحتوي على حوالي 9,000 صورة عبر 101 فئة، مما يوفر معياراً صعباً لتقييم خوارزميات التعرف على الأشياء. ويستفيد الباحثون منها لتدريب واختبار النماذج، خاصةً الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs)، في مجال الرؤية الحاسوبية.

كيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟

لتدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101، يمكنك استخدام مقتطفات التعليمات البرمجية المتوفرة. على سبيل المثال، للتدريب على 100 حقبة زمنية:

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

لمزيد من الحجج والخيارات التفصيلية، راجع صفحة تدريب النموذج.

ما هي السمات الرئيسية لمجموعة بيانات Caltech-101؟

تتضمن مجموعة بيانات Caltech-101: - حوالي 9,000 صورة ملونة عبر 101 فئة. - فئات تغطي مجموعة متنوعة من الأشياء، بما في ذلك الحيوانات والمركبات والأدوات المنزلية. - عدد متغير من الصور لكل فئة، يتراوح عادةً بين 40 و800 صورة. - أحجام متفاوتة للصور، مع كون معظمها متوسط الدقة.

هذه الميزات تجعله خيارًا ممتازًا لتدريب وتقييم نماذج التعرّف على الكائنات في التعلم الآلي والرؤية الحاسوبية.

لماذا يجب أن أستشهد بمجموعة بيانات Caltech-101 في بحثي؟

إن الاستشهاد بمجموعة بيانات Caltech-101 في بحثك هو اعتراف بمساهمات المبدعين وتوفير مرجع للآخرين الذين قد يستخدمون مجموعة البيانات. الاقتباس الموصى به هو:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

يساعد الاقتباس في الحفاظ على سلامة العمل الأكاديمي ويساعد الأقران في تحديد موقع المصدر الأصلي.

هل يمكنني استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101؟

نعم، يمكنك استخدام Ultralytics HUB لتدريب النماذج على مجموعة بيانات Caltech-101. Ultralytics يوفر HUB منصة بديهية لإدارة مجموعات البيانات وتدريب النماذج ونشرها دون الحاجة إلى ترميز مكثف. للحصول على دليل تفصيلي، راجع منشور مدونة كيفية تدريب نماذجك المخصصة باستخدام Ultralytics HUB.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-04-2024
المؤلفون: جلين-جوتشر (6)

التعليقات