مجموعة بيانات Caltech-101

تعد مجموعة بيانات Caltech-101 مجموعة بيانات واسعة الاستخدام لمهام التعرف على الكائنات، حيث تحتوي على حوالي 9,000 صورة موزعة على 101 فئة من الكائنات. تم اختيار الفئات لتعكس مجموعة متنوعة من الكائنات في العالم الحقيقي، كما تم اختيار الصور وتصنيفها بعناية لتوفير معيار مرجعي صعب لخوارزميات التعرف على الكائنات.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics Platform
التقسيم التلقائي للبيانات

لا تأتي مجموعة بيانات Caltech-101، كما هي مقدمة، بتقسيمات محددة مسبقًا للتدريب/التحقق. ومع ذلك، عند استخدام أوامر التدريب المقدمة في أمثلة الاستخدام أدناه، سيقوم إطار عمل Ultralytics بتقسيم مجموعة البيانات تلقائيًا نيابةً عنك. التقسيم الافتراضي المستخدم هو 80% لمجموعة التدريب و 20% لمجموعة التحقق.

الميزات الرئيسية

  • تتكون مجموعة بيانات Caltech-101 من حوالي 9,000 صورة ملونة مقسمة إلى 101 فئة.
  • تشمل الفئات مجموعة واسعة من الكائنات، بما في ذلك الحيوانات، والمركبات، والأدوات المنزلية، والأشخاص.
  • يختلف عدد الصور لكل فئة، حيث يتراوح بين حوالي 40 إلى 800 صورة في كل فئة.
  • تأتي الصور بأحجام متفاوتة، ومعظمها بدقة متوسطة.
  • تُستخدم Caltech-101 على نطاق واسع للتدريب والاختبار في مجال تعلم الآلة، وخاصة لمهام التعرف على الكائنات.

هيكل مجموعة البيانات

على عكس العديد من مجموعات البيانات الأخرى، لا يتم تقسيم مجموعة بيانات Caltech-101 رسميًا إلى مجموعات تدريب واختبار. يقوم المستخدمون عادةً بإنشاء تقسيماتهم الخاصة بناءً على احتياجاتهم المحددة. ومع ذلك، من الممارسات الشائعة استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال، 30 صورة لكل فئة) واستخدام الصور المتبقية للاختبار.

التطبيقات

تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات، مثل الشبكات العصبية التلافيفية (CNNs)، وآلات ناقلات الدعم (SVMs)، وغيرها من خوارزميات تعلم الآلة المختلفة. تنوع فئاتها الكبير وصورها عالية الجودة يجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال تعلم الآلة والرؤية الحاسوبية.

الاستخدام

لتدريب نموذج YOLO على مجموعة بيانات Caltech-101 لمدة 100 حقبة، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

صور وعينات تعليقات توضيحية

تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لكائنات متنوعة، مما يوفر مجموعة بيانات منظمة بشكل جيد لمهام تصنيف الصور. فيما يلي بعض الأمثلة للصور من مجموعة البيانات:

عينات من مجموعة بيانات تصنيف الصور Caltech-101

يُظهر المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101، مما يؤكد على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات Caltech-101 في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

نود أن نعرب عن تقديرنا لـ Li Fei-Fei و Rob Fergus و Pietro Perona لإنشاء وصيانة مجموعة بيانات Caltech-101 كمورد قيم لمجتمع أبحاث تعلم الآلة والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، تفضل بزيارة موقع مجموعة بيانات Caltech-101.

الأسئلة الشائعة

فيم تُستخدم مجموعة بيانات Caltech-101 في تعلم الآلة؟

تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع في تعلم الآلة لمهام التعرف على الكائنات. وهي تحتوي على حوالي 9,000 صورة موزعة على 101 فئة، مما يوفر معيارًا مرجعيًا صعبًا لتقييم خوارزميات التعرف على الكائنات. يستفيد الباحثون منها لتدريب واختبار النماذج، وخاصة الشبكات العصبية التلافيفية (CNNs) وآلات ناقلات الدعم (SVMs)، في مجال الرؤية الحاسوبية.

كيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟

لتدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101، يمكنك استخدام مقتطفات الكود المقدمة. على سبيل المثال، للتدريب لمدة 100 حقبة:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

لمزيد من الوسيطات والخيارات التفصيلية، راجع صفحة التدريب الخاصة بالنموذج.

ما هي الميزات الرئيسية لمجموعة بيانات Caltech-101؟

تتضمن مجموعة بيانات Caltech-101 ما يلي:

  • حوالي 9,000 صورة ملونة موزعة على 101 فئة.
  • فئات تغطي مجموعة متنوعة من الكائنات، بما في ذلك الحيوانات والمركبات والأدوات المنزلية.
  • عدد متغير من الصور لكل فئة، يتراوح عادة بين 40 و 800 صورة.
  • أحجام صور متغيرة، ومعظمها بدقة متوسطة.

هذه الميزات تجعلها خيارًا ممتازًا لتدريب وتقييم نماذج التعرف على الكائنات في تعلم الآلة والرؤية الحاسوبية.

لماذا يجب علي الاستشهاد بمجموعة بيانات Caltech-101 في بحثي؟

الاستشهاد بمجموعة بيانات Caltech-101 في بحثك يقر بمساهمات المنشئين ويوفر مرجعًا للآخرين الذين قد يستخدمون مجموعة البيانات. الاستشهاد الموصى به هو:

اقتباس
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

يساعد الاستشهاد في الحفاظ على نزاهة العمل الأكاديمي ويساعد الزملاء في العثور على المورد الأصلي.

هل يمكنني استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-101؟

نعم، يمكنك استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-101. توفر منصة Ultralytics بيئة بديهية لإدارة مجموعات البيانات، وتدريب النماذج، ونشرها دون الحاجة إلى برمجة مكثفة. للحصول على دليل مفصل، راجع منشور المدونة حول كيفية تدريب نماذجك المخصصة باستخدام منصة Ultralytics.

تعليقات