Link to this sectionمجموعة بيانات Caltech-101#

مجموعة بيانات Caltech-101 هي معيار كلاسيكي لـ تصنيف الصور يحتوي على 9,144 صورة موزعة على 101 فئة من الكائنات بالإضافة إلى فئة خلفية واحدة. تحتوي كل فئة على حوالي 40 إلى 800 صورة لكائنات من العالم الحقيقي — حيوانات، ومركبات، وأدوات منزلية، وأشخاص — مما يجعلها معياراً مدمجاً ولكنه يمثل تحدياً لنماذج التعرف على الكائنات.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

تقسيم البيانات التلقائي

تأتي Caltech-101 بدون تقسيم محدد مسبقاً للتدريب/التحقق. تقوم أوامر التدريب أدناه بتقسيمها تلقائياً بنسبة 80% للتدريب / 20% للتحقق، لذا لا حاجة لإعداد يدوي.

Link to this sectionالميزات الرئيسية#

تحتوي Caltech-101 على 9,144 صورة ملونة موزعة على 101 فئة كائنات بالإضافة إلى فئة BACKGROUND_Google واحدة (إجمالي 102 مجلد فئات).
تغطي الفئات مجموعة واسعة من كائنات العالم الحقيقي، بما في ذلك الحيوانات، والمركبات، والأدوات المنزلية، والأشخاص.
تحتوي كل فئة على حوالي 40 إلى 800 صورة، لذا فإن أحجام الفئات غير متوازنة.
الصور ذات أحجام متفاوتة، ومعظمها تقريباً 300x200 بكسل (دقة متوسطة).
تُستخدم Caltech-101 على نطاق واسع كمعيار لتقييم خوارزميات تصنيف الصور والتعرف على الكائنات.

Link to this sectionهيكل مجموعة البيانات#

يتم توزيع Caltech-101 في 102 مجلداً — مجلد واحد لكل فئة، تغطي 101 فئة كائنات بالإضافة إلى فئة BACKGROUND_Google — بدون تقسيم محدد مسبقاً للتدريب/التحقق. عند بدء التدريب، يقوم Ultralytics تلقائياً بتقسيم الصور بحيث تتدرب النماذج عبر جميع الفئات الـ 102 دون أي إعداد يدوي:

الفئات: 102 (101 فئة كائنات + 1 خلفية)
إجمالي الصور: 9,144
تقسيم التدريب/التحقق: تلقائي 80% / 20% (حوالي 7,280 للتدريب، حوالي 1,864 للتحقق)
الصور لكل فئة: حوالي 40 إلى 800 (غير متوازنة)

Link to this sectionالتطبيقات#

تُستخدم Caltech-101 على نطاق واسع لتدريب وتقييم نماذج تصنيف الصور والتعرف على الكائنات، بما في ذلك الشبكات العصبية التلافيفية (CNNs) و آلات ناقلات الدعم (SVMs). تغطيتها الواسعة للفئات وصورها النظيفة والمصنفة تجعلها معياراً شائعاً لأبحاث ونماذج التعلم الآلي و الرؤية الحاسوبية.

Link to this sectionالاستخدام#

قم بتدريب نموذج YOLO على Caltech-101 لمدة 100 حقبة بحجم صورة 416. للحصول على القائمة الكاملة للوسائط المتاحة، راجع صفحة التدريب ودليل مهمة تصنيف الصور.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionصور وشروحات توضيحية عينة#

تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لكائنات متنوعة، مما يوفر مجموعة بيانات جيدة التنظيم لمهام تصنيف الصور. فيما يلي بعض الأمثلة للصور من مجموعة البيانات:

عينات من مجموعة بيانات تصنيف الصور Caltech-101

تُظهر العينات تنوع الفئات والتأطير الطبيعي المتمركز النموذجي لـ Caltech-101، مما يجعلها نقطة انطلاق نظيفة لتدريب نماذج قوية للتعرف على الكائنات.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات Caltech-101 في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

نود أن نعرب عن تقديرنا لكل من Li Fei-Fei وRob Fergus وPietro Perona لإنشائهم والحفاظ على مجموعة بيانات Caltech-101 كمورد قيم لمجتمع أبحاث تعلم الآلة ورؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومبتكريها، تفضل بزيارة موقع مجموعة بيانات Caltech-101.

Link to this sectionالأسئلة الشائعة#

Link to this sectionفيم تُستخدم مجموعة بيانات Caltech-101 في تعلم الآلة؟#

تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج تصنيف الصور والتعرف على الكائنات. تحتوي على 9,144 صورة موزعة على 101 فئة كائنات بالإضافة إلى فئة خلفية، مما يوفر معياراً تحدياً لتقييم خوارزميات مثل الشبكات العصبية التلافيفية (CNNs) وآلات ناقلات الدعم (SVMs).

Link to this sectionكيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟#

لتدريب نموذج Ultralytics YOLO على Caltech-101، استخدم مقتطفات الكود أدناه. يتم تنزيل مجموعة البيانات تلقائياً عند الاستخدام الأول. للحصول على قائمة كاملة بالوسائط، راجع صفحة تدريب النموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionكم عدد الفئات التي تحتوي عليها مجموعة بيانات Caltech-101؟#

تحتوي Caltech-101 على 101 فئة كائنات بالإضافة إلى فئة BACKGROUND_Google واحدة، بإجمالي 102 مجلد فئات و9,144 صورة. عند التدريب باستخدام Ultralytics، يتعلم النموذج جميع الفئات الـ 102. أحجام الفئات غير متوازنة، وتتراوح من حوالي 40 إلى 800 صورة لكل منها.

Link to this sectionكيف يتم تقسيم مجموعة بيانات Caltech-101 إلى مجموعات تدريب وتحقق؟#

لا تحتوي Caltech-101 على تقسيم محدد مسبقاً. في المرة الأولى التي تقوم فيها بالتدريب، يقوم Ultralytics تلقائياً بتقسيمها إلى 80% تدريب / 20% تحقق — حوالي 7,280 صورة للتدريب و1,864 للتحقق — لذا لا تحتاج إلى إنشاء تقسيمات يدوياً. للتحكم في التقسيم بنفسك، قم بتنظيم الصور في مجلدات train/ و val/ قبل التدريب.

Link to this sectionهل يمكنني استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-101؟#

نعم. تتيح لك منصة Ultralytics إدارة مجموعات البيانات، وتدريب نماذج تصنيف الصور، ونشرها دون برمجة مكثفة. إنها طريقة مريحة لتشغيل تجارب Caltech-101 في السحابة، ويمكنك استكشاف المزيد من الخيارات في نظرة عامة على مجموعات بيانات التصنيف الخاصة بنا.

المساهمون

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

تم الإنشاء 12 نوفمبر 2023تم التحديث قبل 4 أيام