Link to this sectionمجموعة بيانات Caltech-256#

تُعد مجموعة بيانات Caltech-256 معياراً كلاسيكياً لـ تصنيف الصور، حيث تضم 30,607 صورة موزعة على 256 فئة من الكائنات بالإضافة إلى فئة خلفية واحدة. تحتوي كل فئة على 80 صورة على الأقل من كائنات حقيقية — كالحيوانات والمركبات والأدوات المنزلية والأشخاص — مما يجعلها خلفاً أكبر وأكثر تحدياً لمجموعة Caltech-101 لنماذج التعرف على الكائنات.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

تقسيم البيانات التلقائي

تتوفر Caltech-256 بدون تقسيم محدد مسبقاً للتدريب/التحقق. تقوم أوامر التدريب أدناه بتقسيمها تلقائياً إلى 80% للتدريب و20% للتحقق، لذا لا حاجة لإعداد يدوي.

Link to this sectionالميزات الرئيسية#

تحتوي Caltech-256 على 30,607 صورة ملونة عبر 256 فئة من الكائنات بالإضافة إلى فئة خلفية واحدة هي 257.clutter (بإجمالي 257 مجلداً للفئات).
تغطي الفئات مجموعة واسعة من كائنات العالم الحقيقي، بما في ذلك الحيوانات، والمركبات، والأدوات المنزلية، والأشخاص.
تحتوي كل فئة على 80 صورة على الأقل، وتصل أكبر فئة إلى حوالي 800 صورة، لذا فإن أحجام الفئات غير متوازنة.
الصور ذات أحجام ودقات متفاوتة.
تُستخدم Caltech-256 على نطاق واسع لتقييم خوارزميات تصنيف الصور والتعرف على الكائنات.

Link to this sectionهيكل مجموعة البيانات#

يتم توزيع Caltech-256 في 257 مجلداً — واحد لكل فئة، تغطي 256 فئة من الكائنات بالإضافة إلى فئة خلفية واحدة هي 257.clutter — بدون تقسيم محدد مسبقاً للتدريب/التحقق. عند بدء التدريب، يقوم Ultralytics بتقسيم الصور تلقائياً لتدريب النماذج عبر جميع الفئات الـ 257 دون أي إعداد يدوي:

الفئات: 257 (256 فئة كائنات + 1 خلفية)
إجمالي الصور: 30,607
تقسيم التدريب/التحقق: تلقائي 80% / 20% (≈24,385 للتدريب، ≈6,222 للتحقق)
الصور لكل فئة: 80 على الأقل (غير متوازنة، تصل إلى حوالي 800)

Link to this sectionالتطبيقات#

تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج تصنيف الصور والتعرف على الكائنات، بما في ذلك الشبكات العصبية التلافيفية (CNNs) وآلات ناقلات الدعم (SVMs). إن العدد الكبير للفئات والصور عالية الجودة يجعلها معياراً شائعاً لأبحاث ونمذجة تعلم الآلة والرؤية الحاسوبية.

Link to this sectionالاستخدام#

قم بتدريب نموذج YOLO على Caltech-256 لعدد 100 عصر بحجم صورة 416. للحصول على القائمة الكاملة للوسائط المتاحة، راجع صفحة التدريب ودليل مهمة تصنيف الصور.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionصور وشروحات توضيحية عينة#

تحتوي مجموعة بيانات Caltech-256 على صور ملونة عالية الجودة لكائنات متنوعة، مما يوفر مجموعة بيانات منظمة جيداً لمهام تصنيف الصور. فيما يلي بعض الأمثلة للصور من مجموعة البيانات (المصدر):

نماذج مجموعة بيانات تصنيف الصور Caltech-256

تُظهر النماذج تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-256، مما يؤكد قيمة وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات Caltech-256 في بحثك أو عملك التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

نود أن نعرب عن تقديرنا لـ Gregory Griffin وAlex Holub وPietro Perona لإنشائهم وصيانتهم لمجموعة بيانات Caltech-256 كمورد قيم لمجتمع أبحاث تعلم الآلة والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات Caltech-256 ومبتكريها، تفضل بزيارة موقع مجموعة بيانات Caltech-256.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما الذي تُستخدم فيه مجموعة بيانات Caltech-256 في تعلم الآلة؟#

تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج تصنيف الصور والتعرف على الكائنات. وهي تحتوي على 30,607 صورة عبر 256 فئة من الكائنات بالإضافة إلى فئة خلفية، مما يوفر معياراً أكبر وأكثر تحدياً من Caltech-101 لخوارزميات مثل الشبكات العصبية التلافيفية (CNNs) وآلات ناقلات الدعم (SVMs).

Link to this sectionكيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-256؟#

لتدريب نموذج Ultralytics YOLO على Caltech-256، استخدم مقتطفات الكود أدناه. يتم تنزيل مجموعة البيانات تلقائياً عند الاستخدام لأول مرة. للحصول على قائمة كاملة بالوسائط، راجع صفحة التدريب للنماذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionكم عدد الفئات التي تحتوي عليها مجموعة بيانات Caltech-256؟#

تحتوي Caltech-256 على 256 فئة من الكائنات بالإضافة إلى فئة خلفية واحدة هي 257.clutter، بإجمالي 257 مجلداً للفئات و30,607 صورة. عند التدريب باستخدام Ultralytics، يتعلم النموذج جميع الفئات الـ 257. تحتوي كل فئة على 80 صورة على الأقل، ولكن أحجام الفئات غير متوازنة، حيث تحتوي أكبر فئة على ما يصل إلى 800 صورة تقريباً.

Link to this sectionكيف يتم تقسيم مجموعة بيانات Caltech-256 إلى مجموعات تدريب وتحقق؟#

لا يوجد لدى Caltech-256 تقسيم محدد مسبقاً. في المرة الأولى التي تقوم فيها بالتدريب، يقوم Ultralytics بتقسيمها تلقائياً إلى 80% للتدريب و20% للتحقق — حوالي 24,385 صورة للتدريب و6,222 للتحقق — لذا لا تحتاج إلى إنشاء التقسيمات يدوياً. للتحكم في التقسيم بنفسك، قم بتنظيم الصور في مجلدات train/ وval/ قبل البدء في التدريب.

Link to this sectionهل يمكنني استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-256؟#

نعم. تتيح لك منصة Ultralytics إدارة مجموعات البيانات، وتدريب نماذج تصنيف الصور، ونشرها دون الحاجة إلى برمجة مكثفة. إنها طريقة ملائمة لتشغيل تجارب Caltech-256 في السحابة، ويمكنك استكشاف المزيد من الخيارات في نظرة عامة على مجموعات بيانات التصنيف الخاصة بنا.

المساهمون

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

تم الإنشاء 12 نوفمبر 2023تم التحديث قبل 3 أيام