مجموعة بيانات Caltech-256
تعد مجموعة بيانات Caltech-256 مجموعة واسعة من الصور المستخدمة في مهام تصنيف الكائنات. وهي تحتوي على حوالي 30,000 صورة مقسمة إلى 257 فئة (256 فئة كائنات وفئة واحدة للخلفية). يتم تنسيق الصور وتصنيفها بعناية لتوفير معيار مرجعي متطور ومتنوع لخوارزميات التعرف على الكائنات.
لا تأتي مجموعة بيانات Caltech-256، كما هو موفر، مع تقسيمات تدريب/تحقق مسبقة التحديد. ومع ذلك، عند استخدام أوامر التدريب الموضحة في أمثلة الاستخدام أدناه، سيقوم إطار عمل Ultralytics بتقسيم مجموعة البيانات لك تلقائيًا. التقسيم الافتراضي المستخدم هو 80% لمجموعة التدريب و20% لمجموعة التحقق.
الميزات الرئيسية
- تتكون مجموعة بيانات Caltech-256 من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة.
- تحتوي كل فئة على 80 صورة كحد أدنى.
- تشمل الفئات مجموعة واسعة من كائنات العالم الحقيقي، بما في ذلك الحيوانات والمركبات والأدوات المنزلية والأشخاص.
- الصور ذات أحجام ودقات متفاوتة.
- تُستخدم Caltech-256 على نطاق واسع للتدريب والاختبار في مجال التعلم الآلي، لا سيما في مهام التعرف على الكائنات.
هيكل مجموعة البيانات
مثل Caltech-101، لا تحتوي مجموعة بيانات Caltech-256 على تقسيم رسمي بين مجموعات التدريب والاختبار. ينشئ المستخدمون عادةً تقسيماتهم الخاصة وفقًا لاحتياجاتهم المحددة. من الممارسات الشائعة استخدام مجموعة فرعية عشوائية من الصور للتدريب والصور المتبقية للاختبار.
التطبيقات
تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات، مثل الشبكات العصبية التلافيفية (CNNs)، وآلات ناقل الدعم (SVMs)، والعديد من خوارزميات التعلم الآلي الأخرى. إن مجموعتها المتنوعة من الفئات وصورها عالية الجودة تجعلها مجموعة بيانات لا تقدر بثمن للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.
الاستخدام
لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لمدة 100 حقبة، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)صور وعينات تعليقات توضيحية
تحتوي مجموعة بيانات Caltech-256 على صور ملونة عالية الجودة لكائنات متنوعة، مما يوفر مجموعة بيانات شاملة لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة للصور من مجموعة البيانات (المصدر):

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-256، مما يؤكد على أهمية مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.
الاقتباسات والشكر
إذا كنت تستخدم مجموعة بيانات Caltech-256 في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}نود أن نشكر Gregory Griffin وAlex Holub وPietro Perona على إنشاء وصيانة مجموعة بيانات Caltech-256 كمورد قيم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات Caltech-256 ومبدعيها، تفضل بزيارة موقع مجموعة بيانات Caltech-256.
الأسئلة الشائعة
ما هي مجموعة بيانات Caltech-256 ولماذا هي مهمة للتعلم الآلي؟
تعد مجموعة بيانات Caltech-256 مجموعة بيانات صور كبيرة تُستخدم بشكل أساسي لمهام تصنيف الكائنات في التعلم الآلي والرؤية الحاسوبية. وهي تتكون من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة، تغطي مجموعة واسعة من كائنات العالم الحقيقي. تجعل الصور المتنوعة وعالية الجودة في مجموعة البيانات منها معياراً ممتازاً لتقييم خوارزميات التعرف على الكائنات، وهو أمر بالغ الأهمية لتطوير نماذج تعلم آلي قوية.
كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات Caltech-256 باستخدام Python أو CLI؟
لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لمدة 100 حقبة، يمكنك استخدام مقتطفات الكود التالية. راجع صفحة التدريب الخاصة بالنموذج للحصول على خيارات إضافية.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)ما هي أكثر حالات الاستخدام شيوعاً لمجموعة بيانات Caltech-256؟
تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع لمهام التعرف على الكائنات المختلفة مثل:
- تدريب الشبكات العصبية التلافيفية (CNNs)
- تقييم أداء آلات ناقل الدعم (SVMs)
- وضع معايير مرجعية لخوارزميات التعلم العميق الجديدة
- تطوير نماذج اكتشاف الكائنات باستخدام أطر عمل مثل Ultralytics YOLO
تجعل تنوعها وشروحاتها الشاملة منها خياراً مثالياً للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.
كيف يتم هيكلة مجموعة بيانات Caltech-256 وتقسيمها للتدريب والاختبار؟
لا تأتي مجموعة بيانات Caltech-256 بتقسيم محدد مسبقاً للتدريب والاختبار. ينشئ المستخدمون عادةً تقسيماتهم الخاصة وفقاً لاحتياجاتهم المحددة. يتمثل النهج الشائع في اختيار مجموعة فرعية من الصور عشوائياً للتدريب واستخدام الصور المتبقية للاختبار. تتيح هذه المرونة للمستخدمين تكييف مجموعة البيانات مع متطلبات مشروعهم الخاصة وإعداداتهم التجريبية.
لماذا يجب أن أستخدم Ultralytics YOLO لتدريب النماذج على مجموعة بيانات Caltech-256؟
توفر نماذج Ultralytics YOLO العديد من المزايا للتدريب على مجموعة بيانات Caltech-256:
- دقة عالية: تشتهر نماذج YOLO بأدائها المتطور في مهام اكتشاف الكائنات.
- السرعة: توفر قدرات استنتاج في الوقت الفعلي، مما يجعلها مناسبة للتطبيقات التي تتطلب تنبؤات سريعة.
- سهولة الاستخدام: مع منصة Ultralytics، يمكن للمستخدمين تدريب النماذج والتحقق منها ونشرها دون الحاجة إلى برمجة مكثفة.
- نماذج مدربة مسبقاً: البدء بنماذج مدربة مسبقاً، مثل
yolo26n-cls.pt، يمكن أن يقلل بشكل كبير من وقت التدريب ويحسن دقة النموذج.
For more details, explore our comprehensive training guide and learn about image classification with Ultralytics YOLO.