مجموعة بيانات Caltech-256

Q: What is the Caltech-256 dataset and why is it important for machine learning?

مجموعة بيانات Caltech-256 هي مجموعة بيانات صور كبيرة تستخدم بشكل أساسي لمهام تصنيف الكائنات في تعلم الآلة ورؤية الكمبيوتر. وهي تتكون من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة، تغطي مجموعة واسعة من كائنات العالم الحقيقي. إن صور مجموعة البيانات المتنوعة وعالية الجودة تجعلها معيارًا ممتازًا لتقييم خوارزميات التعرف على الكائنات، وهو أمر بالغ الأهمية لتطوير نماذج تعلم آلي قوية.

Q: How can I train a YOLO model on the Caltech-256 dataset using Python or CLI?

لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لـ 100 حقبة، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. ارجع إلى صفحة تدريب النموذج للحصول على خيارات إضافية.

تعتبر مجموعة بيانات Caltech-256 مجموعة واسعة من الصور المستخدمة لمهام تصنيف الكائنات. تحتوي على حوالي 30,000 صورة مقسمة إلى 257 فئة (256 فئة كائن وفئة خلفية واحدة). يتم تنظيم الصور وتعليقها التوضيحي بعناية لتوفير معيار صعب ومتنوع لخوارزميات التعرف على الكائنات.

شاهد: كيفية التدريب تصنيف الصور نموذج يستخدم مجموعة بيانات Caltech-256 مع Ultralytics

تقسيم البيانات تلقائيًا

مجموعة بيانات Caltech-256، كما هي مقدمة، لا تأتي مع تقسيمات تدريب/تحقق محددة مسبقًا. ومع ذلك، عند استخدام أوامر التدريب المتوفرة في أمثلة الاستخدام أدناه، سيقوم إطار Ultralytics تلقائيًا بتقسيم مجموعة البيانات لك. التقسيم الافتراضي المستخدم هو 80% لمجموعة التدريب و 20% لمجموعة التحقق.

الميزات الرئيسية

تتكون مجموعة بيانات Caltech-256 من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة.
تحتوي كل فئة على 80 صورة كحد أدنى.
تشمل الفئات مجموعة واسعة من كائنات العالم الحقيقي، بما في ذلك الحيوانات والمركبات والأدوات المنزلية والأشخاص.
الصور ذات أحجام ودقة متفاوتة.
يستخدم Caltech-256 على نطاق واسع للتدريب والاختبار في مجال تعلم الآلة، وخاصة لمهام التعرف على الكائنات.

هيكل مجموعة البيانات

مثل Caltech-101، لا تحتوي مجموعة بيانات Caltech-256 على تقسيم رسمي بين مجموعات التدريب والاختبار. عادةً ما يقوم المستخدمون بإنشاء تقسيماتهم الخاصة وفقًا لاحتياجاتهم الخاصة. من الممارسات الشائعة استخدام مجموعة فرعية عشوائية من الصور للتدريب والصور المتبقية للاختبار.

التطبيقات

تستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات، مثل الشبكات العصبية التلافيفية (CNNs) و آلات المتجهات الداعمة (SVMs) والعديد من خوارزميات تعلم الآلة الأخرى. إن مجموعتها المتنوعة من الفئات وصورها عالية الجودة تجعلها مجموعة بيانات لا تقدر بثمن للبحث والتطوير في مجال تعلم الآلة و رؤية الكمبيوتر.

الاستخدام

لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لعدد 100 حقبة (epoch)، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

عينات من الصور والشروحات التوضيحية

تحتوي مجموعة بيانات Caltech-256 على صور ملونة عالية الجودة لكائنات مختلفة، مما يوفر مجموعة بيانات شاملة لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات (حقوق):

عينات من مجموعة بيانات تصنيف الصور Caltech-256

يوضح المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-256، مع التأكيد على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات Caltech-256 في بحثك أو عملك التطويري، فيرجى الاستشهاد بالورقة التالية:

BibTeX

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

نود أن نشكر Gregory Griffin و Alex Holub و Pietro Perona لإنشاء مجموعة بيانات Caltech-256 والحفاظ عليها كمورد قيم لتعلم الآلة ومجتمع أبحاث رؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات Caltech-256 ومنشئيها، تفضل بزيارة موقع مجموعة بيانات Caltech-256.

الأسئلة الشائعة

ما هي مجموعة بيانات Caltech-256 ولماذا هي مهمة لتعلم الآلة؟

تعتبر مجموعة البيانات Caltech-256 مجموعة بيانات صور كبيرة تستخدم بشكل أساسي لمهام تصنيف الكائنات في التعلم الآلي ورؤية الكمبيوتر. وهي تتكون من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة، تغطي مجموعة واسعة من كائنات العالم الحقيقي. إن الصور المتنوعة وعالية الجودة لمجموعة البيانات تجعلها معيارًا ممتازًا لتقييم خوارزميات التعرف على الكائنات، وهو أمر بالغ الأهمية لتطوير نماذج تعلم آلي قوية.

كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات Caltech-256 باستخدام Python أو CLI؟

لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لعدد 100 حقبة (epoch)، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. راجع صفحة تدريب النموذج للحصول على خيارات إضافية.

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

ما هي حالات الاستخدام الأكثر شيوعًا لمجموعة بيانات Caltech-256؟

تستخدم مجموعة بيانات Caltech-256 على نطاق واسع في مهام التعرف على الكائنات المختلفة مثل:

تدريب الشبكات العصبونية التفافية (CNNs)
تقييم أداء آلات متجه الدعم (SVMs)
تقييم الخوارزميات الجديدة للتعلم العميق
تطوير نماذج اكتشاف الكائنات باستخدام أطر عمل مثل Ultralytics YOLO

إن تنوعها والتعليقات التوضيحية الشاملة تجعلها مثالية للبحث والتطوير في مجال تعلم الآلة ورؤية الكمبيوتر.

كيف يتم تنظيم وتقسيم مجموعة بيانات Caltech-256 للتدريب والاختبار؟

لا تأتي مجموعة بيانات Caltech-256 مع تقسيم محدد مسبقًا للتدريب والاختبار. عادةً ما يقوم المستخدمون بإنشاء عمليات التقسيم الخاصة بهم وفقًا لاحتياجاتهم الخاصة. يتمثل أحد الأساليب الشائعة في تحديد مجموعة فرعية من الصور عشوائيًا للتدريب واستخدام الصور المتبقية للاختبار. تتيح هذه المرونة للمستخدمين تصميم مجموعة البيانات وفقًا لمتطلبات المشروع وإعدادات التجارب الخاصة بهم.

لماذا يجب علي استخدام Ultralytics YOLO لتدريب النماذج على مجموعة بيانات Caltech-256؟

توفر نماذج Ultralytics YOLO العديد من المزايا للتدريب على مجموعة بيانات Caltech-256:

دقة عالية: تُعرف نماذج YOLO بأدائها المتميز في مهام الكشف عن الكائنات.
السرعة: إنها توفر إمكانات الاستدلال في الوقت الفعلي، مما يجعلها مناسبة للتطبيقات التي تتطلب تنبؤات سريعة.
سهولة الاستخدام: مع Ultralytics Platform، يمكن للمستخدمين تدريب النماذج والتحقق من صحتها ونشرها دون الحاجة إلى برمجة مكثفة.
نماذج مُدرَّبة مسبقًا: بدءًا من النماذج المدربة مسبقًا، مثل yolo26n-cls.pt، يمكن أن يقلل بشكل كبير من وقت التدريب ويحسن أداء النموذج الدقة.

لمزيد من التفاصيل، استكشف دليل التدريب الشامل الخاص بنا وتعرّف على تصنيف الصور باستخدام Ultralytics YOLO.

📅 تم الإنشاء قبل 2 أعوام ✏️ تم التحديث قبل 28 أيام