مجموعة بيانات Caltech-101

Q: What is the Caltech-101 dataset used for in machine learning?

تُستخدم مجموعة بيانات Caltech-101 على نطاق واسع في تعلم الآلة لمهام التعرف على الكائنات. تحتوي على حوالي 9000 صورة موزعة على 101 فئة، مما يوفر معيارًا صعبًا لتقييم خوارزميات التعرف على الكائنات. يستفيد الباحثون منها لتدريب واختبار النماذج، وخاصة الشبكات العصبية التلافيفية (CNNs) وآلات المتجهات الداعمة (SVMs)، في رؤية الحاسوب.

Q: What are the key features of the Caltech-101 dataset?

تتضمن مجموعة بيانات Caltech-101 ما يلي: هذه الميزات تجعلها خيارًا ممتازًا لتدريب وتقييم نماذج التعرف على الكائنات في تعلم الآلة ورؤية الحاسوب.

تعتبر مجموعة بيانات Caltech-101 مجموعة بيانات مستخدمة على نطاق واسع لمهام التعرف على الكائنات، وتحتوي على حوالي 9000 صورة من 101 فئة من فئات الكائنات. تم اختيار الفئات لتعكس مجموعة متنوعة من كائنات العالم الحقيقي، وتم اختيار الصور نفسها بعناية وشرحها لتوفير معيار صعب لخوارزميات التعرف على الكائنات.

شاهد: كيفية التدريب تصنيف الصور نموذج يستخدم مجموعة بيانات Caltech-256 مع منصة Ultralytics

تقسيم البيانات تلقائيًا

مجموعة بيانات Caltech-101، كما هي مقدمة، لا تأتي مع تقسيمات تدريب/تحقق محددة مسبقًا. ومع ذلك، عند استخدام أوامر التدريب المتوفرة في أمثلة الاستخدام أدناه، سيقوم إطار Ultralytics تلقائيًا بتقسيم مجموعة البيانات لك. التقسيم الافتراضي المستخدم هو 80% لمجموعة التدريب و 20% لمجموعة التحقق.

الميزات الرئيسية

تتكون مجموعة بيانات Caltech-101 من حوالي 9,000 صورة ملونة مقسمة إلى 101 فئة.
تشمل الفئات مجموعة واسعة من الكائنات، بما في ذلك الحيوانات والمركبات والأدوات المنزلية والأشخاص.
يختلف عدد الصور لكل فئة، حيث يتراوح بين 40 إلى 800 صورة تقريبًا في كل فئة.
الصور ذات أحجام متغيرة، ومعظمها صور متوسطة الدقة.
يستخدم Caltech-101 على نطاق واسع للتدريب والاختبار في مجال تعلم الآلة، وخاصةً لمهام التعرف على الكائنات.

هيكل مجموعة البيانات

على عكس العديد من مجموعات البيانات الأخرى، لم يتم تقسيم مجموعة بيانات Caltech-101 رسميًا إلى مجموعات تدريب واختبار. عادةً ما يقوم المستخدمون بإنشاء عمليات التقسيم الخاصة بهم بناءً على احتياجاتهم الخاصة. ومع ذلك، فإن الممارسة الشائعة هي استخدام مجموعة فرعية عشوائية من الصور للتدريب (على سبيل المثال، 30 صورة لكل فئة) والصور المتبقية للاختبار.

التطبيقات

تستخدم مجموعة بيانات Caltech-101 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الكائنات، مثل الشبكات العصبية التلافيفية (CNNs) و آلات المتجهات الداعمة (SVMs) والعديد من خوارزميات تعلم الآلة الأخرى. إن تنوع فئاتها وصورها عالية الجودة يجعلها مجموعة بيانات ممتازة للبحث والتطوير في مجال تعلم الآلة و رؤية الكمبيوتر.

الاستخدام

لتدريب نموذج YOLO على مجموعة بيانات Caltech-101 لعدد 100 حقبة (epoch)، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo26n-cls.pt epochs=100 imgsz=416

عينات من الصور والشروحات التوضيحية

تحتوي مجموعة بيانات Caltech-101 على صور ملونة عالية الجودة لأشياء مختلفة، مما يوفر مجموعة بيانات جيدة التنظيم لمهام تصنيف الصور . فيما يلي بعض الأمثلة لصور من مجموعة البيانات:

عينات من مجموعة بيانات تصنيف الصور Caltech-101

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-101، مع التأكيد على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات Caltech-101 في بحثك أو عملك التطويري، فيرجى الاستشهاد بالورقة التالية:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

نود أن نعرب عن امتناننا لكل من Li Fei-Fei و Rob Fergus و Pietro Perona لإنشاء وصيانة مجموعة بيانات Caltech-101 كمورد قيم لمجتمع البحث في تعلم الآلة ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات Caltech-101 ومنشئيها، تفضل بزيارة موقع مجموعة بيانات Caltech-101.

الأسئلة الشائعة

في ماذا تُستخدم مجموعة بيانات Caltech-101 في تعلم الآلة؟

تستخدم مجموعة بيانات Caltech-101 على نطاق واسع في تعلم الآلة لمهام التعرف على الكائنات. وهي تحتوي على حوالي 9000 صورة عبر 101 فئة، مما يوفر معيارًا صعبًا لتقييم خوارزميات التعرف على الكائنات. يستفيد الباحثون منه لتدريب واختبار النماذج، وخاصة الشبكات العصبية الالتفافية (CNNs) وآلات المتجهات الداعمة (SVMs)، في رؤية الكمبيوتر.

كيف يمكنني تدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101؟

لتدريب نموذج Ultralytics YOLO على مجموعة بيانات Caltech-101، يمكنك استخدام مقتطفات التعليمات البرمجية المتوفرة. على سبيل المثال، للتدريب لعدد 100 حقبة (epoch):

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo26n-cls.pt epochs=100 imgsz=416

لمزيد من التفاصيل حول الحجج والخيارات، راجع صفحة التدريب الخاصة بالنموذج.

ما هي الميزات الرئيسية لمجموعة بيانات Caltech-101؟

تتضمن مجموعة بيانات Caltech-101 ما يلي:

حوالي 9000 صورة ملونة عبر 101 فئة.
فئات تغطي مجموعة متنوعة من الكائنات، بما في ذلك الحيوانات والمركبات والأدوات المنزلية.
عدد متغير من الصور لكل فئة، عادة ما بين 40 و 800.
أحجام صور متغيرة، ومعظمها بدقة متوسطة.

هذه الميزات تجعلها خيارًا ممتازًا لتدريب وتقييم نماذج التعرف على الكائنات في التعلم الآلي ورؤية الكمبيوتر.

لماذا يجب علي الاستشهاد بمجموعة بيانات Caltech-101 في بحثي؟

إن الاستشهاد بمجموعة بيانات Caltech-101 في بحثك يقر بمساهمات المبدعين ويوفر مرجعًا للآخرين الذين قد يستخدمون مجموعة البيانات. الاقتباس الموصى به هو:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

تساعد عملية الاستشهاد في الحفاظ على سلامة العمل الأكاديمي وتساعد الزملاء في تحديد موقع المورد الأصلي.

هل يمكنني استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-101؟

نعم، يمكنك استخدام منصة Ultralytics لتدريب النماذج على مجموعة بيانات Caltech-101. توفر منصة Ultralytics منصة بديهية لإدارة مجموعات البيانات وتدريب النماذج ونشرها دون الحاجة إلى برمجة مكثفة. للحصول على دليل مفصل، يرجى الرجوع إلى منشور المدونة "كيفية تدريب نماذجك المخصصة باستخدام منصة Ultralytics".

📅 تم الإنشاء قبل 2 سنوات ✏️ تم التحديث قبل 3 أشهر