انتقل إلى المحتوى

مجموعة بيانات معهد كاليفورنيا للتكنولوجيا -256

مجموعة بيانات Caltech-256 عبارة عن مجموعة واسعة من الصور المستخدمة لمهام تصنيف الكائنات. يحتوي على حوالي 30000 صورة مقسمة إلى 257 فئة (256 فئة كائن و 1 فئة خلفية). يتم تنسيق الصور والتعليق عليها بعناية لتوفير معيار صعب ومتنوع لخوارزميات التعرف على الكائنات.



شاهد: كيفية تدريب نموذج تصنيف الصور باستخدام مجموعة بيانات Caltech-256 باستخدام Ultralytics HUB

الميزات الرئيسية

  • تضم مجموعة بيانات Caltech-256 حوالي 30000 صورة ملونة مقسمة إلى 257 فئة.
  • تحتوي كل فئة على 80 صورة على الأقل.
  • تشمل الفئات مجموعة متنوعة من الأشياء في العالم الحقيقي ، بما في ذلك والمركبات والأدوات المنزلية والأشخاص.
  • الصور ذات أحجام ودقة متفاوتة.
  • يستخدم Caltech-256 على نطاق واسع للتدريب والاختبار في مجال التعلم الآلي ، خاصة لمهام التعرف على الأشياء.

هيكل مجموعة البيانات

مثل Caltech-101 ، لا تحتوي مجموعة بيانات Caltech-256 على تقسيم رسمي بين مجموعات التدريب والاختبار. عادة ما ينشئ المستخدمون تقسيماتهم الخاصة وفقا لاحتياجاتهم الخاصة. من الممارسات الشائعة استخدام مجموعة فرعية عشوائية من الصور للتدريب والصور المتبقية للاختبار.

التطبيقات

تستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الأشياء ، مثل الشبكات العصبية التلافيفية (CNNs) ، وآلات دعم المتجهات (SVMs) ، والعديد من خوارزميات التعلم الآلي الأخرى. مجموعتها المتنوعة من الفئات والصور عالية الجودة تجعلها مجموعة بيانات لا تقدر بثمن للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.

استخدام

لتدريب أ YOLO على مجموعة بيانات Caltech-256 ل 100 حقبة ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات Caltech-256 على صور ملونة عالية الجودة لكائنات مختلفة ، مما يوفر مجموعة بيانات شاملة لمهام التعرف على الكائنات. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات (الائتمان):

صورة عينة مجموعة البيانات

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-256 ، مع التأكيد على أهمية مجموعة بيانات متنوعة لتدريب نماذج التعرف على الكائنات القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات Caltech-256 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

نود أن نعرب عن تقديرنا لجريجوري جريفين وأليكس هولوب وبيترو بيرونا لإنشاء مجموعة بيانات Caltech-256 والحفاظ عليها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول

مجموعة بيانات Caltech-256 ومنشئوها ، قم بزيارة موقع مجموعة بيانات Caltech-256.

الأسئلة المتداولة

ما هي مجموعة بيانات Caltech-256 ولماذا هي مهمة للتعلم الآلي؟

مجموعة بيانات Caltech-256 هي مجموعة بيانات صور كبيرة تُستخدم في المقام الأول لمهام تصنيف الكائنات في التعلم الآلي والرؤية الحاسوبية. وهي تتألف من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة، وتغطي مجموعة واسعة من الأجسام في العالم الحقيقي. تجعل الصور المتنوعة والعالية الجودة لمجموعة البيانات هذه معيارًا ممتازًا لتقييم خوارزميات التعرّف على الأشياء، وهو أمر بالغ الأهمية لتطوير نماذج قوية للتعلّم الآلي.

كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات Caltech-256 باستخدام Python أو CLI ؟

لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لـ 100 حقبة، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. راجع صفحة تدريب النموذج للحصول على خيارات إضافية.

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

ما هي حالات الاستخدام الأكثر شيوعًا لمجموعة بيانات Caltech-256؟

تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع في مهام التعرف على الأجسام المختلفة مثل:

  • تدريب الشبكات العصبية التلافيفية (CNNs)
  • تقييم أداء آلات المتجهات الداعمة (SVMs)
  • قياس خوارزميات التعلم العميق الجديدة
  • تطوير نماذج اكتشاف الكائنات باستخدام أطر عمل مثل Ultralytics YOLO

تنوعه وشروحه الشاملة تجعله مثاليًا للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.

كيف يتم تنظيم مجموعة بيانات Caltech-256 وتقسيمها للتدريب والاختبار؟

لا تأتي مجموعة بيانات Caltech-256 مع تقسيم محدد مسبقًا للتدريب والاختبار. عادةً ما يقوم المستخدمون بإنشاء تقسيمات خاصة بهم وفقًا لاحتياجاتهم الخاصة. يتمثل النهج الشائع في اختيار مجموعة فرعية من الصور عشوائيًا للتدريب واستخدام الصور المتبقية للاختبار. تسمح هذه المرونة للمستخدمين بتخصيص مجموعة البيانات وفقًا لمتطلبات مشروعاتهم الخاصة وإعداداتهم التجريبية.

لماذا يجب استخدام Ultralytics YOLO لتدريب النماذج على مجموعة بيانات Caltech-256؟

Ultralytics YOLO تقدم النماذج عدة مزايا للتدريب على مجموعة بيانات Caltech-256:

  • دقة عالية: تُعرف نماذج YOLO بأدائها المتطور في مهام اكتشاف الأجسام.
  • السرعة: توفر قدرات استنتاج في الوقت الحقيقي، مما يجعلها مناسبة للتطبيقات التي تتطلب تنبؤات سريعة.
  • سهولة الاستخدام: باستخدام Ultralytics HUB، يمكن للمستخدمين تدريب النماذج والتحقق من صحتها ونشرها دون الحاجة إلى ترميز مكثف.
  • النماذج المدربة مسبقاً: بدءًا من النماذج المدربة مسبقًا، مثل yolov8n-cls.pt، يمكن أن يقلل بشكل كبير من وقت التدريب ويحسن دقة النموذج.

لمزيد من التفاصيل، استكشف دليل التدريب الشامل.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-18
المؤلفون: RizwanMunawar (1)، Glenn-jocher (6)

التعليقات