مجموعة بيانات معهد كاليفورنيا للتكنولوجيا -256
مجموعة بيانات Caltech-256 عبارة عن مجموعة واسعة من الصور المستخدمة في مهام تصنيف الأجسام. وهي تحتوي على حوالي 30,000 صورة مقسمة إلى 257 فئة (256 فئة كائن وفئة خلفية واحدة). وقد تم تنسيق الصور بعناية ووضع شروح لها لتوفير معيار صعب ومتنوع لخوارزميات التعرف على الأجسام.
شاهد: كيفية التدريب تصنيف الصور نموذج باستخدام مجموعة بيانات Caltech-256 مع Ultralytics HUB
الميزات الرئيسية
- تضم مجموعة بيانات Caltech-256 حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة.
- تحتوي كل فئة على 80 صورة كحد أدنى.
- تشمل الفئات مجموعة واسعة من الأشياء الواقعية، بما في ذلك الحيوانات والمركبات والأدوات المنزلية والأشخاص.
- الصور متغيرة الأحجام والدقة.
- يُستخدم Caltech-256 على نطاق واسع في التدريب والاختبار في مجال التعلم الآلي، خاصةً في مهام التعرف على الأشياء.
هيكلية مجموعة البيانات
على غرار Caltech-101، لا تحتوي مجموعة بيانات Caltech-256 على تقسيم رسمي بين مجموعتي التدريب والاختبار. يقوم المستخدمون عادةً بإنشاء تقسيمات خاصة بهم وفقًا لاحتياجاتهم الخاصة. تتمثل الممارسة الشائعة في استخدام مجموعة فرعية عشوائية من الصور للتدريب والصور المتبقية للاختبار.
التطبيقات
تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام التعرف على الأشياء، مثل الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs) وخوارزميات التعلم الآلي الأخرى المختلفة. إن مجموعتها المتنوعة من الفئات والصور عالية الجودة تجعلها مجموعة بيانات لا تقدر بثمن للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.
الاستخدام
لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لـ 100 حقبة، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.
مثال على القطار
عينة من الصور والتعليقات التوضيحية
تحتوي مجموعة بيانات Caltech-256 على صور ملونة عالية الجودة لأجسام مختلفة، مما يوفر مجموعة بيانات شاملة لمهام التعرف على الأجسام. فيما يلي بعض الأمثلة لصور من مجموعة البيانات(رصيد):
يُظهر المثال تنوع وتعقيد الكائنات في مجموعة بيانات Caltech-256، مما يؤكد أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية للتعرف على الكائنات.
الاستشهادات والشكر والتقدير
إذا كنت تستخدم مجموعة بيانات Caltech-256 في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة التالية:
نود أن نعرب عن تقديرنا لغريغوري غريفين وأليكس هولوب وبيترو بيرونا على إنشاء مجموعة بيانات Caltech-256 والحفاظ عليها كمصدر قيّم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول
مجموعة بيانات Caltech-256 ومنشئوها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات Caltech-256.
الأسئلة الشائعة
ما هي مجموعة بيانات Caltech-256 ولماذا هي مهمة للتعلم الآلي؟
مجموعة بيانات Caltech-256 هي مجموعة بيانات صور كبيرة تُستخدم في المقام الأول لمهام تصنيف الكائنات في التعلم الآلي والرؤية الحاسوبية. وهي تتألف من حوالي 30,000 صورة ملونة مقسمة إلى 257 فئة، وتغطي مجموعة واسعة من الأجسام في العالم الحقيقي. تجعل الصور المتنوعة والعالية الجودة لمجموعة البيانات هذه معيارًا ممتازًا لتقييم خوارزميات التعرّف على الأشياء، وهو أمر بالغ الأهمية لتطوير نماذج قوية للتعلّم الآلي.
كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات Caltech-256 باستخدام Python أو CLI ؟
لتدريب نموذج YOLO على مجموعة بيانات Caltech-256 لـ 100 حقبة، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. راجع صفحة تدريب النموذج للحصول على خيارات إضافية.
مثال على القطار
ما هي حالات الاستخدام الأكثر شيوعًا لمجموعة بيانات Caltech-256؟
تُستخدم مجموعة بيانات Caltech-256 على نطاق واسع في مهام التعرف على الأجسام المختلفة مثل:
- تدريب الشبكات العصبية التلافيفية (CNNs)
- تقييم أداء آلات المتجهات الداعمة (SVMs)
- قياس خوارزميات التعلم العميق الجديدة
- تطوير نماذج اكتشاف الكائنات باستخدام أطر عمل مثل Ultralytics YOLO
تنوعه وشروحه الشاملة تجعله مثاليًا للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.
كيف يتم تنظيم مجموعة بيانات Caltech-256 وتقسيمها للتدريب والاختبار؟
لا تأتي مجموعة بيانات Caltech-256 مع تقسيم محدد مسبقًا للتدريب والاختبار. عادةً ما يقوم المستخدمون بإنشاء تقسيمات خاصة بهم وفقًا لاحتياجاتهم الخاصة. يتمثل النهج الشائع في اختيار مجموعة فرعية من الصور عشوائيًا للتدريب واستخدام الصور المتبقية للاختبار. تسمح هذه المرونة للمستخدمين بتخصيص مجموعة البيانات وفقًا لمتطلبات مشاريعهم الخاصة وإعداداتهم التجريبية.
لماذا يجب استخدام Ultralytics YOLO لتدريب النماذج على مجموعة بيانات Caltech-256؟
Ultralytics YOLO تقدم النماذج عدة مزايا للتدريب على مجموعة بيانات Caltech-256:
- دقة عالية: تُعرف نماذج YOLO بأدائها المتطور في مهام اكتشاف الأجسام.
- السرعة: توفر قدرات استنتاج في الوقت الحقيقي، مما يجعلها مناسبة للتطبيقات التي تتطلب تنبؤات سريعة.
- سهولة الاستخدام: باستخدام Ultralytics HUB، يمكن للمستخدمين تدريب النماذج والتحقق من صحتها ونشرها دون الحاجة إلى ترميز مكثف.
- النماذج المدربة مسبقاً: بدءًا من النماذج المدربة مسبقًا، مثل
yolo11n-cls.pt
يمكن أن يقلل وقت التدريب بشكل كبير ويحسن النموذج الدقة.
لمزيد من التفاصيل، استكشف دليل التدريب الشامل.