انتقل إلى المحتوى

مجموعة بيانات CIFAR-10

مجموعة بيانات CIFAR-10 (المعهد الكندي للأبحاث المتقدمة) عبارة عن مجموعة من الصور المستخدمة على نطاق واسع للتعلم الآلي وخوارزميات رؤية الكمبيوتر. تم تطويره من قبل باحثين في معهد CIFAR ويتكون من 60000 صورة ملونة 32 × 32 في 10 فئات مختلفة.



شاهد: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLOv8

الميزات الرئيسية

  • تتكون مجموعة بيانات CIFAR-10 من 60000 صورة مقسمة إلى 10 فئات.
  • يحتوي كل فصل على 6000 صورة ، مقسمة إلى 5000 للتدريب و 1000 للاختبار.
  • الصور ملونة وبحجم 32 × 32 بكسل.
  • تمثل الفئات ال 10 المختلفة الطائرات والسيارات والطيور والقطط والغزلان والضفادع والخيول والسفن والشاحنات.
  • يستخدم CIFAR-10 بشكل شائع للتدريب والاختبار في مجال التعلم الآلي ورؤية الكمبيوتر.

هيكل مجموعة البيانات

تنقسم مجموعة بيانات CIFAR-10 إلى مجموعتين فرعيتين:

  1. مجموعة التدريب: تحتوي هذه المجموعة الفرعية على 50000 صورة مستخدمة لتدريب نماذج التعلم الآلي.
  2. مجموعة الاختبار: تتكون هذه المجموعة الفرعية من 10000 صورة تستخدم لاختبار النماذج المدربة وقياسها.

التطبيقات

تستخدم مجموعة بيانات CIFAR-10 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور ، مثل الشبكات العصبية التلافيفية (CNNs) ، ودعم آلات المتجهات (SVMs) ، والعديد من خوارزميات التعلم الآلي الأخرى. إن تنوع مجموعة البيانات من حيث الفئات ووجود الصور الملونة يجعلها مجموعة بيانات شاملة للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.

استخدام

لتدريب أ YOLO نموذج على مجموعة بيانات CIFAR-10 ل 100 حقبة بحجم صورة 32 × 32 ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات CIFAR-10 على صور ملونة لكائنات مختلفة ، مما يوفر مجموعة بيانات جيدة التنظيم لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات CIFAR-10 ، مما يسلط الضوء على أهمية مجموعة البيانات المتنوعة لتدريب نماذج تصنيف الصور القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

نود أن نعرب عن تقديرنا لأليكس كريجيفسكي لإنشاء مجموعة بيانات CIFAR-10 وصيانتها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات CIFAR-10 ومنشئها، تفضل بزيارة موقع مجموعة بيانات CIFAR-10.

الأسئلة المتداولة

كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات CIFAR-10؟

لتدريب نموذج YOLO على مجموعة بيانات CIFAR-10 باستخدام Ultralytics ، يمكنك اتباع الأمثلة المتوفرة لكل من Python و CLI. إليك مثال أساسي لتدريب نموذجك على 100 حلقة تدريبية بحجم صورة 32 × 32 بكسل:

مثل

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

لمزيد من التفاصيل، ارجع إلى صفحة التدريب النموذجي.

ما هي السمات الرئيسية لمجموعة بيانات CIFAR-10؟

تتكون مجموعة بيانات CIFAR-10 من 60,000 صورة ملونة مقسمة إلى 10 فئات. تحتوي كل فئة على 6000 صورة، منها 5000 صورة للتدريب و1000 صورة للاختبار. يبلغ حجم الصور 32 × 32 بكسل وتتنوع عبر الفئات التالية:

  • الطائرات
  • السيارات
  • الطيور
  • القطط
  • الغزلان
  • الكلاب
  • الضفادع
  • الخيول
  • السفن
  • الشاحنات

تُعد مجموعة البيانات المتنوعة هذه ضرورية لتدريب نماذج تصنيف الصور في مجالات مثل التعلم الآلي والرؤية الحاسوبية. للمزيد من المعلومات، يرجى زيارة أقسام CIFAR-10 حول بنية مجموعة البيانات وتطبيقاتها.

لماذا استخدام مجموعة بيانات CIFAR-10 لمهام تصنيف الصور؟

تُعدّ مجموعة بيانات CIFAR-10 معيارًا ممتازًا لتصنيف الصور نظرًا لتنوعها وهيكلها. فهي تحتوي على مزيج متوازن من 60,000 صورة مصنفة في 10 فئات مختلفة، مما يساعد في تدريب نماذج قوية ومعممة. ويُستخدم على نطاق واسع لتقييم نماذج التعلُّم العميق، بما في ذلك الشبكات العصبية التلافيفية (CNNs) وخوارزميات التعلُّم الآلي الأخرى. مجموعة البيانات صغيرة نسبيًا، مما يجعلها مناسبة للتجريب السريع وتطوير الخوارزميات. استكشف تطبيقاتها العديدة في قسم التطبيقات.

كيف يتم تنظيم مجموعة بيانات CIFAR-10؟

تنقسم مجموعة بيانات CIFAR-10 إلى مجموعتين فرعيتين رئيسيتين:

  1. مجموعة التدريب: تحتوي على 50,000 صورة مستخدمة لتدريب نماذج التعلم الآلي.
  2. مجموعة الاختبار: تتكون من 10,000 صورة لاختبار النماذج المدربة وقياسها.

تتألف كل مجموعة فرعية من صور مصنفة إلى 10 فئات، مع توفر شروحها بسهولة لتدريب النموذج وتقييمه. لمزيد من المعلومات التفصيلية، راجع قسم بنية مجموعة البيانات.

كيف يمكنني الاستشهاد بمجموعة بيانات CIFAR-10 في بحثي؟

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في مشاريعك البحثية أو التطويرية، تأكد من الاستشهاد بالورقة البحثية التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

يساعد الاعتراف بمنشئي مجموعة البيانات في دعم البحث والتطوير المستمر في هذا المجال. لمزيد من التفاصيل، انظر قسم الاقتباسات والشكر.

ما هي بعض الأمثلة العملية لاستخدام مجموعة بيانات CIFAR-10؟

غالبًا ما تُستخدم مجموعة بيانات CIFAR-10 لتدريب نماذج تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs). يمكن استخدام هذه النماذج في العديد من مهام الرؤية الحاسوبية بما في ذلك اكتشاف الأجسام، والتعرف على الصور، ووضع العلامات الآلية. للاطلاع على بعض الأمثلة العملية، راجع مقتطفات التعليمات البرمجية في قسم الاستخدام.



Created 2023-11-12, Updated 2024-07-12
Authors: RizwanMunawar (1), glenn-jocher (6)

التعليقات