تخطي إلى المحتوى

مجموعة بيانات CIFAR-10

مجموعة بيانات CIFAR-10 (المعهد الكندي للأبحاث المتقدمة) هي مجموعة من الصور المستخدمة على نطاق واسع في خوارزميات التعلم الآلي والرؤية الحاسوبية. وقد تم تطويرها من قبل باحثين في معهد CIFAR وتتكون من 60,000 صورة ملونة مقاس 32 × 32 في 10 فئات مختلفة.



شاهد: كيفية تدريب تصنيف الصور نموذج مع مجموعة بيانات CIFAR-10 باستخدام Ultralytics YOLO11

الميزات الرئيسية

  • تتكون مجموعة بيانات CIFAR-10 من 60,000 صورة مقسمة إلى 10 فئات.
  • يحتوي كل فصل على 6000 صورة، مقسمة إلى 5000 صورة للتدريب و1000 صورة للاختبار.
  • الصور ملونة وحجمها 32 × 32 بكسل.
  • تمثل الأصناف العشرة المختلفة الطائرات والسيارات والطيور والقطط والغزلان والكلاب والضفادع والضفادع والخيول والسفن والشاحنات.
  • يُستخدم CIFAR-10 بشكل شائع للتدريب والاختبار في مجال التعلم الآلي والرؤية الحاسوبية.

هيكلية مجموعة البيانات

تنقسم مجموعة بيانات CIFAR-10 إلى مجموعتين فرعيتين:

  1. مجموعة التدريب: تحتوي هذه المجموعة الفرعية على 50,000 صورة تُستخدم لتدريب نماذج التعلم الآلي.
  2. مجموعة الاختبار: تتألف هذه المجموعة الفرعية من 10,000 صورة تُستخدم لاختبار النماذج المدرّبة وقياسها.

التطبيقات

تُستخدم مجموعة بيانات CIFAR-10 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs) وخوارزميات التعلم الآلي الأخرى المختلفة. إن تنوع مجموعة البيانات من حيث الفئات ووجود الصور الملونة يجعلها مجموعة بيانات شاملة للبحث والتطوير في مجال التعلم الآلي والرؤية الحاسوبية.

الاستخدام

لتدريب نموذج YOLO على مجموعة بيانات CIFAR-10 لـ 100 حلقة تدريبية بحجم صورة 32 × 32، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.

مثال على القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات CIFAR-10 على صور ملونة لأجسام مختلفة، مما يوفر مجموعة بيانات جيدة التنظيم لمهام تصنيف الصور. فيما يلي بعض الأمثلة على صور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال تنوّع وتعقيد الكائنات في مجموعة بيانات CIFAR-10، مما يسلط الضوء على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج تصنيف الصور القوية.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في أعمال البحث أو التطوير الخاصة بك، يُرجى الاستشهاد بالورقة التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

نود أن نشكر أليكس كريزيفسكي على إنشاء مجموعة بيانات CIFAR-10 والحفاظ عليها كمصدر قيّم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. للمزيد من المعلومات حول مجموعة بيانات CIFAR-10 ومنشئها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات CIFAR-10.

الأسئلة الشائعة

كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات CIFAR-10؟

لتدريب نموذج YOLO على مجموعة بيانات CIFAR-10 باستخدام Ultralytics ، يمكنك اتباع الأمثلة المتوفرة لكل من Python و CLI. إليك مثال أساسي لتدريب نموذجك على 100 حلقة تدريبية بحجم صورة 32 × 32 بكسل:

مثال على ذلك

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

لمزيد من التفاصيل، ارجع إلى صفحة التدريب النموذجي.

ما هي السمات الرئيسية لمجموعة بيانات CIFAR-10؟

تتكون مجموعة بيانات CIFAR-10 من 60,000 صورة ملونة مقسمة إلى 10 فئات. تحتوي كل فئة على 6000 صورة، منها 5000 صورة للتدريب و1000 صورة للاختبار. يبلغ حجم الصور 32 × 32 بكسل وتتنوع عبر الفئات التالية:

  • الطائرات
  • السيارات
  • الطيور
  • القطط
  • الغزلان
  • الكلاب
  • الضفادع
  • الخيول
  • السفن
  • الشاحنات

تُعد مجموعة البيانات المتنوعة هذه ضرورية لتدريب نماذج تصنيف الصور في مجالات مثل التعلم الآلي والرؤية الحاسوبية. للمزيد من المعلومات، يرجى زيارة أقسام CIFAR-10 حول بنية مجموعة البيانات وتطبيقاتها.

لماذا استخدام مجموعة بيانات CIFAR-10 لمهام تصنيف الصور؟

تُعدّ مجموعة بيانات CIFAR-10 معيارًا ممتازًا لتصنيف الصور نظرًا لتنوعها وهيكلها. فهي تحتوي على مزيج متوازن من 60,000 صورة مصنفة في 10 فئات مختلفة، مما يساعد في تدريب نماذج قوية ومعممة. وهي تُستخدم على نطاق واسع لتقييم نماذج التعلُّم العميق، بما في ذلك الشبكات العصبية التلافيفية (CNNs) وخوارزميات التعلُّم الآلي الأخرى. مجموعة البيانات صغيرة نسبيًا، مما يجعلها مناسبة للتجريب السريع وتطوير الخوارزميات. استكشف تطبيقاتها العديدة في قسم التطبيقات.

كيف يتم تنظيم مجموعة بيانات CIFAR-10؟

تنقسم مجموعة بيانات CIFAR-10 إلى مجموعتين فرعيتين رئيسيتين:

  1. مجموعة التدريب: تحتوي على 50,000 صورة مستخدمة لتدريب نماذج التعلم الآلي.
  2. مجموعة الاختبار: تتكون من 10,000 صورة لاختبار النماذج المدربة وقياسها.

تتألف كل مجموعة فرعية من صور مصنفة إلى 10 فئات، مع توفر شروحها بسهولة لتدريب النموذج وتقييمه. لمزيد من المعلومات التفصيلية، راجع قسم بنية مجموعة البيانات.

كيف يمكنني الاستشهاد بمجموعة بيانات CIFAR-10 في بحثي؟

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في مشاريعك البحثية أو التطويرية، تأكد من الاستشهاد بالورقة البحثية التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

يساعد الاعتراف بمنشئي مجموعة البيانات في دعم البحث والتطوير المستمر في هذا المجال. لمزيد من التفاصيل، انظر قسم الاقتباسات والشكر.

ما هي بعض الأمثلة العملية لاستخدام مجموعة بيانات CIFAR-10؟

غالبًا ما تُستخدم مجموعة بيانات CIFAR-10 لتدريب نماذج تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs) وآلات دعم المتجهات (SVMs). يمكن استخدام هذه النماذج في العديد من مهام الرؤية الحاسوبية بما في ذلك اكتشاف الأجسام، والتعرف على الصور، ووضع العلامات الآلية. للاطلاع على بعض الأمثلة العملية، راجع مقتطفات التعليمات البرمجية في قسم الاستخدام.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 3 أشهر

التعليقات