مجموعة بيانات MNIST

تُعد مجموعة بيانات MNIST (المعهد الوطني المعدل للمعايير والتقنية) قاعدة بيانات ضخمة للأرقام المكتوبة بخط اليد، وتُستخدم بشكل شائع لتدريب العديد من أنظمة معالجة الصور ونماذج تعلم الآلة. تم إنشاؤها عن طريق "إعادة خلط" العينات من مجموعات بيانات NIST الأصلية، وأصبحت معياراً لتقييم أداء خوارزميات تصنيف الصور.

الميزات الرئيسية

  • تحتوي MNIST على 60,000 صورة تدريب و10,000 صورة اختبار للأرقام المكتوبة بخط اليد.
  • تتكون مجموعة البيانات من صور بتدرج رمادي بحجم 28×28 بكسل.
  • يتم تطبيع الصور لتناسب مربع إحاطة بحجم 28×28 بكسل مع تحسين الحواف، مما يؤدي إلى إدخال مستويات تدرج رمادي.
  • تُستخدم MNIST على نطاق واسع للتدريب والاختبار في مجال تعلم الآلة، وخاصة لمهام تصنيف الصور.

هيكل مجموعة البيانات

تنقسم مجموعة بيانات MNIST إلى مجموعتين فرعيتين:

  1. مجموعة التدريب: تحتوي هذه المجموعة الفرعية على 60,000 صورة لأرقام مكتوبة بخط اليد تُستخدم لتدريب نماذج تعلم الآلة.
  2. مجموعة الاختبار: تتكون هذه المجموعة الفرعية من 10,000 صورة تُستخدم لاختبار وتقييم النماذج المدربة.

الوصول إلى مجموعة البيانات

  • الملفات الأصلية: قم بتنزيل أرشيفات gzip من أرشيف MNIST الأصلي إذا كنت ترغب في تحكم مباشر في المعالجة المسبقة.
  • أداة التحميل من Ultralytics: استخدم data="mnist" (أو data="mnist160" للمجموعة الفرعية أدناه) في أمرك وسيتم تنزيل مجموعة البيانات وتحويلها إلى تنسيق PNG وتخزينها مؤقتاً تلقائياً.

كل صورة في مجموعة البيانات مصنفة بالرقم المقابل (0-9)، مما يجعلها مجموعة بيانات تعلم خاضع للإشراف مثالية لمهام التصنيف.

مجموعة MNIST الموسعة (EMNIST)

مجموعة MNIST الموسعة (EMNIST) هي مجموعة بيانات أحدث تم تطويرها وإصدارها من قبل NIST لتكون خليفة لـ MNIST. بينما تضمنت MNIST صوراً للأرقام المكتوبة بخط اليد فقط، تتضمن EMNIST جميع الصور من قاعدة بيانات NIST الخاصة رقم 19، وهي قاعدة بيانات ضخمة للحروف المكتوبة بخط اليد الكبيرة والصغيرة بالإضافة إلى الأرقام. تم تحويل الصور في EMNIST إلى نفس تنسيق 28×28 بكسل، بنفس العملية، كما كان الحال مع صور MNIST. وبناءً على ذلك، فإن الأدوات التي تعمل مع مجموعة بيانات MNIST القديمة والأصغر ستعمل على الأرجح دون تعديل مع EMNIST.

التطبيقات

تُستخدم مجموعة بيانات MNIST على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs)، وآلات ناقل الدعم (SVMs)، والعديد من خوارزميات تعلم الآلة الأخرى. يجعل التنسيق البسيط والمنظم لمجموعة البيانات منها مورداً أساسياً للباحثين والممارسين في مجال تعلم الآلة ورؤية الحاسوب.

تشمل بعض التطبيقات الشائعة ما يلي:

  • مقارنة خوارزميات التصنيف الجديدة
  • الأغراض التعليمية لتدريس مفاهيم تعلم الآلة
  • نماذج أولية لأنظمة التعرف على الصور
  • اختبار تقنيات تحسين النماذج

الاستخدام

لتدريب نموذج CNN على مجموعة بيانات MNIST لـ 100 حقبة بحجم صورة 28×28، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب للنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

صور وعينات تعليقات توضيحية

تحتوي مجموعة بيانات MNIST على صور بتدرج رمادي لأرقام مكتوبة بخط اليد، مما يوفر مجموعة بيانات منظمة جيداً لمهام تصنيف الصور. فيما يلي بعض الأمثلة للصور من مجموعة البيانات:

عينات من مجموعة بيانات تصنيف الأرقام المكتوبة بخط اليد MNIST

يعرض المثال تنوع وتعقيد الأرقام المكتوبة بخط اليد في مجموعة بيانات MNIST، مما يسلط الضوء على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج تصنيف صور قوية.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات MNIST في بحثك أو عملك التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

نود أن نعرب عن تقديرنا لـ Yann LeCun وCorinna Cortes وChristopher J.C. Burges لإنشاء وصيانة مجموعة بيانات MNIST كمورد قيم لمجتمع أبحاث تعلم الآلة ورؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات MNIST ومبتكريها، تفضل بزيارة موقع مجموعة بيانات MNIST.

اختبارات سريعة لـ MNIST160

هل تحتاج إلى اختبار انحدار سريع جداً؟ توفر Ultralytics أيضاً data="mnist160"، وهي شريحة تحتوي على 160 صورة تضم العينات الثماني الأولى من كل فئة رقم. وهي تعكس هيكل دليل MNIST، لذا يمكنك تبديل مجموعات البيانات دون تغيير أي وسيطات أخرى:

مثال تدريب مع MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

استخدم هذه المجموعة الفرعية لخطوط أنابيب CI أو فحوصات السلامة قبل الالتزام بمجموعة البيانات الكاملة المكونة من 70,000 صورة.

الأسئلة الشائعة

ما هي مجموعة بيانات MNIST، ولماذا هي مهمة في تعلم الآلة؟

مجموعة بيانات MNIST، أو مجموعة بيانات المعهد الوطني المعدل للمعايير والتقنية، هي مجموعة مستخدمة على نطاق واسع من الأرقام المكتوبة بخط اليد المصممة لتدريب واختبار أنظمة تصنيف الصور. وهي تتضمن 60,000 صورة تدريب و10,000 صورة اختبار، جميعها بتدرج رمادي وبحجم 28×28 بكسل. تكمن أهمية مجموعة البيانات في دورها كمعيار قياسي لتقييم خوارزميات تصنيف الصور، مما يساعد الباحثين والمهندسين على مقارنة الأساليب وتتبع التقدم في هذا المجال.

كيف يمكنني استخدام Ultralytics YOLO لتدريب نموذج على مجموعة بيانات MNIST؟

لتدريب نموذج على مجموعة بيانات MNIST باستخدام Ultralytics YOLO، يمكنك اتباع الخطوات التالية:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

للحصول على قائمة مفصلة بوسيطات التدريب المتاحة، راجع صفحة التدريب.

ما الفرق بين مجموعتي بيانات MNIST وEMNIST؟

تحتوي مجموعة بيانات MNIST على أرقام مكتوبة بخط اليد فقط، في حين تتضمن مجموعة بيانات MNIST الموسعة (EMNIST) كلاً من الأرقام والحروف الكبيرة والصغيرة. تم تطوير EMNIST كخليفة لـ MNIST وتستخدم نفس تنسيق 28×28 بكسل للصور، مما يجعلها متوافقة مع الأدوات والنماذج المصممة لمجموعة بيانات MNIST الأصلية. هذا النطاق الأوسع من الأحرف في EMNIST يجعلها مفيدة لمجموعة متنوعة من تطبيقات تعلم الآلة.

هل يمكنني استخدام منصة Ultralytics لتدريب النماذج على مجموعات بيانات مخصصة مثل MNIST؟

نعم، يمكنك استخدام منصة Ultralytics لتدريب النماذج على مجموعات بيانات مخصصة مثل MNIST. توفر منصة Ultralytics واجهة سهلة الاستخدام لتحميل مجموعات البيانات، وتدريب النماذج، وإدارة المشاريع دون الحاجة إلى معرفة برمجية واسعة. لمزيد من التفاصيل حول كيفية البدء، راجع صفحة دليل البدء السريع لمنصة Ultralytics.

كيف تقارن MNIST بمجموعات بيانات تصنيف الصور الأخرى؟

تعتبر MNIST أبسط من العديد من مجموعات البيانات الحديثة مثل CIFAR-10 أو ImageNet، مما يجعلها مثالية للمبتدئين والتجارب السريعة. في حين تقدم مجموعات البيانات الأكثر تعقيداً تحديات أكبر مع الصور الملونة وفئات الكائنات المتنوعة، تظل MNIST قيمة لبساطتها وصغر حجم ملفاتها وأهميتها التاريخية في تطوير خوارزميات تعلم الآلة. لمهام تصنيف أكثر تقدماً، فكر في استخدام Fashion-MNIST، التي تحافظ على نفس البنية ولكنها تتميز بعناصر ملابس بدلاً من الأرقام.

التعليقات