Meet YOLO26: next-gen vision AI.

Link to this sectionمجموعة بيانات MNIST#

تعد مجموعة بيانات MNIST (اختصار لـ Modified National Institute of Standards and Technology) قاعدة بيانات ضخمة للأرقام المكتوبة بخط اليد، وتُستخدم بشكل شائع لتدريب أنظمة معالجة الصور ونماذج تعلم الآلة المختلفة. تم إنشاؤها عن طريق "إعادة خلط" العينات من مجموعات بيانات NIST الأصلية، وأصبحت معياراً لتقييم أداء خوارزميات تصنيف الصور.

Link to this sectionالميزات الرئيسية#

  • تحتوي MNIST على 60,000 صورة تدريب و10,000 صورة اختبار للأرقام المكتوبة بخط اليد.
  • تتكون مجموعة البيانات من صور بتدرج الرمادي بحجم 28×28 بكسل.
  • يتم تطبيع الصور لتناسب صندوق إحاطة بحجم 28×28 بكسل مع استخدام تنعيم الحواف (anti-aliased)، مما يؤدي إلى ظهور مستويات تدرج الرمادي.
  • تُستخدم MNIST على نطاق واسع للتدريب والاختبار في مجال تعلم الآلة، وخاصة لمهام تصنيف الصور.

Link to this sectionهيكل مجموعة البيانات#

تنقسم مجموعة بيانات MNIST إلى مجموعتين فرعيتين:

  1. مجموعة التدريب: تحتوي هذه المجموعة الفرعية على 60,000 صورة لأرقام مكتوبة بخط اليد تُستخدم لتدريب نماذج تعلم الآلة.
  2. مجموعة الاختبار: تتكون هذه المجموعة الفرعية من 10,000 صورة تُستخدم لاختبار ومقارنة النماذج المدربة.

Link to this sectionالوصول إلى مجموعة البيانات#

  • الملفات الأصلية: قم بتنزيل أرشيفات gzip من أرشيف MNIST الأصلي إذا كنت ترغب في التحكم المباشر في المعالجة الأولية.
  • محمل Ultralytics: استخدم data="mnist" (أو data="mnist160" للمجموعة الفرعية أدناه) في أمرك، وسيتم تنزيل مجموعة البيانات وتحويلها إلى PNG وتخزينها مؤقتاً تلقائياً.

تم تصنيف كل صورة في مجموعة البيانات بالرقم المقابل (0-9)، مما يجعلها مجموعة بيانات تعلم خاضع للإشراف مثالية لمهام التصنيف.

Link to this sectionمجموعة بيانات MNIST الموسعة (EMNIST)#

مجموعة بيانات MNIST الموسعة (EMNIST) هي مجموعة بيانات أحدث طورتها وأصدرتها NIST لتكون خلفاً لـ MNIST. بينما تضمنت MNIST صوراً للأرقام المكتوبة بخط اليد فقط، تشمل EMNIST جميع الصور من قاعدة بيانات NIST الخاصة رقم 19، وهي قاعدة بيانات كبيرة للحروف الكبيرة والصغيرة المكتوبة بخط اليد بالإضافة إلى الأرقام. تم تحويل الصور في EMNIST إلى نفس تنسيق 28×28 بكسل، وبنفس العملية التي استُخدمت لصور MNIST. وبناءً على ذلك، من المحتمل أن تعمل الأدوات التي تعمل مع مجموعة بيانات MNIST القديمة والأصغر دون تعديل مع EMNIST.

Link to this sectionالتطبيقات#

تُستخدم مجموعة بيانات MNIST على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs)، وآلات ناقل الدعم (SVMs)، والعديد من خوارزميات تعلم الآلة الأخرى. إن التنسيق البسيط والمنظم جيداً لمجموعة البيانات يجعلها مورداً أساسياً للباحثين والممارسين في مجال تعلم الآلة والرؤية الحاسوبية.

تشمل بعض التطبيقات الشائعة ما يلي:

  • قياس أداء خوارزميات التصنيف الجديدة
  • أغراض تعليمية لتدريس مفاهيم تعلم الآلة
  • وضع نماذج أولية لأنظمة التعرف على الصور
  • اختبار تقنيات تحسين النماذج

Link to this sectionالاستخدام#

لتدريب نموذج CNN على مجموعة بيانات MNIST لمدة 100 حقبة بحجم صورة 28×28، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب للنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionصور وشروحات توضيحية عينة#

تحتوي مجموعة بيانات MNIST على صور بتدرج الرمادي لأرقام مكتوبة بخط اليد، مما يوفر مجموعة بيانات منظمة جيداً لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

عينات من مجموعة بيانات تصنيف الأرقام المكتوبة بخط اليد MNIST

يعرض المثال تنوع وتعقيد الأرقام المكتوبة بخط اليد في مجموعة بيانات MNIST، مما يسلط الضوء على أهمية مجموعة البيانات المتنوعة لتدريب نماذج تصنيف صور قوية.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات MNIST في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

نود أن نعرب عن تقديرنا لـ Yann LeCun وCorinna Cortes وChristopher J.C. Burges لإنشاء وصيانة مجموعة بيانات MNIST كمورد قيم لمجتمع أبحاث تعلم الآلة والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات MNIST ومبدعيها، قم بزيارة موقع مجموعة بيانات MNIST.

Link to this sectionاختبارات MNIST160 السريعة#

هل تحتاج إلى اختبار تراجع سريع للغاية؟ يوفر Ultralytics أيضاً data="mnist160"، وهي شريحة مكونة من 160 صورة تحتوي على أول ثماني صور لكل رقم (0-9) من كل من مجموعتي التدريب والاختبار. إنها تعكس هيكل دليل MNIST، لذا يمكنك تبديل مجموعات البيانات دون تغيير أي وسيطات أخرى:

مثال على التدريب باستخدام MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

استخدم هذه المجموعة الفرعية لخطوط أنابيب CI أو اختبارات السلامة قبل الالتزام بمجموعة البيانات الكاملة المكونة من 70,000 صورة.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات MNIST، ولماذا هي مهمة في تعلم الآلة؟#

مجموعة بيانات MNIST، أو مجموعة بيانات المعهد الوطني للمعايير والتكنولوجيا المعدلة، هي مجموعة مستخدمة على نطاق واسع من الأرقام المكتوبة بخط اليد مصممة لتدريب واختبار أنظمة تصنيف الصور. وهي تتضمن 60,000 صورة تدريب و10,000 صورة اختبار، وجميعها بتدرج رمادي وبحجم 28×28 بكسل. تكمن أهمية مجموعة البيانات في دورها كمعيار قياسي لتقييم خوارزميات تصنيف الصور، مما يساعد الباحثين والمهندسين على مقارنة الأساليب وتتبع التقدم في هذا المجال.

Link to this sectionكيف يمكنني استخدام Ultralytics YOLO لتدريب نموذج على مجموعة بيانات MNIST؟#

لتدريب نموذج على مجموعة بيانات MNIST باستخدام Ultralytics YOLO، يمكنك اتباع الخطوات التالية:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

للحصول على قائمة مفصلة بوسيطات التدريب المتاحة، ارجع إلى صفحة التدريب.

Link to this sectionما الفرق بين مجموعتي بيانات MNIST وEMNIST؟#

تحتوي مجموعة بيانات MNIST على أرقام مكتوبة بخط اليد فقط، في حين تتضمن مجموعة بيانات MNIST الموسعة (EMNIST) كلاً من الأرقام والحروف الكبيرة والصغيرة. تم تطوير EMNIST كخلف لـ MNIST وتستخدم نفس تنسيق 28×28 بكسل للصور، مما يجعلها متوافقة مع الأدوات والنماذج المصممة لمجموعة بيانات MNIST الأصلية. هذا النطاق الأوسع من الأحرف في EMNIST يجعلها مفيدة لمجموعة متنوعة من تطبيقات تعلم الآلة.

Link to this sectionهل يمكنني استخدام منصة Ultralytics لتدريب نماذج على مجموعات بيانات مخصصة مثل MNIST؟#

نعم، يمكنك استخدام منصة Ultralytics لتدريب نماذج على مجموعات بيانات مخصصة مثل MNIST. توفر منصة Ultralytics واجهة سهلة الاستخدام لتحميل مجموعات البيانات وتدريب النماذج وإدارة المشاريع دون الحاجة إلى معرفة برمجية واسعة. لمزيد من التفاصيل حول كيفية البدء، تحقق من صفحة بداية سريعة لمنصة Ultralytics.

Link to this sectionكيف تقارن MNIST بمجموعات بيانات تصنيف الصور الأخرى؟#

تعد MNIST أبسط من العديد من مجموعات البيانات الحديثة مثل CIFAR-10 أو ImageNet، مما يجعلها مثالية للمبتدئين والتجارب السريعة. بينما توفر مجموعات البيانات الأكثر تعقيداً تحديات أكبر مع الصور الملونة وفئات الكائنات المتنوعة، تظل MNIST ذات قيمة لبساطتها وحجم ملفها الصغير وأهميتها التاريخية في تطوير خوارزميات تعلم الآلة. لمهام تصنيف أكثر تقدماً، فكر في استخدام Fashion-MNIST، التي تحافظ على نفس الهيكل ولكنها تتميز بعناصر ملابس بدلاً من الأرقام.

التعليقات