İçeriğe geç

MNIST Veri Kümesi

MNIST (Değiştirilmiş Ulusal Standartlar ve Teknoloji Enstitüsü) veri kümesi, çeşitli görüntü işleme sistemlerini ve makine öğrenimi modellerini eğitmek için yaygın olarak kullanılan büyük bir el yazısı rakam veritabanıdır. NIST'in orijinal veri kümelerindeki örneklerin "yeniden karıştırılması" ile oluşturulmuştur ve görüntü sınıflandırma algoritmalarının performansını değerlendirmek için bir ölçüt haline gelmiştir.

Temel Özellikler

  • MNIST, el yazısı rakamlardan oluşan 60.000 eğitim görüntüsü ve 10.000 test görüntüsü içermektedir.
  • Veri kümesi 28x28 piksel boyutunda gri tonlamalı görüntülerden oluşmaktadır.
  • Görüntüler 28x28 piksellik bir sınırlayıcı kutuya sığacak şekilde normalleştirilir ve gri tonlama seviyeleri eklenerek kenar yumuşatması yapılır.
  • MNIST, özellikle görüntü sınıflandırma görevleri için makine öğrenimi alanında eğitim ve test için yaygın olarak kullanılmaktadır.

Veri Kümesi Yapısı

MNIST veri kümesi iki alt kümeye ayrılmıştır:

  1. Eğitim Seti: Bu alt küme, makine öğrenimi modellerini eğitmek için kullanılan 60.000 el yazısı rakam görüntüsü içerir.
  2. Test Kümesi: Bu alt küme, eğitilen modelleri test etmek ve kıyaslamak için kullanılan 10.000 görüntüden oluşur.

Genişletilmiş MNIST (EMNIST)

Genişletilmiş MNIST (EMNIST), NIST tarafından MNIST'in halefi olarak geliştirilen ve yayınlanan daha yeni bir veri setidir. MNIST yalnızca el yazısı rakamların görüntülerini içerirken, EMNIST el yazısı büyük ve küçük harflerin yanı sıra rakamlardan oluşan geniş bir veritabanı olan NIST Special Database 19'daki tüm görüntüleri içerir. EMNIST'teki görüntüler, MNIST görüntüleriyle aynı işlemden geçirilerek aynı 28x28 piksel formatına dönüştürülmüştür. Buna göre, daha eski ve daha küçük olan MNIST veri setiyle çalışan araçlar EMNIST ile muhtemelen değiştirilmeden çalışacaktır.

Uygulamalar

MNIST veri seti, görüntü sınıflandırma görevlerinde Evrişimli Sinir Ağları (CNN'ler), Destek Vektör Makineleri (SVM'ler) ve diğer çeşitli makine öğrenimi algoritmaları gibi derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. Veri setinin basit ve iyi yapılandırılmış formatı, onu makine öğrenimi ve bilgisayarla görme alanındaki araştırmacılar ve uygulayıcılar için önemli bir kaynak haline getirmektedir.

Kullanım

Bir CNN modelini 32x32 görüntü boyutunda 100 epok için MNIST veri kümesi üzerinde eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='mnist', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Örnek Görüntüler ve Açıklamalar

MNIST veri kümesi, el yazısı rakamların gri tonlamalı görüntülerini içerir ve görüntü sınıflandırma görevleri için iyi yapılandırılmış bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüsü

Bu örnek, MNIST veri kümesindeki el yazısı rakamların çeşitliliğini ve karmaşıklığını göstermekte ve sağlam görüntü sınıflandırma modellerini eğitmek için çeşitli veri kümelerinin önemini vurgulamaktadır.

Atıflar ve Teşekkür

Eğer MNIST veri setini kullanıyorsanız

araştırma veya geliştirme çalışması, lütfen aşağıdaki makaleye atıfta bulunun:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Yann LeCun, Corinna Cortes ve Christopher J.C. Burges'e makine öğrenimi ve bilgisayarla görme araştırma topluluğu için değerli bir kaynak olarak MNIST veri setini oluşturdukları ve sürdürdükleri için teşekkür ederiz. MNIST veri seti ve yaratıcıları hakkında daha fazla bilgi için MNIST veri seti web sitesini ziyaret edin.



Oluşturma 2023-11-12, Güncelleme 2023-11-22
Yazarlar: glenn-jocher (3)

Yorumlar