MNIST Veri Kümesi

MNIST (Modified National Institute of Standards and Technology) veri kümesi, çeşitli görüntü işleme sistemlerini ve makine öğrenimi modellerini eğitmek için yaygın olarak kullanılan, el yazısı rakamlardan oluşan geniş bir veritabanıdır. NIST'in orijinal veri kümelerinden alınan örneklerin "yeniden karıştırılmasıyla" oluşturulmuştur ve görüntü sınıflandırma algoritmalarının performansını değerlendirmek için bir ölçüt haline gelmiştir.

Temel Özellikler

  • MNIST, el yazısı rakamlara ait 60.000 eğitim görüntüsü ve 10.000 test görüntüsü içerir.
  • Veri kümesi, 28×28 piksel boyutunda gri tonlamalı görüntülerden oluşur.
  • Görüntüler, 28×28 piksellik bir sınırlayıcı kutuya sığacak şekilde normalleştirilmiş ve gri tonlama seviyeleri eklenerek kenar yumuşatma (anti-aliased) işleminden geçirilmiştir.
  • MNIST, özellikle görüntü sınıflandırma görevleri olmak üzere makine öğrenimi alanında eğitim ve test için yaygın olarak kullanılır.

Veri Kümesi Yapısı

MNIST veri kümesi iki alt kümeye ayrılmıştır:

  1. Eğitim Kümesi: Bu alt küme, makine öğrenimi modellerini eğitmek için kullanılan 60.000 el yazısı rakam görüntüsü içerir.
  2. Test Kümesi: Bu alt küme, eğitilmiş modelleri test etmek ve kıyaslamak için kullanılan 10.000 görüntüden oluşur.

Veri Kümesine Erişim

  • Orijinal dosyalar: Ön işleme üzerinde doğrudan kontrol sahibi olmak istiyorsan, gzip arşivlerini orijinal MNIST arşivinden indirebilirsin.
  • Ultralytics yükleyicisi: Komutunda data="mnist" (veya aşağıdaki alt küme için data="mnist160") kullan; veri kümesi otomatik olarak indirilecek, PNG formatına dönüştürülecek ve önbelleğe alınacaktır.

Veri kümesindeki her görüntü, ilgili rakamla (0-9) etiketlenmiştir; bu da onu sınıflandırma görevleri için ideal, denetimli bir öğrenme veri kümesi haline getirir.

Genişletilmiş MNIST (EMNIST)

Genişletilmiş MNIST (EMNIST), NIST tarafından MNIST'in halefi olması amacıyla geliştirilen ve yayınlanan daha yeni bir veri kümesidir. MNIST yalnızca el yazısı rakamların görüntülerini içerirken, EMNIST, NIST Özel Veritabanı 19'daki tüm görüntüleri içerir; bu da el yazısı büyük ve küçük harflerin yanı sıra rakamlardan oluşan geniş bir veritabanıdır. EMNIST'teki görüntüler, MNIST görüntüleriyle aynı işlemle, aynı 28×28 piksel formatına dönüştürülmüştür. Buna göre, eski ve daha küçük MNIST veri kümesiyle çalışan araçlar, muhtemelen EMNIST ile de hiçbir değişiklik yapılmadan çalışacaktır.

Uygulamalar

The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.

Bazı yaygın kullanım alanları şunlardır:

  • Yeni sınıflandırma algoritmalarını kıyaslama (benchmarking)
  • Makine öğrenimi kavramlarını öğretmek için eğitim amaçlı kullanım
  • Görüntü tanıma sistemleri için prototip oluşturma
  • Model optimizasyon tekniklerini test etme

Kullanım

28×28 görüntü boyutuyla 100 dönem boyunca MNIST veri kümesi üzerinde bir CNN modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut argümanların kapsamlı bir listesi için Eğitim sayfası modeline başvur.

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Örnek Görüntüler ve Ek Açıklamalar

MNIST veri kümesi, görüntü sınıflandırma görevleri için iyi yapılandırılmış bir veri kümesi sağlayan el yazısı rakamların gri tonlamalı görüntülerini içerir. İşte veri kümesinden bazı görüntü örnekleri:

MNIST el yazısı rakam sınıflandırma veri kümesi örnekleri

Örnek, MNIST veri kümesindeki el yazısı rakamların çeşitliliğini ve karmaşıklığını sergileyerek, sağlam görüntü sınıflandırma modelleri eğitmek için çeşitli bir veri kümesinin önemini vurgular.

Alıntılar ve Teşekkür

MNIST veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen şu makaleye atıfta bulun:

Alıntı
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

MNIST veri kümesini makine öğrenimi ve bilgisayarlı görü araştırma topluluğu için değerli bir kaynak olarak oluşturdukları ve sürdürdükleri için Yann LeCun, Corinna Cortes ve Christopher J.C. Burges'a teşekkür ederiz. MNIST veri kümesi ve yaratıcıları hakkında daha fazla bilgi için MNIST veri kümesi web sitesini ziyaret et.

MNIST160 Hızlı Testleri

Yıldırım hızında bir regresyon testine mi ihtiyacın var? Ultralytics ayrıca, her rakam sınıfından ilk sekiz örneği içeren 160 görüntülük bir dilim olan data="mnist160" seçeneğini de sunar. MNIST dizin yapısını aynen yansıtır, böylece başka hiçbir argümanı değiştirmeden veri kümelerini değiştirebilirsin:

MNIST160 ile Eğitim Örneği
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Bu alt kümeyi, 70.000 görüntüden oluşan tam veri kümesine geçmeden önce CI işlem hatları veya sistem doğruluğu kontrolleri için kullan.

SSS

MNIST veri kümesi nedir ve makine öğreniminde neden önemlidir?

MNIST veri kümesi veya Modified National Institute of Standards and Technology veri kümesi, görüntü sınıflandırma sistemlerini eğitmek ve test etmek için tasarlanmış, yaygın olarak kullanılan bir el yazısı rakam koleksiyonudur. Tamamı gri tonlamalı ve 28×28 piksel boyutunda 60.000 eğitim görüntüsü ve 10.000 test görüntüsü içerir. Veri kümesinin önemi, görüntü sınıflandırma algoritmalarını değerlendirmek için standart bir ölçüt olarak hizmet etmesinden kaynaklanır ve araştırmacıların ve mühendislerin yöntemleri karşılaştırmasına ve alandaki ilerlemeyi takip etmesine yardımcı olur.

Ultralytics YOLO kullanarak MNIST veri kümesi üzerinde bir modeli nasıl eğitebilirim?

Ultralytics YOLO kullanarak MNIST veri kümesi üzerinde bir model eğitmek için şu adımları takip edebilirsin:

Eğitim Örneği
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Mevcut eğitim argümanlarının ayrıntılı listesi için Eğitim sayfasına başvur.

MNIST ve EMNIST veri kümeleri arasındaki fark nedir?

MNIST veri kümesi yalnızca el yazısı rakamlar içerirken, Genişletilmiş MNIST (EMNIST) veri kümesi hem rakamları hem de büyük ve küçük harfleri içerir. EMNIST, MNIST'in halefi olarak geliştirilmiştir ve görüntüler için aynı 28×28 piksel formatını kullanır, bu da onu orijinal MNIST veri kümesi için tasarlanmış araçlar ve modellerle uyumlu hale getirir. EMNIST'teki bu daha geniş karakter yelpazesi, onu daha çeşitli makine öğrenimi uygulamaları için kullanışlı kılar.

Ultralytics Platform'u MNIST gibi özel veri kümeleri üzerinde modeller eğitmek için kullanabilir miyim?

Evet, MNIST gibi özel veri kümeleri üzerinde modeller eğitmek için Ultralytics Platform kullanabilirsin. Ultralytics Platform, kapsamlı kodlama bilgisine ihtiyaç duymadan veri kümelerini yüklemek, modelleri eğitmek ve projeleri yönetmek için kullanıcı dostu bir arayüz sunar. Başlamak hakkında daha fazla ayrıntı için Ultralytics Platform Hızlı Başlangıç sayfasına göz at.

MNIST, diğer görüntü sınıflandırma veri kümeleriyle nasıl kıyaslanır?

MNIST, CIFAR-10 veya ImageNet gibi birçok modern veri kümesinden daha basittir, bu da onu yeni başlayanlar ve hızlı denemeler için ideal hale getirir. Daha karmaşık veri kümeleri renkli görüntüler ve çeşitli nesne kategorileriyle daha büyük zorluklar sunsa da, MNIST basitliği, küçük dosya boyutu ve makine öğrenimi algoritmalarının geliştirilmesindeki tarihsel önemi nedeniyle değerli olmaya devam etmektedir. Daha gelişmiş sınıflandırma görevleri için, aynı yapıyı koruyan ancak rakamlar yerine giyim eşyaları içeren Fashion-MNIST kullanmayı düşünebilirsin.

Yorumlar