MNIST Veri Kümesi
MNIST (Değiştirilmiş Ulusal Standartlar ve Teknoloji Enstitüsü) veri seti, çeşitli görüntü işleme sistemlerini ve makine öğrenimi modellerini eğitmek için yaygın olarak kullanılan, el yazısı rakamlardan oluşan geniş bir veri tabanıdır. NIST'in orijinal veri setlerinden örneklerin "yeniden karıştırılmasıyla" oluşturulmuştur ve görüntü sınıflandırma algoritmalarının performansını değerlendirmek için bir ölçüt haline gelmiştir.
Temel Özellikler
- MNIST, el yazısıyla yazılmış rakamların 60.000 eğitim görüntüsünü ve 10.000 test görüntüsünü içerir.
- Veri kümesi, 28×28 piksel boyutunda gri tonlamalı görüntülerden oluşmaktadır.
- Görüntüler, 28×28 piksellik bir sınırlayıcı kutuya sığacak şekilde normalleştirilir ve gri tonlama seviyelerini tanıtan kenar yumuşatma uygulanır.
- MNIST, özellikle görüntü sınıflandırma görevleri için makine öğrenimi alanında eğitim ve test için yaygın olarak kullanılmaktadır.
Veri Seti Yapısı
MNIST veri kümesi iki alt kümeye ayrılmıştır:
- Eğitim Seti: Bu alt küme, makine öğrenimi modellerini eğitmek için kullanılan 60.000 adet el yazısı rakam görüntüsü içerir.
- Test Kümesi: Bu alt küme, eğitilmiş modelleri test etmek ve kıyaslamak için kullanılan 10.000 görüntüden oluşur.
Veri Kümesine Erişim
- Orijinal dosyalar: Ön işleme üzerinde doğrudan kontrol sahibi olmak istiyorsanız, gzip arşivlerini Yann LeCun'un MNIST sayfasından indirin.
- Ultralytics yükleyicisi: Kullanın
data="mnist"(veyadata="mnist160"komutunuzda aşağıdaki alt küme için) ve veri seti otomatik olarak indirilecek, PNG'ye dönüştürülecek ve önbelleğe alınacaktır.
Veri kümesindeki her görüntü, karşılık gelen rakamla (0-9) etiketlenmiştir, bu da onu sınıflandırma görevleri için ideal bir denetimli öğrenme veri kümesi yapar.
Genişletilmiş MNIST (EMNIST)
Genişletilmiş MNIST (EMNIST), NIST tarafından MNIST'in halefi olması için geliştirilen ve yayınlanan daha yeni bir veri kümesidir. MNIST yalnızca el yazısıyla yazılmış rakamların görüntülerini içerirken, EMNIST, NIST Özel Veritabanı 19'daki tüm görüntüleri içerir; bu, el yazısıyla yazılmış büyük ve küçük harflerin yanı sıra rakamların da bulunduğu büyük bir veritabanıdır. EMNIST'deki görüntüler, MNIST görüntüleriyle aynı işlemle aynı 28×28 piksel biçimine dönüştürülmüştür. Buna göre, eski, daha küçük MNIST veri kümesiyle çalışan araçlar, EMNIST ile değiştirilmeden çalışabilir.
Uygulamalar
MNIST veri kümesi, Evrişimsel Sinir Ağları (CNN'ler), Destek Vektör Makineleri (SVM'ler) ve çeşitli diğer makine öğrenimi algoritmaları gibi görüntü sınıflandırma görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. Veri kümesinin basit ve iyi yapılandırılmış biçimi, onu makine öğrenimi ve bilgisayar görüşü alanındaki araştırmacılar ve uygulayıcılar için temel bir kaynak haline getirmektedir.
Bazı yaygın uygulamalar şunlardır:
- Yeni sınıflandırma algoritmalarını kıyaslama
- Makine öğrenimi kavramlarını öğretmek için eğitim amaçları
- Görüntü tanıma sistemlerinin prototipini oluşturma
- Model optimizasyon tekniklerini test etme
Kullanım
28×28 görüntü boyutuyla MNIST veri kümesinde bir CNN modelini 100 epoch için eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.
Eğitim Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Örnek Görüntüler ve Açıklamalar
MNIST veri kümesi, görüntü sınıflandırma görevleri için iyi yapılandırılmış bir veri kümesi sağlayan el yazısıyla yazılmış rakamların gri tonlamalı görüntülerini içerir. İşte veri kümesinden bazı görüntü örnekleri:

Bu örnek, MNIST veri kümesindeki el yazısıyla yazılmış rakamların çeşitliliğini ve karmaşıklığını sergileyerek, sağlam görüntü sınıflandırma modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.
Alıntılar ve Teşekkürler
Araştırma veya geliştirme çalışmalarınızda MNIST veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}
Makine öğrenimi ve bilgisayar görüşü araştırma topluluğu için değerli bir kaynak olan MNIST veri setini oluşturdukları ve sürdürdükleri için Yann LeCun, Corinna Cortes ve Christopher J.C. Burges'e teşekkür etmek isteriz. MNIST veri seti ve yaratıcıları hakkında daha fazla bilgi için MNIST veri seti web sitesini ziyaret edin.
MNIST160 Hızlı Testleri
Çok hızlı bir regresyon testine mi ihtiyacınız var? Ultralytics ayrıca şunu da sunar: data="mnist160", her bir rakam sınıfından ilk sekiz örneği içeren 160 görüntülük bir dilim. MNIST dizin yapısını yansıtır, böylece diğer argümanları değiştirmeden veri kümelerini değiştirebilirsiniz:
MNIST160 ile Eğitim Örneği
yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=5 imgsz=28
Bu alt kümeyi, 70.000 görüntülük tam veri kümesine geçmeden önce CI ardışık düzenleri veya temel kontroller için kullanın.
SSS
MNIST veri seti nedir ve makine öğreniminde neden önemlidir?
MNIST veri seti veya Değiştirilmiş Ulusal Standartlar ve Teknoloji Enstitüsü veri seti, görüntü sınıflandırma sistemlerini eğitmek ve test etmek için tasarlanmış, yaygın olarak kullanılan bir el yazısı rakamları koleksiyonudur. Tamamı gri tonlamalı ve 28×28 piksel boyutunda olan 60.000 eğitim görüntüsü ve 10.000 test görüntüsü içerir. Veri setinin önemi, görüntü sınıflandırma algoritmalarını değerlendirmek için standart bir ölçüt olarak oynadığı rolde yatmaktadır ve araştırmacıların ve mühendislerin yöntemleri karşılaştırmasına ve alandaki ilerlemeyi izlemesine yardımcı olmaktadır.
Ultralytics YOLO'yu MNIST veri kümesi üzerinde bir model eğitmek için nasıl kullanabilirim?
Ultralytics YOLO kullanarak MNIST veri kümesinde bir model eğitmek için şu adımları izleyebilirsiniz:
Eğitim Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Mevcut eğitim argümanlarının ayrıntılı bir listesi için Eğitim sayfasına bakın.
MNIST ve EMNIST veri setleri arasındaki fark nedir?
MNIST veri kümesi yalnızca el yazısıyla yazılmış rakamlar içerirken, Genişletilmiş MNIST (EMNIST) veri kümesi hem rakamları hem de büyük ve küçük harfleri içerir. EMNIST, MNIST'in halefi olarak geliştirildi ve görüntüler için aynı 28×28 piksel biçimini kullanarak orijinal MNIST veri kümesi için tasarlanmış araçlar ve modellerle uyumlu hale getirildi. EMNIST'deki bu daha geniş karakter aralığı, onu daha çeşitli makine öğrenimi uygulamaları için kullanışlı hale getirir.
Ultralytics HUB'ı MNIST gibi özel veri kümelerinde modelleri eğitmek için kullanabilir miyim?
Evet, MNIST gibi özel veri kümelerinde modelleri eğitmek için Ultralytics HUB'ı kullanabilirsiniz. Ultralytics HUB, kapsamlı kodlama bilgisine ihtiyaç duymadan veri kümelerini yüklemek, modelleri eğitmek ve projeleri yönetmek için kullanıcı dostu bir arayüz sunar. Başlamak için daha fazla ayrıntı için Ultralytics HUB Hızlı Başlangıç sayfasına göz atın.
MNIST, diğer görüntü sınıflandırma veri kümeleriyle nasıl karşılaştırılır?
MNIST, CIFAR-10 veya ImageNet gibi birçok modern veri kümesinden daha basittir, bu da onu yeni başlayanlar ve hızlı deneyler için ideal hale getirir. Daha karmaşık veri kümeleri, renkli görüntüler ve çeşitli nesne kategorileriyle daha büyük zorluklar sunarken, MNIST basitliği, küçük dosya boyutu ve makine öğrenimi algoritmalarının geliştirilmesindeki tarihi önemi nedeniyle değerini koruyor. Daha gelişmiş sınıflandırma görevleri için, aynı yapıyı koruyan ancak rakamlar yerine giyim eşyalarına sahip olan Fashion-MNIST'i kullanmayı düşünebilirsiniz.