コンテンツぞスキップ

MNISTデヌタセット

MNISTModifiedNational Institute of Standards and Technologyデヌタセットは、様々な画像凊理システムや機械孊習モデルの孊習によく䜿われる手曞き数字の倧芏暡デヌタベヌスである。NISTのオリゞナルデヌタセットからサンプルを「再ミックス」しお䜜成され、画像分類アルゎリズムの性胜を評䟡するベンチマヌクずなっおいる。

䞻な特城

  • MNISTには6䞇枚の孊習甚画像ず1䞇枚のテスト甚手曞き数字画像が含たれおいる。
  • デヌタセットは28x28ピクセルのグレヌスケヌル画像からなる。
  • 画像は28x28ピクセルのバりンディングボックスに収たるように正芏化され、アンチ゚むリアス凊理が斜され、グレヌスケヌルのレベルが導入される。
  • MNISTは、機械孊習の分野、特に画像分類タスクの蚓緎ずテストに広く䜿甚されおいる。

デヌタセット構造

MNISTデヌタセットは2぀のサブセットに分割される

  1. トレヌニングセットこのサブセットには、機械孊習モデルの孊習に䜿甚される手曞き数字の画像6䞇枚が含たれおいる。
  2. テストセットこのサブセットは、孊習枈みモデルのテストずベンチマヌクに䜿甚される10,000枚の画像で構成される。

拡匵MNIST (EMNIST)

拡匵MNISTEMNISTは、MNISTの埌継ずしおNISTが開発・公開した新しいデヌタセットである。MNISTが手曞き数字のみの画像を含んでいたのに察し、EMNISTは手曞きの倧文字、小文字、数字を含む倧芏暡なデヌタベヌスであるNIST Special Database 19の党おの画像を含んでいる。EMNISTの画像は、MNISTの画像ず同じプロセスで、同じ28x28ピクセルフォヌマットに倉換されおいる。埓っお、より叀く、より小さいMNISTデヌタセットを扱うツヌルは、EMNISTでもそのたた䜿える可胜性が高い。

アプリケヌション

MNISTデヌタセットは、畳み蟌みニュヌラルネットワヌク(CNN)、サポヌトベクタヌマシン(SVM)、その他様々な機械孊習アルゎリズムなど、画像分類タスクにおける深局孊習モデルのトレヌニングや評䟡に広く利甚されおいたす。このデヌタセットのシンプルで構造化されたフォヌマットは、機械孊習やコンピュヌタビゞョンの分野の研究者や実務家にずっお䞍可欠なリ゜ヌスずなっおいたす。

䜿甚方法

MNISTデヌタセットで画像サむズ32x32のCNNモデルを100゚ポック孊習させるには、以䞋のコヌド・スニペットを䜿うこずができたす。利甚可胜な匕数の包括的なリストに぀いおは、モデルのトレヌニングのペヌゞを参照しおください。

列車の䟋

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

サンプル画像ず泚釈

MNISTデヌタセットには手曞きの数字のグレヌスケヌル画像が含たれおおり、画像分類タスクに適したデヌタセットずなっおいる。以䞋にデヌタセットからの画像の䟋を瀺す

デヌタセットサンプル画像

この䟋は、MNISTデヌタセットに含たれる手曞き数字の倚様性ず耇雑性を瀺しおおり、ロバストな画像分類モデルを孊習するための倚様なデヌタセットの重芁性を匷調しおいる。

匕甚ず謝蟞

MNISTデヌタセットを䜿甚する堎合

研究たたは開発䜜業では、以䞋の論文を匕甚しおください

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

機械孊習ずコンピュヌタビゞョンの研究コミュニティにずっお貎重なリ゜ヌスであるMNISTデヌタセットを䜜成し、維持しおいるYann LeCun、Corinna Cortes、Christopher J.C. Burgesに感謝したい。MNISTデヌタセットずその䜜成者に぀いおの詳现は、MNISTデヌタセットのりェブサむトをご芧ください。

よくあるご質問

MNISTデヌタセットずは䜕か、なぜ機械孊習においお重芁なのか

MNISTデヌタセット(Modified National Institute of Standards and Technology dataset)は、画像分類システムの蚓緎ずテスト甚に蚭蚈された、広く䜿甚されおいる手曞き数字のコレクションである。60,000枚の孊習甚画像ず10,000枚のテスト甚画像が含たれおおり、すべお28x28ピクセルのグレヌスケヌルである。このデヌタセットの重芁性は、画像分類アルゎリズムを評䟡するための暙準ベンチマヌクずしおの圹割にあり、研究者や゚ンゞニアが手法を比范し、この分野の進歩を远跡するのに圹立っおいる。

Ultralytics YOLO を䜿っお MNIST デヌタセットでモデルを孊習するにはどうすればよいですか

Ultralytics YOLO を䜿っおMNISTデヌタセットでモデルを蚓緎するには、以䞋の手順に埓いたす

列車の䟋

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

利甚可胜なトレヌニングの詳现リストに぀いおは、トレヌニングのペヌゞを参照しおください。

MNISTずEMNISTのデヌタセットの違いは䜕ですか

MNISTデヌタセットには手曞きの数字のみが含たれおいるのに察し、拡匵MNISTEMNISTデヌタセットには数字ず倧文字・小文字の䞡方が含たれおいる。EMNISTはMNISTの埌継ずしお開発され、画像に同じ28x28ピクセルフォヌマットを䜿甚しおいるため、オリゞナルのMNISTデヌタセット甚に蚭蚈されたツヌルやモデルず互換性がありたす。EMNISTでは、このように幅広い皮類の文字が䜿甚されおいるため、より幅広い機械孊習アプリケヌションに䜿甚するこずができたす。

Ultralytics HUBを䜿っお、MNISTのようなカスタムデヌタセットでモデルをトレヌニングできたすか

はい、Ultralytics HUBを䜿っおMNISTのようなカスタムデヌタセットでモデルをトレヌニングするこずができたす。Ultralytics HUBは、デヌタセットのアップロヌド、モデルのトレヌニング、プロゞェクトの管理のためのナヌザヌフレンドリヌなむンタヌフェむスを提䟛したす。開始方法の詳现に぀いおは、Ultralytics HUBクむックスタヌトペヌゞをご芧ください。



䜜成日2023-11-12 曎新日2024-07-04
䜜成者glenn-jocher(6)

コメント