MNISTデータセット
MNIST(ModifiedNational Institute of Standards and Technology)データセットは、様々な画像処理システムや機械学習モデルの学習によく使われる手書き数字の大規模データベースである。NISTのオリジナルデータセットからサンプルを「再ミックス」して作成され、画像分類アルゴリズムの性能を評価するベンチマークとなっている。
主な特徴
- MNISTには6万枚の学習用画像と1万枚のテスト用手書き数字画像が含まれている。
- データセットは28x28ピクセルのグレースケール画像からなる。
- 画像は28x28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理が施され、グレースケールのレベルが導入される。
- MNISTは、機械学習の分野、特に画像分類タスクの訓練とテストに広く使用されている。
データセット構造
MNISTデータセットは2つのサブセットに分割される:
- トレーニングセット:このサブセットには、機械学習モデルの学習に使用される手書き数字の画像6万枚が含まれている。
- テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。
拡張MNIST (EMNIST)
拡張MNIST(EMNIST)は、MNISTの後継としてNISTが開発・公開した新しいデータセットである。MNISTが手書き数字のみの画像を含んでいたのに対し、EMNISTは手書きの大文字、小文字、数字を含む大規模なデータベースであるNIST Special Database 19の全ての画像を含んでいる。EMNISTの画像は、MNISTの画像と同じプロセスで、同じ28x28ピクセルフォーマットに変換されている。従って、より古く、より小さいMNISTデータセットを扱うツールは、EMNISTでもそのまま使える可能性が高い。
アプリケーション
MNISTデータセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、画像分類タスクにおける深層学習モデルのトレーニングや評価に広く利用されています。このデータセットのシンプルで構造化されたフォーマットは、機械学習やコンピュータビジョンの分野の研究者や実務家にとって不可欠なリソースとなっています。
使用方法
MNISTデータセットで画像サイズ32x32のCNNモデルを100エポック学習させるには、以下のコード・スニペットを使うことができます。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。
列車の例
サンプル画像と注釈
MNISTデータセットには手書きの数字のグレースケール画像が含まれており、画像分類タスクに適したデータセットとなっている。以下にデータセットからの画像の例を示す:
この例は、MNISTデータセットに含まれる手書き数字の多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。
引用と謝辞
MNISTデータセットを使用する場合
研究または開発作業では、以下の論文を引用してください:
機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるMNISTデータセットを作成し、維持しているYann LeCun、Corinna Cortes、Christopher J.C. Burgesに感謝したい。MNISTデータセットとその作成者についての詳細は、MNISTデータセットのウェブサイトをご覧ください。