コンテンツへスキップ

MNISTデータセット

MNIST(ModifiedNational Institute of Standards and Technology)データセットは、様々な画像処理システムや機械学習モデルの学習によく使われる手書き数字の大規模データベースである。NISTのオリジナルデータセットからサンプルを「再ミックス」して作成され、画像分類アルゴリズムの性能を評価するベンチマークとなっている。

主な特徴

  • MNISTには6万枚の学習用画像と1万枚のテスト用手書き数字画像が含まれている。
  • データセットは28×28ピクセルのグレースケール画像からなる。
  • 画像は28×28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理が施され、グレースケールのレベルが導入される。
  • MNISTは、機械学習の分野、特に画像分類タスクの訓練とテストに広く使用されている。

データセット構造

MNISTデータセットは2つのサブセットに分割される:

  1. トレーニングセット:このサブセットには、機械学習モデルの学習に使用される手書き数字の画像6万枚が含まれている。
  2. テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。

データセットの各画像は対応する数字(0~9)でラベル付けされており、分類タスクに最適な教師あり学習データセットとなっている。

拡張MNIST (EMNIST)

拡張MNIST(EMNIST)は、MNISTの後継としてNISTが開発・公開した新しいデータセットである。MNISTが手書き数字のみの画像を含んでいたのに対し、EMNISTは手書きの大文字、小文字、数字を含む大規模なデータベースであるNIST Special Database 19の全ての画像を含んでいる。EMNISTの画像は、MNISTの画像と同じプロセスで、同じ28×28ピクセルのフォーマットに変換されている。従って、より古く、より小さいMNISTデータセットを扱うツールは、EMNISTでもそのまま使える可能性が高い。

アプリケーション

MNISTデータセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、画像分類タスクにおけるディープラーニングモデルのトレーニングや評価に広く利用されています。このデータセットのシンプルで構造化されたフォーマットは、機械学習や コンピュータビジョンの分野の研究者や実務家にとって不可欠なリソースとなっています。

一般的な用途としては、以下のようなものがある:

  • 新しい分類アルゴリズムのベンチマーク
  • 機械学習の概念を教える教育目的
  • 画像認識システムのプロトタイピング
  • モデル最適化技術のテスト

使用方法

MNISTデータセットで画像サイズ32×32のCNNモデルを100エポック学習させるには、以下のコード・スニペットを使うことができます。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

サンプル画像と注釈

MNISTデータセットには手書きの数字のグレースケール画像が含まれており、画像分類タスクに適したデータセットとなっている。以下にデータセットからの画像の例を示す:

データセットサンプル画像

この例は、MNISTデータセットに含まれる手書き数字の多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

研究開発でMNISTデータセットを使用する場合は、以下の論文を引用してください:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるMNISTデータセットを作成し、維持しているYann LeCun、Corinna Cortes、Christopher J.C. Burgesに感謝したい。MNISTデータセットとその作成者についての詳細は、MNISTデータセットのウェブサイトをご覧ください。

よくあるご質問

MNISTデータセットとは何か、なぜ機械学習において重要なのか?

MNISTデータセット(Modified National Institute of Standards and Technology dataset)は、画像分類システムの訓練とテスト用に設計された、広く使用されている手書き数字のコレクションである。60,000枚の学習用画像と10,000枚のテスト用画像が含まれており、すべて28×28ピクセルのグレースケールである。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準ベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、この分野の進歩を追跡するのに役立っている。

Ultralytics YOLO を使って MNIST データセットでモデルを学習するにはどうすればよいですか?

Ultralytics YOLO を使ってMNISTデータセットでモデルを訓練するには、以下の手順に従います:

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

利用可能なトレーニングの詳細リストについては、トレーニングのページを参照してください。

MNISTとEMNISTのデータセットの違いは何ですか?

MNISTデータセットには手書きの数字のみが含まれているのに対し、拡張MNIST(EMNIST)データセットには数字と大文字・小文字の両方が含まれている。EMNISTはMNISTの後継として開発され、画像に同じ28×28ピクセルのフォーマットを使用しているため、オリジナルのMNISTデータセット用に設計されたツールやモデルと互換性があります。EMNISTでは、このように幅広い種類の文字が使用されているため、より幅広い機械学習アプリケーションに使用することができます。

Ultralytics HUBを使って、MNISTのようなカスタムデータセットでモデルをトレーニングできますか?

はい、Ultralytics HUBを使ってMNISTのようなカスタムデータセットでモデルをトレーニングすることができます。Ultralytics HUBは、データセットのアップロード、モデルのトレーニング、プロジェクトの管理を行うためのユーザーフレンドリーなインターフェースを提供しています。開始方法の詳細については、Ultralytics HUBのクイックスタートページをご覧ください。

MNISTは他の画像分類データセットと比べてどうですか?

MNISTは、CIFAR-10や ImageNetのような多くの最新のデータセットよりもシンプルで、初心者や迅速な実験に最適です。より複雑なデータセットでは、カラー画像や多様なオブジェクトのカテゴリなど、より大きな課題が提供されますが、MNISTは、そのシンプルさ、小さなファイルサイズ、機械学習アルゴリズムの開発における歴史的重要性から、依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら、数字の代わりに衣服のアイテムを特徴とするFashion-MNISTの使用を検討してください。

📅作成:1年前 ✏️更新しました 8日前

コメント