MNIST データセット
MNISTは MNIST(Modified National Institute of Standards and Technology)データセットは、様々な画像処理システムや機械学習モデルの学習によく使われる手書き数字の大規模データベースである。NISTのオリジナルデータセットからサンプルを「再ミックス」して作成され、画像分類アルゴリズムの性能を評価するベンチマークとなっている。
主な特徴
- MNIST 6万枚の学習用画像と1万枚のテスト用手書き数字画像が含まれている。
- このデータセットは、28×28ピクセルのサイズのグレースケール画像で構成されています。
- 画像は28×28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理によりグレースケールレベルが導入されます。
- MNIST 、機械学習の分野、特に画像分類タスクの訓練とテストに広く使用されている。
データセットの構造
MNIST データセットは2つのサブセットに分割される:
- トレーニングセット: 機械学習モデルのトレーニングに使用される手書き数字の画像60,000枚が含まれています。
- テストセット:このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。
データセットへのアクセス
- オリジナルファイル:前処理を直接コントロールしたい場合は、Yann LeCunのMNIST ページからgzipアーカイブをダウンロードしてください。
- Ultralytics: 以下を使用
data="mnist"(またはdata="mnist160"のサブセット)をコマンドに追加すると、データセットがダウンロードされ、PNGに変換され、自動的にキャッシュされます。
データセット内の各画像には、対応する数字(0〜9)のラベルが付けられているため、分類タスクに最適な教師あり学習データセットになります。
拡張MNIST (EMNIST)
拡張MNIST (EMNIST)は、MNIST後継としてNISTが開発・公開した新しいデータセットである。MNIST 手書き数字のみの画像を含んでいたのに対し、EMNISTは手書きの大文字、小文字、数字を含む大規模なデータベースであるNIST Special Database 19の全ての画像を含んでいる。EMNISTの画像は、MNIST 画像と同じプロセスで、同じ28×28ピクセルのフォーマットに変換されている。従って、より古く、より小さいMNIST データセットを扱うツールは、EMNISTでもそのまま使える可能性が高い。
アプリケーション
MNIST データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、画像分類タスクにおけるディープラーニングモデルのトレーニングや評価に広く利用されています。このデータセットのシンプルで構造化されたフォーマットは、機械学習や コンピュータビジョンの分野の研究者や実務家にとって不可欠なリソースとなっています。
一般的なアプリケーションには、以下が含まれます。
- 新しい分類アルゴリズムのベンチマーク
- 機械学習の概念を教えるための教育目的
- 画像認識システムのプロトタイピング
- モデル最適化手法のテスト
使用法
MNIST データセットで画像サイズ28×28のCNNモデルを100エポック学習させるには、以下のコード・スニペットを使うことができます。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
サンプル画像とアノテーション
MNIST データセットには手書きの数字のグレースケール画像が含まれており、画像分類タスクに適したデータセットとなっている。以下にデータセットからの画像の例を示す:

この例は、MNIST データセットに含まれる手書き数字の多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。
引用と謝辞
研究開発でMNIST データセットを使用する場合は、以下の論文を引用してください:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}
機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるMNIST データセットを作成し、維持しているYann LeCun、Corinna Cortes、Christopher J.C. Burgesに感謝したい。MNIST データセットとその作成者についての詳細は、MNIST データセットのウェブサイトをご覧ください。
MNIST160クイックテスト
軽快なリグレッションテストが必要ですか?Ultralytics また data="mnist160"は、各数字クラスからの最初の8つのサンプルを含む160画像のスライスです。これはMNISTのディレクトリ構造を反映しているため、他の引数を変更せずにデータセットを入れ替えることができます。
MNIST160を使用した学習例
yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=5 imgsz=28
このサブセットは、CIパイプラインや、70,000画像の完全なデータセットにコミットする前のサニティチェックに使用する。
よくある質問
MNIST データセットとは何か、なぜ機械学習において重要なのか?
MNISTは MNISTMNISTデータセット(Modified National Institute of Standards and Technology dataset)は、画像分類システムのトレーニングおよびテスト用に設計された、広く使用されている手書き数字のコレクションである。60,000枚の学習用画像と10,000枚のテスト用画像が含まれており、すべて28×28ピクセルのグレースケールである。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準ベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、この分野の進歩をtrack のに役立っている。
Ultralytics YOLO 使用して、MNIST データセットでモデルをトレーニングするにはどうすればよいですか?
Ultralytics YOLO使用してMNIST データセットでモデルを訓練するには、以下の手順に従います:
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。
MNIST EMNISTのデータセットの違いは何ですか?
MNIST データセットには手書きの数字のみが含まれているのに対し、拡張MNIST (EMNIST)データセットには数字と大文字・小文字の両方が含まれている。EMNISTはMNIST 後継として開発され、画像に同じ28×28ピクセルのフォーマットを使用しているため、オリジナルのMNIST データセット用に設計されたツールやモデルと互換性があります。EMNISTでは、このように幅広い種類の文字が使用されているため、より幅広い機械学習アプリケーションに使用することができます。
Ultralytics HUBを使用して、MNISTようなカスタムデータセットでモデルをトレーニングできますか?
はい、Ultralytics HUBを使って MNISTようなカスタムデータセットでモデルをトレーニングすることができます。Ultralytics HUBは、データセットのアップロード、モデルのトレーニング、プロジェクトの管理を行うためのユーザーフレンドリーなインターフェースを提供しています。開始方法の詳細については、Ultralytics HUBのクイックスタートページをご覧ください。
MNIST 他の画像分類データセットと比べてどうですか?
MNIST 、CIFAR-10やImageNetのような最新のデータセットよりも単純である。 ImageNetのような最新のデータセットよりもシンプルであり、初心者や迅速な実験に最適です。より複雑なデータセットでは、カラー画像や多様なオブジェクトのカテゴリなど、より大きな課題が提供されますが、MNIST 、そのシンプルさ、小さなファイルサイズ、機械学習アルゴリズムの開発における歴史的重要性から、依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら、数字の代わりに衣服のアイテムを特徴とするMNIST-MNISTの使用を検討してください。