MNISTデータセット

Q: What is the MNIST dataset, and why is it important in machine learning?

MNISTデータセット（Modified National Institute of Standards and Technologyデータセット）は、画像分類システムのトレーニングとテストのために設計された、手書き数字の広く使用されているコレクションです。これには60,000枚のトレーニング画像と10,000枚のテスト画像が含まれており、すべてグレースケールで28×28ピクセルサイズです。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準的なベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、この分野の進捗をtrackするのに役立っています。

Q: How can I use Ultralytics YOLO to train a model on the MNIST dataset?

Ultralytics YOLOを使用してMNISTデータセットでモデルをトレーニングするには、以下の手順に従ってください。利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。

Q: How does MNIST compare to other image classification datasets?

MNISTはCIFAR-10やImageNetのような多くの現代的なデータセットよりもシンプルであり、初心者や迅速な実験に理想的です。より複雑なデータセットはカラー画像や多様なオブジェクトカテゴリでより大きな課題を提供しますが、MNISTはそのシンプルさ、小さなファイルサイズ、および機械学習アルゴリズムの開発における歴史的意義のために依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら数字の代わりに衣料品を特徴とするFashion-MNISTの使用を検討してください。

The MNIST (Modified National Institute of Standards and Technology)データセットは、さまざまな画像処理システムや機械学習モデルのトレーニングに一般的に使用される手書き数字の大規模なデータベースです。これはNISTの元のデータセットからのサンプルを「再混合」することによって作成され、画像分類アルゴリズムの性能を評価するためのベンチマークとなっています。

主な特徴

MNISTには、手書き数字の60,000枚のトレーニング画像と10,000枚のテスト画像が含まれています。
このデータセットは、28×28ピクセルのサイズのグレースケール画像で構成されています。
画像は28×28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理によりグレースケールレベルが導入されます。
MNISTは、機械学習の分野、特に画像分類タスクにおけるトレーニングとテストに広く使用されています。

データセットの構造

MNISTデータセットは以下の2つのサブセットに分割されます。

トレーニングセット: 機械学習モデルのトレーニングに使用される手書き数字の画像60,000枚が含まれています。
テストセット：このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。

データセットアクセス

オリジナルファイル: 前処理を直接制御したい場合は、Yann LeCunのMNISTページからgzipアーカイブをダウンロードしてください。
Ultralytics ローダー: 以下を使用 data="mnist" （または data="mnist160" 以下のサブセットの場合) コマンドで指定すると、データセットがダウンロードされ、PNGに変換され、自動的にキャッシュされます。

データセット内の各画像には、対応する数字（0〜9）のラベルが付けられているため、分類タスクに最適な教師あり学習データセットになります。

Extended MNIST (EMNIST)

Extended MNIST (EMNIST)は、NISTによって開発・リリースされた新しいデータセットで、MNISTの後継となります。MNISTには手書き数字の画像のみが含まれていましたが、EMNISTにはNIST Special Database 19からのすべての画像が含まれており、これは手書きの大文字・小文字の文字と数字の大規模なデータベースです。EMNISTの画像は、MNIST画像と同じプロセスで、同じ28×28ピクセル形式に変換されました。したがって、より古く、より小さいMNISTデータセットで動作するツールは、EMNISTでも変更なしで動作する可能性が高いです。

アプリケーション

MNISTデータセットは、畳み込みニューラルネットワーク (CNN)、サポートベクターマシン (SVM)、およびその他のさまざまな機械学習アルゴリズムなど、画像分類タスクにおけるディープラーニングモデルのトレーニングと評価に広く使用されています。このデータセットのシンプルでよく構造化された形式は、機械学習とコンピュータービジョンの分野の研究者や実務家にとって不可欠なリソースとなっています。

一般的なアプリケーションには、以下が含まれます。

新しい分類アルゴリズムのベンチマーク
機械学習の概念を教えるための教育目的
画像認識システムのプロトタイピング
モデル最適化手法のテスト

使用法

28×28の画像サイズで100 エポックの間、MNISTデータセットでCNNモデルをトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

学習の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo26n-cls.pt epochs=100 imgsz=28

サンプル画像とアノテーション

MNISTデータセットには手書き数字のグレースケール画像が含まれており、画像分類タスクのためのよく構造化されたデータセットを提供します。以下に、データセットからの画像の例をいくつか示します。

MNIST データセットのサンプル

この例は、MNISTデータセットにおける手書き数字の多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。

引用と謝辞

研究または開発作業でMNIST datasetを使用する場合は、以下の論文を引用してください。

BibTeX

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

機械学習およびコンピュータービジョン研究コミュニティにとって貴重なリソースであるMNIST datasetを作成および維持していただいたYann LeCun、Corinna Cortes、Christopher J.C. Burgesに感謝いたします。MNIST datasetとその作成者に関する詳細については、MNIST datasetのウェブサイトをご覧ください。

MNIST160 クイックテスト

超高速な回帰テストが必要ですか？ Ultralytics はまた、 data="mnist160"は、各数字クラスからの最初の8つのサンプルを含む160画像のスライスです。これはMNISTのディレクトリ構造を反映しているため、他の引数を変更せずにデータセットを入れ替えることができます。

MNIST160 を使用した学習例

CLI

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

70,000枚の全画像データセットにコミットする前に、このサブセットをCIパイプラインや健全性チェックのために使用してください。

よくある質問

MNISTデータセットとは何ですか？また、なぜ機械学習において重要なのでしょうか？

MNIST dataset、または米国国立標準技術研究所修正データセットは、画像分類システムのトレーニングおよびテスト用に設計された、手書き数字の広く使用されているコレクションです。60,000枚のトレーニング画像と10,000枚のテスト画像が含まれており、すべてグレースケールで28×28ピクセルサイズです。このdatasetの重要性は、画像分類アルゴリズムを評価するための標準ベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、この分野の進捗状況を追跡するのに役立っています。

Ultralytics YOLOを使用してMNISTデータセットでモデルをトレーニングするにはどうすればよいですか？

Ultralytics YOLOを使用してMNIST datasetでモデルをトレーニングするには、以下の手順に従ってください。

学習の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo26n-cls.pt epochs=100 imgsz=28

利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。

MNISTデータセットとEMNISTデータセットの違いは何ですか？

MNISTデータセットには手書き数字のみが含まれますが、Extended MNIST (EMNIST)データセットには数字と大文字・小文字の両方が含まれます。EMNISTはMNISTの後継として開発され、画像に同じ28×28ピクセル形式を使用しているため、元のMNISTデータセット用に設計されたツールやモデルと互換性があります。EMNISTのこのより広範な文字セットは、より多様な機械学習アプリケーションに役立ちます。

Ultralytics Platformを使用してMNISTのようなカスタムデータセットでモデルを訓練できますか？

はい、Ultralytics Platformを使用してMNISTのようなカスタムデータセットでモデルを訓練できます。Ultralytics Platformは、広範なコーディング知識を必要とせずに、データセットのアップロード、モデルの訓練、プロジェクトの管理を行うためのユーザーフレンドリーなインターフェースを提供します。開始方法の詳細については、Ultralytics Platformクイックスタートページをご確認ください。

MNISTは他の画像分類データセットとどのように比較されますか？

MNISTは、CIFAR-10やImageNetのような多くの最新のdatasetよりもシンプルであり、初心者や迅速な実験に最適です。より複雑なdatasetは、カラー画像や多様なオブジェクトカテゴリでより大きな課題を提供しますが、MNISTは、そのシンプルさ、小さなファイルサイズ、および機械学習アルゴリズムの開発における歴史的意義のために依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら数字の代わりに衣料品を特徴とするFashion-MNISTの使用を検討してください。

📅 2年前に作成 ✏️ 3ヶ月前に更新