コンテンツにスキップ

MNISTデータセット

MNIST(Modified National Institute of Standards and Technology)データセットは、さまざまな画像処理システムや機械学習モデルのトレーニングによく使用される手書き数字の大規模なデータベースです。NISTの元のデータセットからサンプルを「再混合」することによって作成され、画像分類アルゴリズムのパフォーマンスを評価するためのベンチマークとなっています。

主な特徴

  • MNISTには、手書き数字の60,000枚のトレーニング画像と10,000枚のテスト画像が含まれています。
  • このデータセットは、28×28ピクセルのサイズのグレースケール画像で構成されています。
  • 画像は28×28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理によりグレースケールレベルが導入されます。
  • MNISTは、機械学習、特に画像分類タスクの分野におけるトレーニングとテストに広く使用されています。

データセットの構造

MNISTデータセットは、次の2つのサブセットに分割されています。

  1. トレーニングセット: 機械学習モデルのトレーニングに使用される手書き数字の画像60,000枚が含まれています。
  2. テストセット:このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。

データセット内の各画像には、対応する数字(0〜9)のラベルが付けられているため、分類タスクに最適な教師あり学習データセットになります。

拡張MNIST(EMNIST)

Extended MNIST(EMNIST)は、MNISTの後継としてNISTによって開発およびリリースされた新しいデータセットです。MNISTには手書き数字の画像のみが含まれていましたが、EMNISTには、手書きの大文字と小文字の文字と数字の大規模なデータベースであるNIST Special Database 19のすべての画像が含まれています。EMNISTの画像は、MNIST画像と同じプロセスで、同じ28×28ピクセル形式に変換されました。したがって、以前の小型のMNISTデータセットで動作するツールは、EMNISTでも修正なしで動作する可能性があります。

アプリケーション

MNISTデータセットは、Convolutional Neural Networks(CNN)、Support Vector Machines(SVM)などの画像分類タスクにおける深層学習モデルの学習および評価に広く使用されており、さまざまな機械学習アルゴリズムにも利用されています。このデータセットのシンプルで構造化された形式は、機械学習およびコンピュータビジョン分野の研究者や実務家にとって不可欠なリソースとなっています。

一般的なアプリケーションには、以下が含まれます。

  • 新しい分類アルゴリズムのベンチマーク
  • 機械学習の概念を教えるための教育目的
  • 画像認識システムのプロトタイピング
  • モデル最適化手法のテスト

使用法

画像サイズ32×32でMNISTデータセットに対してCNNモデルを100エポックトレーニングするには、次のコードスニペットを使用できます。使用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

学習の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

サンプル画像とアノテーション

MNISTデータセットには、手書き数字のグレースケール画像が含まれており、画像分類タスクのための構造化されたデータセットを提供します。以下は、データセットからの画像のいくつかの例です。

データセットのサンプル画像

この例は、MNISTデータセット内の手書き数字の多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。

引用と謝辞

MNISTデータセットを研究または開発で使用する場合は、以下の論文を引用してください。

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Yann LeCun、Corinna Cortes、Christopher J.C. Burgesが、機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるMNISTデータセットを作成、維持していることに感謝いたします。MNISTデータセットとその作成者の詳細については、MNISTデータセットのウェブサイトをご覧ください。

よくある質問

MNISTデータセットとは何ですか?また、機械学習において、なぜ重要なのでしょうか?

MNISTデータセット、またはModified National Institute of Standards and Technologyデータセットは、画像分類システムをトレーニングおよびテストするために設計された手書き数字の広く使用されているコレクションです。60,000枚のトレーニング画像と10,000枚のテスト画像が含まれており、すべてグレースケールで28×28ピクセルです。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準的なベンチマークとしての役割にあり、研究者やエンジニアが方法を比較し、この分野の進捗状況を追跡するのに役立ちます。

Ultralytics YOLO を使用して MNIST データセットでモデルをトレーニングするにはどうすればよいですか?

Ultralytics YOLOを使用してMNISTデータセットでモデルをトレーニングするには、次の手順に従います。

学習の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。

MNISTデータセットとEMNISTデータセットの違いは何ですか?

MNISTデータセットには手書きの数字のみが含まれていますが、Extended MNIST(EMNIST)データセットには数字と大文字および小文字の両方が含まれています。EMNISTはMNISTの後継として開発され、画像には同じ28×28ピクセルの形式を使用しているため、元のMNISTデータセット用に設計されたツールやモデルと互換性があります。EMNISTの文字範囲が広いため、より多様な機械学習アプリケーションに役立ちます。

Ultralytics HUBを使用して、MNISTのようなカスタムデータセットでモデルをトレーニングできますか?

はい、Ultralytics HUBを使用して、MNISTなどのカスタムデータセットでモデルをトレーニングできます。Ultralytics HUBは、データセットのアップロード、モデルのトレーニング、および広範なコーディング知識を必要とせずにプロジェクトを管理するためのユーザーフレンドリーなインターフェースを提供します。開始方法の詳細については、Ultralytics HUBクイックスタートページを確認してください。

MNISTは他の画像分類データセットと比べてどうですか?

MNISTは、CIFAR-10ImageNetのような最近の多くのデータセットよりも単純であるため、初心者や迅速な実験に最適です。より複雑なデータセットは、カラー画像や多様なオブジェクトカテゴリでより大きな課題を提供しますが、MNISTはその単純さ、小さなファイルサイズ、および機械学習アルゴリズムの開発における歴史的な重要性から、依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら、数字の代わりに衣料品を特徴とするFashion-MNISTの使用を検討してください。



📅 1年前に作成 ✏️ 5ヶ月前に更新

コメント