MNISTデータセット
MNIST(ModifiedNational Institute of Standards and Technology)データセットは、様々な画像処理システムや機械学習モデルの学習によく使われる手書き数字の大規模データベースである。NISTのオリジナルデータセットからサンプルを「再ミックス」して作成され、画像分類アルゴリズムの性能を評価するベンチマークとなっている。
主な特徴
- MNISTには6万枚の学習用画像と1万枚のテスト用手書き数字画像が含まれている。
- データセットは28x28ピクセルのグレースケール画像からなる。
- The images are normalized to fit into a 28x28 pixel bounding box and anti-aliased, introducing grayscale levels.
- MNISTは、機械学習の分野、特に画像分類タスクの訓練とテストに広く使用されている。
データセット構造
MNISTデータセットは2つのサブセットに分割される:
- トレーニングセット:このサブセットには、機械学習モデルの学習に使用される手書き数字の画像6万枚が含まれている。
- テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。
拡張MNIST (EMNIST)
拡張MNIST(EMNIST)は、MNISTの後継としてNISTが開発・公開した新しいデータセットである。MNISTが手書き数字のみの画像を含んでいたのに対し、EMNISTは手書きの大文字、小文字、数字を含む大規模なデータベースであるNIST Special Database 19の全ての画像を含んでいる。EMNISTの画像は、MNISTの画像と同じプロセスで、同じ28x28ピクセルフォーマットに変換されている。従って、より古く、より小さいMNISTデータセットを扱うツールは、EMNISTでもそのまま使える可能性が高い。
アプリケーション
The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.
使用方法
To train a CNN model on the MNIST dataset for 100 epochs with an image size of 32x32, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.
列車の例
サンプル画像と注釈
The MNIST dataset contains grayscale images of handwritten digits, providing a well-structured dataset for image classification tasks. Here are some examples of images from the dataset:
この例は、MNISTデータセットに含まれる手書き数字の多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。
引用と謝辞
MNISTデータセットを使用する場合
研究または開発作業では、以下の論文を引用してください:
We would like to acknowledge Yann LeCun, Corinna Cortes, and Christopher J.C. Burges for creating and maintaining the MNIST dataset as a valuable resource for the machine learning and computer vision research community. For more information about the MNIST dataset and its creators, visit the MNIST dataset website.
よくあるご質問
MNISTデータセットとは何か、なぜ機械学習において重要なのか?
MNISTデータセット(Modified National Institute of Standards and Technology dataset)は、画像分類システムの訓練とテスト用に設計された、広く使用されている手書き数字のコレクションである。60,000枚の学習用画像と10,000枚のテスト用画像が含まれており、すべて28x28ピクセルのグレースケールである。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準ベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、この分野の進歩を追跡するのに役立っている。
Ultralytics YOLO を使って MNIST データセットでモデルを学習するにはどうすればよいですか?
Ultralytics YOLO を使ってMNISTデータセットでモデルを訓練するには、以下の手順に従います:
列車の例
利用可能なトレーニングの詳細リストについては、トレーニングのページを参照してください。
MNISTとEMNISTのデータセットの違いは何ですか?
MNISTデータセットには手書きの数字のみが含まれているのに対し、拡張MNIST(EMNIST)データセットには数字と大文字・小文字の両方が含まれている。EMNISTはMNISTの後継として開発され、画像に同じ28x28ピクセルフォーマットを使用しているため、オリジナルのMNISTデータセット用に設計されたツールやモデルと互換性があります。EMNISTでは、このように幅広い種類の文字が使用されているため、より幅広い機械学習アプリケーションに使用することができます。
Ultralytics HUBを使って、MNISTのようなカスタムデータセットでモデルをトレーニングできますか?
はい、Ultralytics HUBを使ってMNISTのようなカスタムデータセットでモデルをトレーニングすることができます。Ultralytics HUBは、データセットのアップロード、モデルのトレーニング、プロジェクトの管理のためのユーザーフレンドリーなインターフェイスを提供します。開始方法の詳細については、Ultralytics HUBクイックスタートページをご覧ください。