MNISTデータセット
MNIST (Modified National Institute of Standards and Technology) データセットは、様々な画像処理システムや機械学習モデルのトレーニングによく使用される、手書き数字の巨大なデータベースです。NISTのオリジナルデータセットのサンプルを「再構成(re-mixing)」して作成され、画像分類アルゴリズムの性能を評価するためのベンチマークとなっています。
主な特徴
- MNISTには、60,000枚のトレーニング用画像と10,000枚のテスト用画像(手書き数字)が含まれています。
- このデータセットは、28×28ピクセルのグレースケール画像で構成されています。
- 画像は28×28ピクセルのバウンディングボックスに収まるように正規化され、アンチエイリアス処理によってグレースケールレベルが導入されています。
- MNISTは、機械学習分野、特に画像分類タスクのトレーニングやテストに広く利用されています。
データセットの構造
MNISTデータセットは、次の2つのサブセットに分割されています。
- トレーニングセット: このサブセットには、機械学習モデルのトレーニングに使用される60,000枚の手書き数字画像が含まれています。
- テストセット: このサブセットは、トレーニング済みモデルのテストおよびベンチマークに使用される10,000枚の画像で構成されています。
データセットへのアクセス
- オリジナルファイル: 前処理を直接制御したい場合は、オリジナルのMNISTアーカイブからgzipアーカイブをダウンロードしてください。
- Ultralyticsローダー: コマンドで
data="mnist"(または以下のサブセットの場合はdata="mnist160") を使用すると、データセットが自動的にダウンロードされ、PNGに変換され、キャッシュされます。
データセットの各画像には対応する数字(0-9)のラベルが付いており、分類タスクに最適な教師あり学習用データセットとなっています。
Extended MNIST (EMNIST)
Extended MNIST (EMNIST) は、MNISTの後継としてNISTが開発・公開した新しいデータセットです。MNISTが手書き数字のみの画像を含んでいたのに対し、EMNISTにはNIST Special Database 19に含まれるすべての画像が含まれています。これは、手書きの大文字・小文字、および数字の巨大なデータベースです。EMNISTの画像は、MNISTの画像と同じプロセスで、同じ28×28ピクセルのフォーマットに変換されました。そのため、旧来の小さなMNISTデータセットで動作するツールは、EMNISTでもそのまま使用できる可能性が高いです。
アプリケーション
The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.
一般的なアプリケーションには以下が含まれます。
- 新しい分類アルゴリズムのベンチマーク
- 機械学習の概念を教えるための教育目的
- 画像認識システムのプロトタイプ作成
- モデル最適化手法のテスト
使用方法
MNISTデータセットでCNNモデルを100エポック分、画像サイズ28×28でトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルトレーニングページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)サンプル画像とアノテーション
MNISTデータセットには手書き数字のグレースケール画像が含まれており、画像分類タスクに適した構成の整ったデータセットを提供します。以下はデータセット内の画像の例です。

この例は、MNISTデータセットにおける手書き数字の多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。
引用と謝辞
研究や開発の作業でMNISTデータセットを使用する場合は、以下の論文を引用してください。
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}MNISTデータセットを作成し、機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースとして維持してくださったYann LeCun氏、Corinna Cortes氏、そしてChristopher J.C. Burges氏に感謝の意を表します。MNISTデータセットとその作成者に関する詳細は、MNISTデータセットのウェブサイトをご覧ください。
MNIST160クイックテスト
超高速な回帰テストが必要ですか?Ultralyticsは data="mnist160" も公開しています。これは各数字クラスから最初の8サンプルを含む160枚の画像スライスです。MNISTのディレクトリ構造を反映しているため、他の引数を変更することなくデータセットを切り替えることができます。
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28CIパイプラインでの使用や、70,000枚のフルデータセットでのコミット前に行う健全性チェックにご利用ください。
FAQ
MNISTデータセットとは何ですか?また、なぜ機械学習において重要なのでしょうか?
MNISTデータセット(Modified National Institute of Standards and Technology dataset)は、画像分類システムのトレーニングとテストのために設計された、広く利用されている手書き数字のコレクションです。60,000枚のトレーニング用画像と10,000枚のテスト用画像が含まれており、すべてグレースケールの28×28ピクセルサイズです。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準的なベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、分野の進歩を追跡するのに役立っています。
Ultralytics YOLOを使用してMNISTデータセットでモデルをトレーニングするにはどうすればよいですか?
Ultralytics YOLOを使用してMNISTデータセットでモデルをトレーニングするには、以下の手順に従ってください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)利用可能なトレーニング引数の詳細リストについては、トレーニングページを参照してください。
MNISTデータセットとEMNISTデータセットの違いは何ですか?
MNISTデータセットには手書き数字のみが含まれていますが、Extended MNIST (EMNIST) データセットには数字だけでなく大文字・小文字の英字も含まれています。EMNISTはMNISTの後継として開発され、画像には同じ28×28ピクセルのフォーマットが採用されているため、オリジナルのMNISTデータセット用に設計されたツールやモデルと互換性があります。EMNISTはより幅広い文字を扱えるため、より多種多様な機械学習アプリケーションに役立ちます。
Ultralytics Platformを使用して、MNISTのようなカスタムデータセットでモデルをトレーニングできますか?
はい、Ultralytics Platformを使用してMNISTのようなカスタムデータセットでモデルをトレーニングできます。Ultralytics Platformは、データセットのアップロード、モデルのトレーニング、プロジェクト管理を行うための使いやすいインターフェースを提供しており、高度なコーディング知識は不要です。開始方法の詳細については、Ultralytics Platformクイックスタートページをご確認ください。
MNISTは他の画像分類データセットと比べてどうですか?
MNISTはCIFAR-10やImageNetといった多くの現代的なデータセットよりも単純であるため、初心者や素早い実験に最適です。より複雑なデータセットは、カラー画像や多様な物体カテゴリなど、より大きな課題を提供しますが、MNISTはその単純さ、小さなファイルサイズ、そして機械学習アルゴリズムの発展における歴史的な重要性から、依然として価値があります。より高度な分類タスクについては、構成は同じまま、数字の代わりに衣類アイテムを特徴とするFashion-MNISTの使用を検討してください。