Link to this sectionMNIST データセット#
MNIST (Modified National Institute of Standards and Technology) データセットは、手書き数字の巨大なデータベースであり、さまざまな画像処理システムや機械学習モデルのトレーニングに広く使用されています。これは NIST の元のデータセットのサンプルを「再構成」して作成されたもので、画像分類アルゴリズムの性能を評価するためのベンチマークとなっています。
Link to this section主な特徴#
- MNIST には、手書き数字のトレーニング用画像 60,000 枚とテスト用画像 10,000 枚が含まれています。
- このデータセットは、28×28 ピクセルのグレースケール画像で構成されています。
- 画像は 28×28 ピクセルの bounding box に収まるように正規化され、アンチエイリアス処理が施されているため、階調のあるグレースケールになっています。
- MNIST は機械学習分野、特に画像分類タスクのトレーニングやテストに広く利用されています。
Link to this sectionデータセットの構造#
MNIST データセットは以下の 2 つのサブセットに分けられます。
- トレーニングセット: このサブセットには、機械学習モデルのトレーニングに使用される 60,000 枚の手書き数字画像が含まれています。
- テストセット: このサブセットは、トレーニング済みモデルのテストおよびベンチマークに使用される 10,000 枚の画像で構成されています。
Link to this sectionデータセットへのアクセス#
- オリジナルファイル: 前処理を直接制御したい場合は、元の MNIST アーカイブから gzip 形式のアーカイブをダウンロードしてください。
- Ultralytics ローダー: コマンド内で
data="mnist"(または以下のサブセットの場合はdata="mnist160") を指定すると、データセットが自動的にダウンロード、PNG 変換、キャッシュされます。
データセット内の各画像には対応する数字 (0-9) がラベル付けされており、分類タスクに最適な教師あり学習データセットとなっています。
Link to this sectionExtended MNIST (EMNIST)#
Extended MNIST (EMNIST) は、MNIST の後継として NIST によって開発・公開された新しいデータセットです。MNIST が手書き数字の画像のみを含んでいたのに対し、EMNIST には NIST Special Database 19 のすべての画像が含まれており、これには手書きの大文字・小文字のアルファベットや数字が含まれる巨大なデータベースとなっています。EMNIST の画像は、MNIST 画像と同じプロセスによって同じ 28×28 ピクセルの形式に変換されています。したがって、以前の小規模な MNIST データセットで動作するツールは、EMNIST でもそのまま動作する可能性が高いです。
Link to this sectionアプリケーション#
The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.
一般的な用途には以下のようなものがあります。
- 新しい分類アルゴリズムのベンチマーク
- 機械学習の概念を教えるための教育目的
- 画像認識システムのプロトタイピング
- モデル最適化技術のテスト
Link to this section使用方法#
MNIST データセット上で 28×28 サイズの画像を使用して CNN モデルを 100 epochs 分トレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデル Training ページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionサンプル画像とアノテーション#
MNIST データセットには手書き数字のグレースケール画像が含まれており、画像分類タスクのために適切に構造化されています。以下にデータセットの画像例を示します。

この例では、MNIST データセットに含まれる手書き数字の多様性と複雑さが示されており、堅牢な画像分類モデルをトレーニングするために多様なデータセットが重要であることが強調されています。
Link to this section引用と謝辞#
研究や開発作業で MNIST データセットを使用する場合は、以下の論文を引用してください。
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースとして MNIST データセットを作成・維持してくださった Yann LeCun、Corinna Cortes、Christopher J.C. Burges の各氏に感謝いたします。MNIST データセットとその作成者の詳細については、MNIST dataset website をご覧ください。
Link to this sectionMNIST160 クイックテスト#
超高速な回帰テストが必要ですか?Ultralytics は data="mnist160" も提供しています。これはトレーニングおよびテストの両方の分割から、各数字 (0-9) の最初の 8 枚の画像を含む 160 枚の画像スライスです。MNIST のディレクトリ構造を反映しているため、他の引数を変更せずにデータセットを入れ替えることができます。
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28合計 70,000 枚のデータセット全体で実行する前に、CI パイプラインでのテストや健全性チェックのためにこのサブセットを使用してください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionMNIST データセットとは何ですか?また、なぜ機械学習において重要なのでしょうか?#
MNIST データセット (Modified National Institute of Standards and Technology dataset) は、画像分類システムのトレーニングとテスト用に設計された、広く使用されている手書き数字のコレクションです。これには 60,000 枚のトレーニング画像と 10,000 枚のテスト画像が含まれており、すべて 28×28 ピクセルのグレースケール画像です。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準的なベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、分野の進歩を追跡するのに役立っています。
Link to this sectionUltralytics YOLO を使用して MNIST データセットでモデルをトレーニングするにはどうすればよいですか?#
Ultralytics YOLO を使用して MNIST データセットでモデルをトレーニングするには、以下の手順に従ってください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)利用可能なトレーニング引数の詳細なリストについては、Training ページを参照してください。
Link to this sectionMNIST データセットと EMNIST データセットの違いは何ですか?#
MNIST データセットには手書きの数字のみが含まれていますが、Extended MNIST (EMNIST) データセットには数字だけでなく大文字と小文字のアルファベットも含まれています。EMNIST は MNIST の後継として開発され、画像には同じ 28×28 ピクセル形式を採用しているため、元の MNIST データセット用に設計されたツールやモデルと互換性があります。EMNIST は文字の範囲が広いため、より多様な機械学習アプリケーションに役立ちます。
Link to this sectionUltralytics Platform を使用して、MNIST のようなカスタムデータセットでモデルをトレーニングできますか?#
はい、Ultralytics Platform を使用して、MNIST のようなカスタムデータセットでモデルをトレーニングできます。Ultralytics Platform は、データセットのアップロード、モデルのトレーニング、プロジェクト管理を行うための使いやすいインターフェースを提供しており、高度なコーディング知識は不要です。開始方法の詳細については、Ultralytics Platform Quickstart ページを確認してください。
Link to this sectionMNIST は他の画像分類データセットと比べてどうですか?#
MNIST は CIFAR-10 や ImageNet といった多くの最新データセットよりもシンプルであるため、初心者や迅速な実験に最適です。より複雑なデータセットにはカラー画像や多様なオブジェクトカテゴリによる大きな課題がありますが、MNIST はそのシンプルさ、小さなファイルサイズ、そして機械学習アルゴリズムの発展における歴史的な意義から依然として価値があります。より高度な分類タスクには、同じ構造を維持しながら数字の代わりに衣料品を特徴とする Fashion-MNIST の使用を検討してください。