No license

Link to this sectionMNIST データセット#

Name: MNIST画像分類データセット
Creator: Yann LeCun
Keywords: MNIST, データセット, 手書き数字, 画像分類, ディープラーニング, 機械学習, トレーニングセット, テストセット, NIST

MNIST（Modified National Institute of Standards and Technology）データセットは、手書き数字の0から9までの10クラス、28x28ピクセルのグレースケール画像70,000枚で構成される画像分類ベンチマークです。このデータセットには、あらかじめ60,000枚のトレーニング用画像と10,000枚のテスト用画像が用意されており、長年にわたり機械学習およびコンピュータビジョンアルゴリズムを評価するための標準的なベンチマークとして使用されてきました。より難易度の高い衣類画像のデータセットについては関連するFashion-MNISTデータセットを、カラー画像についてはCIFAR-10を参照してください。

Link to this section主な特徴#

MNISTには、手書き数字のトレーニング用画像60,000枚とテスト用画像10,000枚の合計70,000枚が含まれています。
各画像は単一の数字を収めた28x28のグレースケール画像であり、正規化およびアンチエイリアス処理が施され、28x28の固定バウンディングボックスに収められています。
10のクラスは0から9の数字に対応しており、クラスごとの画像数はほぼ均等です。
事前に定義されたトレーニング/テストセットの分割が含まれているため、手動または自動での分割作業は不要です。
MNISTは、画像分類およびディープラーニング研究における標準的なベンチマークです。

Link to this sectionデータセットの構造#

MNISTには公式の定義済み分割が含まれているため、自動または手動による分割は不要です：

クラス: 10（手書き数字 0–9）
画像総数: 70,000枚 (28x28 グレースケール)
トレーニングセット: 60,000枚
テストセット: 10,000枚

検証用データセット

MNISTには個別の検証用フォルダがないため、Ultralyticsではトレーニング中に10,000枚のテストセットを検証用分割としてデフォルトで使用します。

各画像には対応する数字（0–9）のラベルが付与されており、分類タスクに最適な教師あり学習用データセットとなっています。

Link to this sectionアプリケーション#

MNIST is widely used to train and evaluate image classification models, from classic Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs) to modern deep architectures. Its small grayscale images and 10 digit classes make it a fast, reproducible benchmark for algorithm comparison and computer vision experimentation.

一般的なアプリケーションには以下のものがあります。

新しい分類アルゴリズムのベンチマーク
機械学習の概念を教えるための教育目的
画像認識システムのプロトタイピング
モデル最適化技術のテスト

Link to this section使用方法#

MNISTでYOLO分類モデルを100エポック、画像サイズ28でトレーニングします。データセットは初回使用時に自動的にダウンロードおよびキャッシュされます。前処理を完全に制御したい場合は、MNISTデータベースからオリジナルのgzipアーカイブを入手することも可能です。利用可能な引数の詳細なリストについては、トレーニングページおよび画像分類タスクガイドを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

MNIST160によるクイックテスト

Ultralyticsではdata="mnist160"も公開しています。これはトレーニングおよびテストセットの各数字（0–9）から最初の8枚ずつを抽出した計160枚のデータセットです。MNISTのディレクトリ構造を反映しているため、他の引数を変更することなくデータセットを切り替えることができます。これはCIパイプラインや、70,000枚のデータセット全体を使用する前のサニティチェックに最適です。

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionサンプル画像とアノテーション#

MNISTデータセットのサンプル画像：

MNIST 手書き数字分類データセットのサンプル

これらのサンプルは、10の数字クラス全体にわたるデータセットが捉える手書きスタイルの幅広さを示しています。

Link to this section引用と謝辞#

研究や開発活動で MNIST データセットを使用する場合は、以下の論文を引用してください。

引用

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるMNISTデータセットを作成・維持管理されているYann LeCun氏、Corinna Cortes氏、Christopher J.C. Burges氏に感謝の意を表します。MNISTデータセットとその作成者に関する詳細については、MNISTデータセットのウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionMNIST データセットとは何ですか？また、なぜ機械学習において重要なのでしょうか？#

MNISTデータセットは、手書き数字の0から9までの10クラス、28x28ピクセルのグレースケール画像70,000枚で構成されるベンチマークであり、60,000枚のトレーニング用画像と10,000枚のテスト用画像に分割されています。これは画像分類アルゴリズムを評価するための標準的なリファレンスです。その小さく統一された形式により、研究者やエンジニアは最小限のセットアップで手法を比較し進捗を追跡できるため、機械学習における一般的な最初のベンチマークとして定着しています。

Link to this sectionMNISTデータセットにはいくつのクラスと画像が含まれていますか？#

MNISTには10のクラス（手書き数字0から9）があり、各28x28ピクセルのグレースケール画像が合計70,000枚含まれています。トレーニング用60,000枚とテスト用10,000枚の事前定義された分割があり、数字ごとのサンプル数はほぼ均等です。

Link to this sectionUltralytics YOLO を使用して MNIST データセットでモデルをトレーニングするにはどうすればよいですか？#

MNISTでUltralytics YOLOモデルをトレーニングするには、以下のコードスニペットを使用してください。データセットは初回使用時に自動的にダウンロードされます。利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionMNISTデータセットはどのようにトレーニング用とテスト用に分割されていますか？#

MNISTには、60,000枚のトレーニング画像と10,000枚のテスト画像という事前定義された分割が含まれています。Ultralyticsが自動的に分割を行うフォルダベースの分類データセットとは異なり、MNISTの公式パーティションはそのまま使用され、テストセットはトレーニング中にデフォルトで検証用として使用されます。

Link to this sectionMNIST データセットと EMNIST データセットの違いは何ですか？#

MNISTデータセットには手書き数字のみが含まれていますが、Extended MNIST (EMNIST) データセットには数字に加え、大文字と小文字が含まれています。EMNISTはMNISTの後継として開発され、同じ28x28ピクセルの形式を使用しているため、オリジナルのMNISTデータセット用に設計されたツールやモデルと互換性があります。このより幅広い文字セットにより、EMNISTはより多様な機械学習アプリケーションに活用できます。

Link to this sectionUltralytics Platformを使用して、MNISTのようなデータセットでモデルをトレーニングすることはできますか？#

はい。Ultralytics Platformでは、データセットのアップロード、画像分類モデルのトレーニング、そして広範なコーディングなしでのデプロイが可能です。クラウド上でMNISTの実験を行うための便利な手段です。関連するオプションについては分類データセットの概要を参照してください。

Link to this sectionMNIST は他の画像分類データセットと比べてどうですか？#

MNISTはCIFAR-10やImageNetのような多くの現代的なデータセットよりもシンプルであり、初心者や迅速な実験に最適です。より複雑なデータセットはカラー画像や多様なオブジェクトカテゴリといった大きな課題を提供しますが、MNISTはそのシンプルさ、小さなファイルサイズ、そして機械学習アルゴリズムの発展における歴史的な意義から依然として価値があります。同じ構造を持つ、より難易度の高い代替データセットについては、数字の代わりに衣類アイテムを備えたFashion-MNISTを参照してください。

貢献者

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

作成日 2023年11月12日更新日昨日