Meet YOLO26: next-gen vision AI.

Link to this sectionMNIST データセット#

MNIST (Modified National Institute of Standards and Technology) データセットは、手書き数字の大規模なデータベースであり、さまざまな画像処理システムや機械学習モデルのトレーニングに広く使用されています。これは NIST のオリジナルデータセットのサンプルを「再構成」して作成されたもので、画像分類アルゴリズムの性能を評価するためのベンチマークとなっています。

Link to this section主な特徴#

  • MNIST には、手書き数字のトレーニング画像 60,000 枚とテスト画像 10,000 枚が含まれています。
  • このデータセットは、28×28 ピクセルサイズのグレースケール画像で構成されています。
  • 画像は 28×28 ピクセルのバウンディングボックスに収まるように正規化されており、アンチエイリアス処理によってグレースケールレベルが導入されています。
  • MNIST は機械学習分野、特に画像分類タスクのトレーニングやテストに広く使用されています。

Link to this sectionデータセットの構造#

MNIST データセットは 2 つのサブセットに分割されています。

  1. トレーニングセット: このサブセットには、機械学習モデルのトレーニングに使用される 60,000 枚の手書き数字画像が含まれています。
  2. テストセット: このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される 10,000 枚の画像で構成されています。

Link to this sectionデータセットへのアクセス#

  • オリジナルファイル: 前処理を直接制御したい場合は、オリジナルの MNIST アーカイブから gzip アーカイブをダウンロードしてください。
  • Ultralytics ローダー: コマンドで data="mnist" (または以下のサブセットの場合は data="mnist160") を使用すると、データセットが自動的にダウンロード、PNG に変換、キャッシュされます。

データセット内の各画像には対応する数字 (0-9) がラベル付けされており、分類タスクに最適な教師あり学習データセットとなっています。

Link to this sectionExtended MNIST (EMNIST)#

Extended MNIST (EMNIST) は、MNIST の後継として NIST によって開発・公開された新しいデータセットです。MNIST が手書き数字の画像のみを含んでいたのに対し、EMNIST には NIST Special Database 19 のすべての画像が含まれており、これには手書きの英大文字・小文字および数字の大規模なデータベースが含まれています。EMNIST の画像は、MNIST 画像と同じプロセスによって同じ 28×28 ピクセル形式に変換されました。したがって、古い小規模な MNIST データセットで動作するツールは、そのまま EMNIST でも動作する可能性が高いです。

Link to this sectionアプリケーション#

MNISTデータセットは、ディープラーニングモデルを画像分類タスクでトレーニングおよび評価するために広く使用されており、例えば畳み込みニューラルネットワーク(CNN)やサポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなどが挙げられます。このデータセットのシンプルで構造化されたフォーマットは、機械学習およびコンピュータビジョン分野の研究者や実務家にとって不可欠なリソースとなっています。

一般的なアプリケーションには以下のものがあります。

  • 新しい分類アルゴリズムのベンチマーク
  • 機械学習の概念を教えるための教育目的
  • 画像認識システムのプロトタイピング
  • モデル最適化技術のテスト

Link to this section使用方法#

MNIST データセットで画像サイズ 28×28 を使用し、100 エポックの CNN モデルをトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の完全なリストについては、モデルのトレーニングページを参照してください。

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionサンプル画像とアノテーション#

MNIST データセットには手書き数字のグレースケール画像が含まれており、画像分類タスクに適した構造化されたデータセットを提供します。以下は、データセット内の画像の例です。

MNIST 手書き数字分類データセットのサンプル

この例は、MNIST データセット内の手書き数字の多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。

Link to this section引用と謝辞#

研究や開発活動で MNIST データセットを使用する場合は、以下の論文を引用してください。

引用
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースとして MNIST データセットを作成・維持してくださった Yann LeCun 氏、Corinna Cortes 氏、および Christopher J.C. Burges 氏に感謝の意を表します。MNIST データセットとその作成者の詳細については、MNIST データセットのウェブサイトをご覧ください。

Link to this sectionMNIST160 クイックテスト#

超高速な回帰テストが必要ですか?Ultralytics は data="mnist160" も公開しています。これは、トレーニングおよびテストの分割から各数字 (0-9) の最初の 8 枚の画像を含む 160 枚の画像のサンプルです。MNIST のディレクトリ構造を反映しているため、他の引数を変更することなくデータセットを切り替えることができます。

MNIST160 を使用したトレーニング例
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

CI パイプラインや、70,000 枚のフルデータセットで実行する前の健全性チェックにこのサブセットを使用してください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionMNIST データセットとは何ですか?また、なぜ機械学習において重要なのでしょうか?#

MNIST データセット (Modified National Institute of Standards and Technology dataset) は、画像分類システムのトレーニングとテスト用に設計された、広く使用されている手書き数字のコレクションです。60,000 枚のトレーニング画像と 10,000 枚のテスト画像が含まれており、すべてグレースケールで 28×28 ピクセルのサイズです。このデータセットの重要性は、画像分類アルゴリズムを評価するための標準的なベンチマークとしての役割にあり、研究者やエンジニアが手法を比較し、分野の進歩を追跡するのに役立っています。

Link to this sectionUltralytics YOLO を使用して MNIST データセットでモデルをトレーニングするにはどうすればよいですか?#

Ultralytics YOLO を使用して MNIST データセットでモデルをトレーニングするには、以下の手順に従います。

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

利用可能なトレーニング引数の詳細なリストについては、トレーニングページを参照してください。

Link to this sectionMNIST データセットと EMNIST データセットの違いは何ですか?#

MNIST データセットには手書き数字のみが含まれていますが、Extended MNIST (EMNIST) データセットには数字に加え、英大文字および小文字が含まれています。EMNIST は MNIST の後継として開発され、画像には同じ 28×28 ピクセル形式を使用しているため、オリジナルの MNIST データセット用に設計されたツールやモデルと互換性があります。EMNIST に含まれるより広範な文字範囲により、より多様な機械学習アプリケーションに役立ちます。

Link to this sectionUltralytics Platform を使用して MNIST のようなカスタムデータセットでモデルをトレーニングできますか?#

はい、Ultralytics Platformを使用して、MNISTのようなカスタムデータセットでモデルをトレーニングすることができます。Ultralytics Platformは、専門的なコーディング知識を必要とせずに、データセットのアップロード、モデルのトレーニング、プロジェクトの管理を行うためのユーザーフレンドリーなインターフェースを提供します。開始方法の詳細については、Ultralytics Platformクイックスタートページをご確認ください。

Link to this sectionMNIST は他の画像分類データセットと比べてどうですか?#

MNIST は CIFAR-10ImageNet といった多くの最新データセットよりもシンプルであり、初心者や迅速な実験に適しています。より複雑なデータセットはカラー画像や多様なオブジェクトカテゴリによって大きな課題を提供しますが、MNIST はそのシンプルさ、小さなファイルサイズ、および機械学習アルゴリズム開発における歴史的な重要性から、依然として価値があります。より高度な分類タスクについては、同じ構造を維持しつつ数字の代わりに衣料品を特徴とする Fashion-MNIST の使用を検討してください。

コメント