コンテンツへスキップ

画像分類データセットの概要

データセット形式

torchvisionの分類データセットのフォルダ構造は、通常、標準的な形式に従っています:

root/
|-- class1/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class2/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class3/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- ...

このフォルダ構造では root ディレクトリには、データセットの各クラスごとに1つのサブディレクトリがある。各サブディレクトリには対応するクラスの名前が付けられており、そのクラスのすべての画像が含まれている。各画像ファイルには固有の名前が付けられ、通常はJPEGやPNGなどの一般的な画像ファイル形式になっている。

** 例

例えば、CIFAR10データセットの場合、フォルダ構造は次のようになる:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...

この例では train ディレクトリには、データセットの各クラスのサブディレクトリがあり、各クラスのサブディレクトリには、そのクラスのすべての画像が含まれている。この test ディレクトリも同様の構造を持っている。その root ディレクトリには、CIFAR10データセットの一部である他のファイルも含まれている。

使用方法

例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='path/to/dataset', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

対応データセット

Ultralytics は以下のデータセットを自動ダウンロードでサポートしています:

  • Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
  • カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
  • CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
  • CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
  • Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
  • ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
  • ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
  • Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
  • Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
  • MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。

独自のデータセットを追加する

独自のデータセットを持っていて、それをUltralytics を使って分類モデルのトレーニングに使いたい場合は、そのデータセットが上記の「データセットのフォーマット」で指定されたフォーマットに従っていることを確認してから、 を指定してください。 data 引数でデータセット・ディレクトリを指定する。



作成日:2023-11-12 更新日:2024-01-07
作成者:glenn-jocher(4),GreatV(1)

コメント