コンテンツへスキップ

画像分類データセットの概要

YOLO 分類タスクのデータセット構造

について Ultralytics YOLO 分類タスクでは、データセットは、以下のような特定の分割ディレコトリー構造で編成されなければならない。 root ディレクトリを作成し、適切なトレーニング、テスト、およびオプションの検証プロセスを容易にします。この構造には、トレーニング(train)とテスト(test) フェーズで、オプションで検証用のディレクトリ (val).

これらのディレクトリには、データセットの各クラスごとに1つのサブディレクトリが含まれていなければならない。サブディレクトリには対応するクラスの名前をつけ、そのクラスのすべての画像を入れる。各画像ファイルにユニークな名前をつけ、JPEGやPNGのような一般的な形式で保存されていることを確認してください。

フォルダ構造例

CIFAR-10データセットを例に考えてみよう。フォルダ構造は以下のようになるはずだ:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- val/ (optional)
|   |-- airplane/
|   |   |-- 105_airplane.png
|   |   |-- 106_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 102_automobile.png
|   |   |-- 103_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1045_bird.png
|   |   |-- 1046_bird.png
|   |   |-- ...
|   |
|   |-- ...

この構造化されたアプローチにより、モデルは、学習段階ではよく整理されたクラスから効果的に学習し、テストおよび検証段階では正確に性能を評価することができる。

使用方法

例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="path/to/dataset", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

対応データセット

Ultralytics は以下のデータセットを自動ダウンロードでサポートしています:

  • Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
  • カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
  • CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
  • CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
  • Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
  • ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
  • ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
  • Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
  • Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
  • MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。

独自のデータセットを追加する

独自のデータセットを持っていて、それをUltralytics を使って分類モデルのトレーニングに使いたい場合は、そのデータセットが上記の「データセットのフォーマット」で指定されたフォーマットに従っていることを確認してから、 を指定してください。 data 引数でデータセット・ディレクトリを指定する。



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), stormsson (1), GreatV (1)

コメント