画像分類データセットの概要
YOLO 分類タスクのデータセット構造
について Ultralytics YOLO 分類タスクでは、データセットは、以下のような特定の分割ディレコトリー構造で編成されなければならない。 root
ディレクトリを作成し、適切なトレーニング、テスト、およびオプションの検証プロセスを容易にします。この構造には、トレーニング(train
)とテスト(test
) フェーズで、オプションで検証用のディレクトリ (val
).
これらのディレクトリには、データセットの各クラスごとに1つのサブディレクトリが含まれていなければならない。サブディレクトリには対応するクラスの名前をつけ、そのクラスのすべての画像を入れる。各画像ファイルにユニークな名前をつけ、JPEGやPNGのような一般的な形式で保存されていることを確認してください。
フォルダ構造例
CIFAR-10データセットを例に考えてみよう。フォルダ構造は以下のようになるはずだ:
cifar-10-/
|
|-- train/
| |-- airplane/
| | |-- 10008_airplane.png
| | |-- 10009_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 1000_automobile.png
| | |-- 1001_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 10014_bird.png
| | |-- 10015_bird.png
| | |-- ...
| |
| |-- ...
|
|-- test/
| |-- airplane/
| | |-- 10_airplane.png
| | |-- 11_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 100_automobile.png
| | |-- 101_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 1000_bird.png
| | |-- 1001_bird.png
| | |-- ...
| |
| |-- ...
|
|-- val/ (optional)
| |-- airplane/
| | |-- 105_airplane.png
| | |-- 106_airplane.png
| | |-- ...
| |
| |-- automobile/
| | |-- 102_automobile.png
| | |-- 103_automobile.png
| | |-- ...
| |
| |-- bird/
| | |-- 1045_bird.png
| | |-- 1046_bird.png
| | |-- ...
| |
| |-- ...
この構造化されたアプローチにより、モデルは、学習段階ではよく整理されたクラスから効果的に学習し、テストおよび検証段階では正確に性能を評価することができる。
使用方法
例
対応データセット
Ultralytics は以下のデータセットを自動ダウンロードでサポートしています:
- Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
- カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
- CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
- CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
- Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
- ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
- ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
- Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
- Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
- MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。
独自のデータセットを追加する
独自のデータセットを持っていて、それをUltralytics を使って分類モデルのトレーニングに使いたい場合は、そのデータセットが上記の「データセットのフォーマット」で指定されたフォーマットに従っていることを確認してから、 を指定してください。 data
引数でデータセット・ディレクトリを指定する。