ImageWoof データセット
ImageWoofデータセットはImageNetのサブセットで、分類が困難な10のクラスから構成されている。このデータセットは、画像分類アルゴリズムにとってより難しいタスクとして作成され、より高度なモデルの開発を促すことを目的としている。
主な特徴
- ImageWoofには10種類の犬種の画像が含まれています:オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、English フォックスハウンド、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリーバー、オールドEnglish シープドッグ。
- このデータセットでは、さまざまな解像度(フルサイズ、320px、160px)の画像を提供しており、さまざまな計算能力や研究ニーズに対応している。
- また、ノイズの多いラベルを使用したバージョンもあり、ラベルが必ずしも信頼できるとは限らない、より現実的なシナリオを提供する。
データセット構造
ImageWoofデータセットの構造は、犬種クラスに基づいており、各犬種は画像の独自のディレクトリを持っています。
アプリケーション
ImageWoofデータセットは、画像分類タスクにおけるディープラーニングモデルの訓練と評価に広く利用されており、特に複雑で類似したクラスが対象となる場合に適している。このデータセットの課題は、犬種間の微妙な違いにあり、モデルの性能と汎化の限界に挑戦している。
使用方法
ImageWoofデータセットで画像サイズ224x224のCNNモデルを100エポック学習させるには、以下のコードスニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。
列車の例
データセット バリアント
ImageWoofデータセットは、様々な研究ニーズと計算能力に対応するため、3つの異なるサイズがあります:
-
フルサイズ(imagewoof):ImageWoofデータセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングや性能ベンチマークに最適です。
-
中サイズ(imagewoof320):このバージョンには、最大エッジ長320ピクセルにリサイズされた画像が含まれます。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。
-
スモールサイズ(imagewoof160):このバージョンには、最大エッジ長160ピクセルにリサイズされた画像が含まれています。トレーニングスピードを優先するラピッドプロトタイピングや実験用に設計されています。
これらの変種をトレーニングに使うには、データセット引数の 'imagewoof' を 'imagewoof320' または 'imagewoof160' に置き換えるだけです。例えば
from ultralytics import YOLO
# Load a model
model = YOLO('yolov8n-cls.pt') # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)
# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)
より小さな画像を使用すると、分類精度の点でパフォーマンスが低下する可能性が高いことに注意することが重要です。しかし、モデル開発とプロトタイピングの初期段階において、素早く反復する優れた方法です。
サンプル画像と注釈
ImageWoofデータセットには、様々な犬種のカラフルな画像が含まれており、画像分類タスクにとってチャレンジングなデータセットとなっている。このデータセットの画像の例をいくつか紹介します:
この例では、ImageWoofデータセットに含まれるさまざまな犬種間の微妙な違いと類似点が示されており、分類タスクの複雑さと難しさが強調されている。
引用と謝辞
ImageWoofデータセットを研究または開発で使用する場合は、必ず公式データセットリポジトリにリンクし、データセットの作成者に謝辞を述べてください。
機械学習とコンピュータビジョンの研究コミュニティのための貴重なリソースとしてImageWoofデータセットを作成し、維持しているFastAIチームに感謝いたします。ImageWoofデータセットの詳細については、ImageWoofデータセットリポジトリをご覧ください。