ImageWoof データセット

Q: What versions of the ImageWoof dataset are available?

ImageWoofデータセットには3つのサイズがある：データセット引数の'imagewoof'を適宜置き換えて、これらのバージョンを使用する。ただし、画像が小さいと分類精度が落ちる可能性があることに注意。

ImageWoofデータセットはImageNetのサブセットで、分類が困難な10のクラスから構成されている。このデータセットは、画像分類アルゴリズムにとってより難しいタスクとして作成され、より高度なモデルの開発を促すことを目的としている。

主な特徴

ImageWoofには10種類の犬種の画像が含まれています：オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、English フォックスハウンド、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリーバー、オールドEnglish シープドッグ。
このデータセットでは、さまざまな解像度（フルサイズ、320px、160px）の画像を提供しており、さまざまな計算能力や研究ニーズに対応している。
また、ノイズの多いラベルを使用したバージョンもあり、ラベルが必ずしも信頼できるとは限らない、より現実的なシナリオを提供する。

データセット構造

ImageWoofデータセットの構造は、犬種クラスに基づいており、各犬種は画像の独自のディレクトリを持っています。

アプリケーション

ImageWoofデータセットは、画像分類タスクにおけるディープラーニングモデルの訓練と評価に広く利用されており、特に複雑で類似したクラスが対象となる場合に適している。このデータセットの課題は、犬種間の微妙な違いにあり、モデルの性能と汎化の限界に挑戦している。

使用方法

ImageWoofデータセットで画像サイズ224x224のCNNモデルを100エポック学習させるには、以下のコードスニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

データセットバリアント

ImageWoofデータセットは、様々な研究ニーズと計算能力に対応するため、3つの異なるサイズがあります：

フルサイズ（imagewoof）：ImageWoofデータセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングや性能ベンチマークに最適です。
中サイズ（imagewoof320）：このバージョンには、最大エッジ長320ピクセルにリサイズされた画像が含まれます。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。
スモールサイズ（imagewoof160）：このバージョンには、最大エッジ長160ピクセルにリサイズされた画像が含まれています。トレーニングスピードを優先するラピッドプロトタイピングや実験用に設計されています。

これらの変種をトレーニングに使うには、データセット引数の 'imagewoof' を 'imagewoof320' または 'imagewoof160' に置き換えるだけです。例えば

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

より小さな画像を使用すると、分類精度の点でパフォーマンスが低下する可能性が高いことに注意することが重要です。しかし、モデル開発とプロトタイピングの初期段階において、素早く反復する優れた方法です。

サンプル画像と注釈

ImageWoofデータセットには、様々な犬種のカラフルな画像が含まれており、画像分類タスクにとってチャレンジングなデータセットとなっている。このデータセットの画像の例をいくつか紹介します：

データセットサンプル画像

この例では、ImageWoofデータセットに含まれるさまざまな犬種間の微妙な違いと類似点が示されており、分類タスクの複雑さと難しさが強調されている。

引用と謝辞

ImageWoofデータセットを研究または開発で使用する場合は、必ず公式データセットリポジトリにリンクし、データセットの作成者に謝辞を述べてください。

機械学習とコンピュータビジョンの研究コミュニティのための貴重なリソースとしてImageWoofデータセットを作成し、維持しているFastAIチームに感謝いたします。ImageWoofデータセットの詳細については、ImageWoofデータセットリポジトリをご覧ください。

よくあるご質問

Ultralytics 、ImageWoofデータセットとは？

ImageWoofデータセットは、ImageNetのサブセットで、10種類の特定の犬種に焦点を当てたチャレンジングなものである。画像分類モデルの限界に挑戦するために作成され、ビーグル、シーズー、ゴールデンレトリバーなどの犬種を特徴としています。データセットには様々な解像度の画像（フルサイズ、320px、160px）が含まれており、より現実的な学習シナリオのためにノイズの多いラベルも含まれています。この複雑さにより、ImageWoofはより高度なディープラーニングモデルの開発に理想的なものとなっている。