ImageWoof データセット

Q: What is the ImageWoof dataset in Ultralytics?

ImageWoofデータセットは、ImageNetのサブセットで、10の特定の犬種に焦点を当てたチャレンジングなものである。画像分類モデルの限界に挑戦するために作成され、ビーグル、シーズー、ゴールデンレトリバーなどの犬種を特徴としています。データセットには様々な解像度（フルサイズ、320px、160px）の画像が含まれており、より現実的な学習シナリオのためにノイズの多いラベルも含まれています。この複雑さにより、ImageWoofはより高度なディープラーニングモデルの開発に理想的なものとなっている。

Q: What versions of the ImageWoof dataset are available?

ImageWoofデータセットには3つのサイズがある：データセット引数の'imagewoof'を適宜置き換えて、これらのバージョンを使用する。ただし、画像が小さいと分類精度が落ちる可能性があることに注意。

ImageWoofデータセットはImageNetのサブセットで、分類が困難な10のクラスから構成されている。このデータセットは、画像分類アルゴリズムにとってより難しいタスクとして作成され、より高度なモデルの開発を促すことを目的としている。

主な特徴

ImageWoofには10種類の犬種の画像が含まれています：オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、English フォックスハウンド、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリーバー、オールドEnglish シープドッグ。
このデータセットでは、さまざまな解像度（フルサイズ、320px、160px）の画像を提供しており、さまざまな計算能力や研究ニーズに対応している。
また、ノイズの多いラベルを使用したバージョンもあり、ラベルが必ずしも信頼できるとは限らない、より現実的なシナリオを提供する。

データセット構造

ImageWoofデータセットの構造は、犬種クラスに基づいており、それぞれの犬種が画像のディレクトリを持っている。他の分類データセットと同様に、訓練セットと検証セット用に別々のフォルダを持つ分割ディレクトリ形式に従っている。

アプリケーション

ImageWoofデータセットは、画像分類タスクにおけるディープラーニングモデルの訓練と評価に広く利用されており、特に複雑で類似したクラスが対象となる場合に適している。このデータセットの課題は、犬種間の微妙な違いにあり、モデルの性能と汎化の限界に挑戦している。このデータセットは、特に以下のような用途に適しています：

分類モデルの性能を細かいカテゴリーでベンチマークする
類似クラスに対するモデルの頑健性のテスト
微妙な視覚的差異を識別できるアルゴリズムの開発
一般領域から特定領域への転移学習能力の評価

使用方法

ImageWoofデータセットで画像サイズ224x224のCNNモデルを100エポック学習させるには、以下のコードスニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

データセットバリアント

ImageWoofデータセットは、様々な研究ニーズと計算能力に対応するため、3つの異なるサイズがあります：

フルサイズ（imagewoof）：ImageWoofデータセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングや性能ベンチマークに最適です。
中サイズ（imagewoof320）：このバージョンには、最大エッジ長320ピクセルにリサイズされた画像が含まれます。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。
スモールサイズ（imagewoof160）：このバージョンには、最大エッジ長160ピクセルにリサイズされた画像が含まれています。トレーニングのスピードが優先されるラピッドプロトタイピングや実験用に設計されています。

これらの変種をトレーニングに使うには、データセット引数の 'imagewoof' を 'imagewoof320' または 'imagewoof160' に置き換えるだけです。例えば

例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

より小さな画像を使用すると、分類精度の点でパフォーマンスが低下する可能性が高いことに注意することが重要です。しかし、モデル開発とプロトタイピングの初期段階において、素早く反復する優れた方法です。

サンプル画像と注釈

ImageWoofデータセットには、様々な犬種のカラフルな画像が含まれており、画像分類タスクにとってチャレンジングなデータセットとなっている。このデータセットの画像の例をいくつか紹介します：

データセットサンプル画像

この例では、ImageWoofデータセットに含まれるさまざまな犬種間の微妙な違いと類似点が示されており、分類タスクの複雑さと難しさが強調されている。

引用と謝辞

ImageWoofデータセットを研究または開発で使用する場合は、必ず公式データセットリポジトリにリンクし、データセットの作成者に謝辞を述べてください。

機械学習とコンピュータビジョンの研究コミュニティのための貴重なリソースとしてImageWoofデータセットを作成し、維持しているFastAIチームに感謝いたします。ImageWoofデータセットの詳細については、ImageWoofデータセットリポジトリをご覧ください。

よくあるご質問

Ultralytics 、ImageWoofデータセットとは？

ImageWoofデータセットは、ImageNetのサブセットで、10種類の特定の犬種に焦点を当てたチャレンジングなものである。画像分類モデルの限界に挑戦するために作成され、ビーグル、シーズー、ゴールデンレトリバーなどの犬種を特徴としています。データセットには様々な解像度（フルサイズ、320px、160px）の画像が含まれており、より現実的な学習シナリオのためにノイズの多いラベルも含まれています。この複雑さにより、ImageWoofはより高度なディープラーニングモデルの開発に理想的なものとなっている。

ImageWoof データセットを使って、Ultralytics YOLO でモデルを学習するには？

画像サイズ224x224で100エポック、Ultralytics YOLO 、ImageWoofデータセットで畳み込みニューラルネットワーク（CNN）モデルを学習するには、以下のコードを使用します：

列車の例

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

利用可能なトレーニングの詳細については、トレーニングのページを参照してください。

ImageWoofデータセットにはどのようなバージョンがありますか？

ImageWoofデータセットには3つのサイズがある：

フルサイズ（imagewoof）：最終トレーニングやベンチマークに最適で、フルサイズの画像が含まれています。
中サイズ（imagewoof320）：最大エッジ長320ピクセルのリサイズ画像で、高速トレーニングに適しています。
小型サイズ（imagewoof160）：ラピッドプロトタイピングに最適です。

データセット引数の'imagewoof'を適宜置き換えて、これらのバージョンを使用する。ただし、画像が小さいと分類精度が落ちる可能性があることに注意。

ImageWoofデータセットに含まれるノイズの多いラベルは、トレーニングにどのように役立つのか？

ImageWoofデータセットに含まれるノイズの多いラベルは、ラベルが常に正確とは限らない実世界の状況をシミュレートしています。このデータを使ってモデルをトレーニングすることで、画像分類タスクにおけるロバスト性と汎化性を向上させることができます。これにより、実用的なアプリケーションでしばしば遭遇する、曖昧なデータや誤ったラベル付けされたデータを効果的に扱うためのモデルが準備される。

ImageWoofデータセットを使用する上での主な課題は何ですか？

ImageWoofデータセットの主な課題は、含まれる犬種間の微妙な違いにある。密接に関連する10の犬種に焦点を当てているため、これらの犬種を区別するには、より高度で微調整された画像分類モデルが必要となる。このため、ImageWoofはディープラーニングモデルの能力と改善点をテストするための優れたベンチマークとなっている。

📅作成：1年前 ✏️更新しました 8日前