コンテンツへスキップ

ImageWoof データセット

ImageWoofデータセットは、ImageNetのサブセットで、分類が困難な10のクラスから構成されている。このデータセットは、画像分類アルゴリズムにとってより難しいタスクとして作成され、より高度なモデルの開発を促すことを目的としている。

主な特徴

  • ImageWoofには10種類の犬種の画像が含まれています:オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、English フォックスハウンド、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリーバー、オールドEnglish シープドッグ。
  • このデータセットは、さまざまな解像度(フルサイズ、320px、160px)の画像を提供しており、さまざまな計算能力や研究ニーズに対応している。
  • また、ノイズの多いラベルを使用したバージョンもあり、ラベルが必ずしも信頼できるとは限らない、より現実的なシナリオを提供する。

データセット構造

ImageWoofデータセットの構造は、犬種クラスに基づいており、各犬種は画像の独自のディレクトリを持っています。

アプリケーション

ImageWoofデータセットは、画像分類タスクにおけるディープラーニングモデルの訓練と評価に広く利用されており、特に複雑で類似したクラスが対象となる場合に適している。このデータセットの課題は、犬種間の微妙な違いにあり、モデルの性能と汎化の限界に挑戦している。

使用方法

ImageWoofデータセットで画像サイズ224x224のCNNモデルを100エポック学習させるには、以下のコードスニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

データセット バリアント

ImageWoofデータセットは、様々な研究ニーズと計算能力に対応するため、3つの異なるサイズがあります:

  1. フルサイズ(imagewoof):ImageWoofデータセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングや性能ベンチマークに最適です。

  2. 中サイズ(imagewoof320):このバージョンには、最大エッジ長320ピクセルにリサイズされた画像が含まれます。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。

  3. スモールサイズ(imagewoof160):このバージョンには、最大エッジ長160ピクセルにリサイズされた画像が含まれています。トレーニングスピードを優先するラピッドプロトタイピングや実験用に設計されています。

これらの変種をトレーニングに使うには、データセット引数の 'imagewoof' を 'imagewoof320' または 'imagewoof160' に置き換えるだけです。例えば

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the small-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

より小さな画像を使用すると、分類精度の点でパフォーマンスが低下する可能性が高いことに注意することが重要です。しかし、モデル開発とプロトタイピングの初期段階において、素早く反復する優れた方法です。

サンプル画像と注釈

ImageWoofデータセットには、様々な犬種のカラフルな画像が含まれており、画像分類タスクにとってチャレンジングなデータセットとなっている。このデータセットの画像の例をいくつか紹介します:

データセットサンプル画像

この例では、ImageWoofデータセットに含まれるさまざまな犬種間の微妙な違いと類似点が示されており、分類タスクの複雑さと難しさが強調されている。

引用と謝辞

ImageWoofデータセットを研究または開発で使用する場合は、必ず公式データセットリポジトリにリンクし、データセットの作成者に謝辞を述べてください。

機械学習と コンピュータビジョンの研究コミュニティのための貴重なリソースとしてImageWoofデータセットを作成し、維持しているFastAIチームに感謝いたします。ImageWoofデータセットの詳細については、ImageWoofデータセットリポジトリをご覧ください。

よくあるご質問

Ultralytics 、ImageWoofデータセットとは?

ImageWoofデータセットは、ImageNetのサブセットで、10種類の特定の犬種に焦点を当てたチャレンジングなものである。画像分類モデルの限界に挑戦するために作成され、ビーグル、シーズー、ゴールデンレトリバーなどの犬種を特徴としています。データセットには様々な解像度の画像(フルサイズ、320px、160px)が含まれており、より現実的な学習シナリオのためにノイズの多いラベルも含まれています。この複雑さにより、ImageWoofはより高度なディープラーニングモデルの開発に理想的なものとなっている。

ImageWoof データセットを使って、Ultralytics YOLO でモデルを学習するにはどうすればよいですか?

画像サイズ224x224で100エポック、Ultralytics YOLO 、ImageWoofデータセットで畳み込みニューラルネットワーク(CNN)モデルを学習するには、以下のコードを使用します:

列車の例

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

利用可能なトレーニングの詳細については、トレーニングのページを参照してください。

ImageWoofデータセットにはどのようなバージョンがありますか?

ImageWoofデータセットには3つのサイズがある:

  1. フルサイズ(imagewoof):最終トレーニングやベンチマークに最適で、フルサイズの画像が含まれています。
  2. 中サイズ(imagewoof320):最大エッジ長320ピクセルのリサイズ画像で、高速トレーニングに適しています。
  3. 小型サイズ(imagewoof160):ラピッドプロトタイピングに最適です。

データセット引数の'imagewoof'を適宜置き換えて、これらのバージョンを使用する。ただし、画像が小さいと分類精度が落ちる可能性があることに注意。

ImageWoofデータセットに含まれるノイズの多いラベルは、トレーニングにどのように役立つのか?

ImageWoofデータセットに含まれるノイズの多いラベルは、ラベルが常に正確とは限らない実世界の状況をシミュレートしています。このデータを使ってモデルをトレーニングすることで、画像分類タスクにおけるロバスト性と汎化性を向上させることができます。これにより、実用的なアプリケーションでしばしば遭遇する、曖昧なデータや誤ったラベル付けされたデータを効果的に扱うためのモデルが準備される。

ImageWoofデータセットを使用する上での主な課題は何ですか?

ImageWoofデータセットの主な課題は、含まれる犬種間の微妙な違いにある。密接に関連する10の犬種に焦点を当てているため、これらの犬種を区別するには、より高度で微調整された画像分類モデルが必要となる。このため、ImageWoofはディープラーニングモデルの能力と改善点をテストするための優れたベンチマークとなっている。

📅作成 1年前 ✏️更新:1ヶ月前

コメント