ImageWoof データセット

ImageWoof データセットは、ImageNet のサブセットであり、すべて犬種であるため分類が困難な10のクラスで構成されています。これは、より高度なモデルの開発を促進することを目的として、画像分類アルゴリズムにとってより難しいタスクとして作成されました。

主な特徴

  • ImageWoofには、オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、イングリッシュ・フォックスハウンド、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリバー、オールド・イングリッシュ・シープドッグという10種類の犬種の画像が含まれています。
  • このデータセットは、さまざまな計算能力や研究ニーズに対応できるよう、複数の解像度(フルサイズ、320px、160px)で画像を提供しています。
  • また、ラベルが常に信頼できるとは限らないという、より現実的なシナリオを想定したノイズラベル付きのバージョンも含まれています。

データセットの構造

ImageWoof データセットの構造は犬種のクラスに基づいており、各品種が独自の画像ディレクトリを持っています。他の分類データセットと同様に、トレーニングセットとバリデーションセット用の個別のフォルダーを備えた分割ディレクトリ形式を採用しています。

アプリケーション

ImageWoof データセットは、画像分類タスク、特に複雑で類似したクラスを扱う場合において、ディープラーニングモデルのトレーニングと評価に広く使用されています。このデータセットの難しさは、犬種間の微妙な違いにあり、モデルのパフォーマンスと汎化性能の限界を押し広げます。特に以下のような場合に役立ちます:

  • きめ細かなカテゴリにおける分類モデルのパフォーマンスのベンチマーク
  • 類似したクラスに対するモデルの堅牢性のテスト
  • 微妙な視覚的差異を識別できるアルゴリズムの開発
  • 汎用ドメインから特定ドメインへの転移学習能力の評価

使用方法

ImageWoof データセットを使用して画像サイズ224x224で100 エポック分 CNN モデルをトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

データセットのバリエーション

ImageWoof データセットには、さまざまな研究ニーズや計算能力に対応するため、3つの異なるサイズが用意されています。

  1. フルサイズ (imagewoof): これは ImageWoof データセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングやパフォーマンスのベンチマークに最適です。

  2. 中サイズ (imagewoof320): このバージョンには、最大エッジ長が320ピクセルになるようにリサイズされた画像が含まれています。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。

  3. 小サイズ (imagewoof160): このバージョンには、最大エッジ長が160ピクセルになるようにリサイズされた画像が含まれています。トレーニング速度が優先される迅速なプロトタイプ作成や実験用に設計されています。

これらのバリエーションをトレーニングで使用するには、データセット引数の 'imagewoof' を 'imagewoof320' または 'imagewoof160' に置き換えるだけです。例:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

より小さな画像を使用すると、分類精度の面でパフォーマンスが低下する可能性があることに注意することが重要です。ただし、これはモデル開発やプロトタイプ作成の初期段階で迅速に反復を行うための優れた方法です。

サンプル画像とアノテーション

ImageWoof データセットには、さまざまな犬種のカラフルな画像が含まれており、画像分類タスクにとって挑戦的なデータセットとなっています。以下は、データセットの画像例です:

ImageWoof 犬種分類データセットのサンプル

この例は、ImageWoof データセット内の異なる犬種間の微妙な違いや類似性を示しており、分類タスクの複雑さと難しさを浮き彫りにしています。

引用と謝辞

研究や開発作業で ImageWoof データセットを使用する場合は、公式データセットリポジトリへのリンクを貼り、データセットの作成者に謝辞を述べるようにしてください。

We would like to acknowledge the FastAI team for creating and maintaining the ImageWoof dataset as a valuable resource for the machine learning and computer vision research community. For more information about the ImageWoof dataset, visit the ImageWoof dataset repository.

FAQ

Ultralytics における ImageWoof データセットとは何ですか?

ImageWoof データセットは、10種類の特定の犬種に焦点を当てた、ImageNet の挑戦的なサブセットです。画像分類モデルの限界を押し広げるために作成され、ビーグル、シーズー、ゴールデン・レトリバーなどの品種を特徴としています。このデータセットには、さまざまな解像度(フルサイズ、320px、160px)の画像が含まれており、より現実的なトレーニングシナリオのためにノイズラベルさえ用意されています。この複雑さにより、ImageWoof はより高度なディープラーニングモデルの開発に理想的です。

Ultralytics YOLO を使用して ImageWoof データセットでモデルをトレーニングするにはどうすればよいですか?

Ultralytics YOLO を使用して、画像サイズ 224x224 で 100 エポック分、ImageWoof データセット上で畳み込みニューラルネットワーク (CNN) モデルをトレーニングするには、以下のコードを使用できます。

トレーニングの例
from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

利用可能なトレーニング引数の詳細については、トレーニングページを参照してください。

ImageWoof データセットにはどのようなバージョンがありますか?

ImageWoof データセットには3つのサイズがあります:

  1. フルサイズ (imagewoof): フルサイズの画像を含んでおり、最終的なトレーニングとベンチマークに最適です。
  2. 中サイズ (imagewoof320): 最大エッジ長が 320 ピクセルにリサイズされた画像で、より高速なトレーニングに適しています。
  3. 小サイズ (imagewoof160): 最大エッジ長が 160 ピクセルにリサイズされた画像で、迅速なプロトタイプ作成に最適です。

データセット引数内の 'imagewoof' を適宜置き換えて、これらのバージョンを使用してください。ただし、画像サイズが小さくなると分類精度が低下する可能性があることに注意してください。これらは迅速なイテレーションに役立つ場合があります。

ImageWoof データセットのノイズラベルは、どのようにトレーニングに役立ちますか?

ImageWoof データセットのノイズラベルは、ラベルが常に正確とは限らない実世界の状況をシミュレートします。このデータでモデルをトレーニングすることは、画像分類タスクにおける堅牢性と汎化性能を向上させるのに役立ちます。これにより、実用的なアプリケーションで頻繁に遭遇する、曖昧または誤ったラベル付けがされたデータに対処する準備がモデルに整います。

ImageWoof データセットを使用する際の主な課題は何ですか?

ImageWoof データセットの主な課題は、含まれている犬種間の微妙な違いにあります。密接に関連した10の品種に焦点を当てているため、それらを区別するにはより高度で微調整された画像分類モデルが必要です。これにより、ImageWoof はディープラーニングモデルの機能と改善をテストするための優れたベンチマークとなります。

コメント