ImageWoofデータセット
ImageWoofデータセットは、分類が難しい10個のクラス(すべて犬種)で構成されるImageNetのサブセットです。より高度なモデルの開発を促進することを目指して、画像分類アルゴリズムが解決するためのより困難なタスクとして作成されました。
主な特徴
- ImageWoofには、オーストラリアン・テリア、ボーダー・テリア、サモエド、ビーグル、シーズー、English Foxhound、ローデシアン・リッジバック、ディンゴ、ゴールデン・レトリバー、オールドEnglish Sheepdogの10種類の犬種の画像が含まれています。
- このデータセットは、さまざまな解像度(フルサイズ、320px、160px)の画像を提供し、さまざまな計算能力や研究ニーズに対応します。
- また、ノイズの多いラベルを含むバージョンも含まれており、ラベルの信頼性が必ずしも高くない、より現実的なシナリオを提供します。
データセットの構造
ImageWoofデータセットの構造は、犬種のクラスに基づいており、各犬種が独自の画像ディレクトリを持っています。他の分類データセットと同様に、トレーニングセットと検証セット用に別々のフォルダを持つ分割ディレクトリ形式に従っています。
アプリケーション
ImageWoofデータセットは、画像分類タスクにおける深層学習モデルの学習および評価に広く使用されており、特に複雑で類似したクラスを扱う場合に適しています。このデータセットの課題は、犬種の微妙な違いにあり、モデルの性能と汎化能力の限界を試します。特に以下の点で価値があります。
- きめ細かいカテゴリにおける分類モデルのパフォーマンスのベンチマーク
- 類似したクラスに対するモデルの堅牢性のテスト
- 微妙な視覚的差異を区別できるアルゴリズムの開発
- 一般的ドメインから特定ドメインへの転移学習能力の評価
使用法
画像サイズ224x224でImageWoofデータセットでCNNモデルを100エポックトレーニングするには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
データセットのバリアント
ImageWoofデータセットには、さまざまな研究ニーズと計算能力に対応するために、3つの異なるサイズがあります。
-
フルサイズ (imagewoof): これはImageWoofデータセットのオリジナルバージョンです。フルサイズの画像が含まれており、最終的なトレーニングとパフォーマンスのベンチマークに最適です。
-
ミディアムサイズ (imagewoof320):このバージョンには、最大エッジ長が320ピクセルにリサイズされた画像が含まれています。モデルのパフォーマンスを大幅に犠牲にすることなく、より高速なトレーニングに適しています。
-
小さいサイズ (imagewoof160): このバージョンには、最大エッジ長が 160 ピクセルになるようにサイズ変更された画像が含まれています。トレーニング速度が優先される迅速なプロトタイピングと実験のために設計されています。
これらのバリアントをトレーニングで使用するには、データセット引数の「imagewoof」を「imagewoof320」または「imagewoof160」に置き換えるだけです。例:
例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224
小さい画像を使用すると、分類精度が低下する可能性があります。ただし、モデル開発とプロトタイピングの初期段階で迅速に反復処理を行うには最適な方法です。
サンプル画像とアノテーション
ImageWoof データセットには、さまざまな犬種のカラフルな画像が含まれており、画像分類タスクにとってやりがいのあるデータセットとなっています。以下は、データセットからの画像のいくつかの例です。
この例は、ImageWoofデータセット内の異なる犬種の微妙な違いと類似性を示しており、分類タスクの複雑さと難しさを示しています。
引用と謝辞
ImageWoofデータセットを研究または開発にご利用の際は、公式データセットリポジトリへのリンクを記載し、データセットの作成者を明記してください。
FastAIチームが、機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるImageWoofデータセットを作成、維持していることに感謝いたします。ImageWoofデータセットの詳細については、ImageWoofデータセットリポジトリをご覧ください。
よくある質問
UltralyticsにおけるImageWoofデータセットとは何ですか?
<a href="https://github.com/fastai/imagenette">ImageWoofデータセットは、10種類の特定の犬種に焦点を当てたImageNetの挑戦的なサブセットです。画像分類モデルの限界を押し広げるために作成され、ビーグル、シーズー、ゴールデンレトリバーなどの品種を特徴としています。このデータセットには、さまざまな解像度(フルサイズ、320px、160px)の画像や、より現実的なトレーニングシナリオのためのノイズの多いラベルも含まれています。この複雑さにより、ImageWoofはより高度な深層学習モデルの開発に最適です。
Ultralytics YOLOを使用して、ImageWoofデータセットでモデルをトレーニングするにはどうすればよいですか?
Ultralytics YOLOを使用してImageWoofデータセットでConvolutional Neural Network(CNN)モデルを画像サイズ224x224で100エポックトレーニングするには、次のコードを使用できます。
学習の例
from ultralytics import YOLO
model = YOLO("yolo11n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
利用可能なトレーニング引数の詳細については、トレーニングページを参照してください。
ImageWoofデータセットにはどのようなバージョンがありますか?
ImageWoof データセットには、次の 3 つのサイズがあります。
- フルサイズ (imagewoof): フルサイズの画像が含まれており、最終的なトレーニングとベンチマークに最適です。
- ミディアムサイズ (imagewoof320):最大エッジ長が320ピクセルにリサイズされた画像で、より高速なトレーニングに適しています。
- 小さいサイズ (imagewoof160): 最大エッジ長が 160 ピクセルのサイズ変更された画像は、迅速なプロトタイピングに最適です。
これらのバージョンを使用するには、データセット引数の「imagewoof」を適宜置き換えてください。ただし、画像が小さいほど分類の精度が低下する可能性があることに注意してください。これは、より迅速な反復処理に役立ちます。
ImageWoofデータセット内のノイズのあるラベルは、トレーニングにどのように役立ちますか?
ImageWoofデータセット内のノイズの多いラベルは、ラベルが必ずしも正確ではない現実世界の状況をシミュレートしています。このデータでモデルをトレーニングすることで、画像分類タスクにおけるロバスト性と汎化性を高めることができます。これにより、モデルは、実際のアプリケーションでよく遭遇する、曖昧または誤ったラベルのデータを効果的に処理できるようになります。
ImageWoofデータセットを使用する上での主な課題は何ですか?
ImageWoofデータセットの主な課題は、含まれる犬種の間の微妙な違いにあります。10の密接に関連する品種に焦点を当てているため、それらを区別するには、より高度で微調整された画像分類モデルが必要です。これにより、ImageWoofはディープラーニングモデルの機能と改善をテストするための優れたベンチマークになります。