Caltech-101 データセット
Caltech-101データセットは、オブジェクト認識タスクで広く使用されているデータセットであり、101のオブジェクトカテゴリから約9,000の画像が含まれています。カテゴリは、さまざまな現実世界のオブジェクトを反映するように選択され、画像自体は、オブジェクト認識アルゴリズムの挑戦的なベンチマークを提供するために慎重に選択および注釈が付けられています。
見る: トレーニング方法 画像分類 Ultralytics HUBでCaltech-256データセットを使用するモデル
自動データ分割
提供されているCaltech-101データセットには、事前定義されたtrain/validation分割は含まれていません。ただし、以下の使用例で提供されているトレーニングコマンドを使用すると、Ultralyticsフレームワークが自動的にデータセットを分割します。デフォルトで使用される分割は、トレーニングセットに80%、検証セットに20%です。
主な特徴
- Caltech-101データセットは、約9,000枚のカラー画像で構成され、101のカテゴリに分類されています。
- カテゴリには、動物、車両、家庭用品、人物など、幅広いオブジェクトが含まれています。
- カテゴリごとの画像数は異なり、各カテゴリに約 40〜800 枚の画像があります。
- 画像のサイズは様々で、ほとんどの画像は中程度の解像度です。
- Caltech-101 は、機械学習、特に物体認識タスクの分野におけるトレーニングとテストに広く使用されています。
データセットの構造
他の多くのデータセットとは異なり、Caltech-101データセットは、トレーニングセットとテストセットに正式に分割されていません。通常、ユーザーは特定のニーズに基づいて独自の分割を作成します。ただし、一般的な方法としては、トレーニングに画像のランダムなサブセット(カテゴリあたり30画像など)を使用し、残りの画像をテストに使用します。
アプリケーション
Caltech-101データセットは、深層学習モデルをオブジェクト認識タスクでトレーニングおよび評価するために広く使用されています。たとえば、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、およびその他のさまざまな機械学習アルゴリズムなどです。その幅広いカテゴリと高品質の画像により、機械学習およびコンピュータビジョンの分野における研究開発に最適なデータセットとなっています。
使用法
Caltech-101データセットでYOLOモデルを100エポック学習させるには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416
サンプル画像とアノテーション
Caltech-101データセットには、さまざまなオブジェクトの高品質カラー画像が含まれており、画像分類タスク用に適切に構造化されたデータセットが提供されています。以下は、データセットからの画像の例です。
この例では、Caltech-101データセット内のオブジェクトの多様性と複雑さを紹介し、堅牢な物体認識モデルをトレーニングするための多様なデータセットの重要性を強調しています。
引用と謝辞
Caltech-101 データセットを研究または開発で使用する場合は、次の論文を引用してください。
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるCaltech-101データセットを作成および管理しているLi Fei-Fei、Rob Fergus、Pietro Peronaの各氏に感謝いたします。Caltech-101データセットとその作成者の詳細については、Caltech-101データセットのWebサイトをご覧ください。
よくある質問
Caltech-101データセットは、機械学習で何に使用されますか?
Caltech-101データセットは、オブジェクト認識タスクのために機械学習で広く使用されています。約101のカテゴリにわたる約9,000枚の画像が含まれており、オブジェクト認識アルゴリズムを評価するための挑戦的なベンチマークを提供します。研究者は、特にコンピュータビジョンにおいて、Convolutional Neural Networks (CNN) やSupport Vector Machines (SVM) などのモデルをトレーニングおよびテストするために利用しています。
Caltech-101データセットでUltralytics YOLOモデルをトレーニングするにはどうすればよいですか?
Caltech-101データセットでUltralytics YOLOモデルを学習させるには、提供されているコードスニペットを使用できます。たとえば、100エポック学習させるには:
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416
引数とオプションの詳細については、モデルのトレーニングページを参照してください。
Caltech-101データセットの主な特徴は何ですか?
Caltech-101データセットには以下が含まれます。
- 101のカテゴリーにわたる約9,000枚のカラー画像。
- 動物、乗り物、家庭用品など、多様なオブジェクトを網羅するカテゴリ。
- カテゴリごとの画像数は変動し、通常は40〜800枚です。
- 画像のサイズは様々で、ほとんどが中程度の解像度です。
これらの機能により、機械学習とコンピュータビジョンのオブジェクト認識モデルのトレーニングと評価に最適です。
研究でCaltech-101データセットを引用すべきなのはなぜですか?
研究でCaltech-101データセットを引用することは、作成者の貢献を認め、データセットを使用する可能性のある他の人への参考文献を提供することになります。推奨される引用は次のとおりです:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
引用は、学術研究の完全性を維持し、仲間が元のリソースを見つけるのに役立ちます。
Caltech-101データセットでモデルをトレーニングするためにUltralytics HUBを使用できますか?
はい、Ultralytics HUBを使用して、Caltech-101データセットでモデルをトレーニングできます。Ultralytics HUBは、データセットの管理、モデルのトレーニング、および広範なコーディングなしでのデプロイメントのための直感的なプラットフォームを提供します。詳細なガイドについては、Ultralytics HUBでカスタムモデルをトレーニングする方法のブログ投稿を参照してください。