Caltech-101 データセット
Caltech-101 データセットは、物体認識タスクに広く使用されているデータセットで、101のカテゴリに分類された約9,000枚の画像が含まれています。各カテゴリは、現実世界の多様な物体を反映するように選定されており、画像自体も物体認識アルゴリズムに対する難易度の高いベンチマークとなるよう慎重に選択およびアノテーションされています。
Caltech-101 データセットには、あらかじめ定義された学習用/検証用の分割データは含まれていません。しかし、以下の使用例で提供される学習コマンドを使用すれば、Ultralytics フレームワークが自動的にデータセットを分割します。デフォルトの分割設定は、学習セットが80%、検証セットが20%です。
主な特徴
- Caltech-101 データセットは、101のカテゴリに分けられた約9,000枚のカラー画像で構成されています。
- 各カテゴリには、動物、乗り物、家庭用品、人物など、多種多様な物体が含まれています。
- 各カテゴリの画像数は一定ではなく、1カテゴリあたり約40枚から800枚となっています。
- 画像のサイズは可変であり、その多くは中解像度です。
- Caltech-101 は、機械学習分野、特に物体認識タスクの学習およびテストに広く利用されています。
データセットの構造
他の多くのデータセットとは異なり、Caltech-101 データセットは公式には学習セットとテストセットに分割されていません。ユーザーは通常、特定のニーズに合わせて独自の分割を作成します。ただし、一般的な手法として、ランダムなサブセットを学習に使用し(例:1カテゴリあたり30枚)、残りの画像をテストに使用する方法があります。
アプリケーション
The Caltech-101 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its wide variety of categories and high-quality images make it an excellent dataset for research and development in the field of machine learning and computer vision.
使用方法
Caltech-101 データセットを使用してYOLOモデルを100 エポック分学習させるには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルのトレーニングページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)サンプル画像とアノテーション
Caltech-101 データセットには、さまざまな物体の高品質なカラー画像が含まれており、画像分類タスクのための適切に構造化されたデータセットとなっています。以下は、このデータセットに含まれる画像の例です。

この例は、Caltech-101 データセットに含まれる物体の多様性と複雑さを示しており、堅牢な物体認識モデルを学習するための多様なデータセットの重要性を強調しています。
引用と謝辞
研究や開発作業で Caltech-101 データセットを使用する場合は、以下の論文を引用してください。
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}機械学習およびコンピュータビジョンの研究コミュニティにとって貴重なリソースとして Caltech-101 データセットを作成・維持してくださった Li Fei-Fei 氏、Rob Fergus 氏、Pietro Perona 氏に感謝いたします。Caltech-101 データセットとその作成者に関する詳細については、Caltech-101 データセットのウェブサイトをご覧ください。
FAQ
機械学習において Caltech-101 データセットは何に使用されますか?
Caltech-101 データセットは、機械学習における物体認識タスクに広く使用されています。101のカテゴリにわたる約9,000枚の画像が含まれており、物体認識アルゴリズムを評価するための難易度の高いベンチマークとなっています。研究者は、コンピュータビジョンにおけるニューラルネットワーク (CNN) やサポートベクターマシン (SVM) などのモデルを学習・テストするために活用しています。
Caltech-101 データセットで Ultralytics YOLO モデルを学習するにはどうすればよいですか?
Caltech-101 データセットで Ultralytics YOLO モデルを学習するには、提供されているコードスニペットを使用します。例えば、100エポック学習させる場合は以下の通りです。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)より詳細な引数やオプションについては、モデルのトレーニングページを参照してください。
Caltech-101 データセットの主な特徴は何ですか?
Caltech-101 データセットには以下が含まれます。
- 101カテゴリにわたる約9,000枚のカラー画像。
- 動物、乗り物、家庭用品など、多種多様な物体を網羅するカテゴリ。
- カテゴリごとに異なる画像数(通常40枚から800枚の間)。
- 可変の画像サイズ(多くは中解像度)。
これらの特徴により、機械学習やコンピュータビジョンにおける物体認識モデルの学習および評価に最適な選択肢となっています。
なぜ研究で Caltech-101 データセットを引用すべきなのですか?
研究で Caltech-101 データセットを引用することは、作成者の貢献を認め、そのデータセットを使用する可能性のある他の研究者のための参照元を提供することになります。推奨される引用形式は以下の通りです。
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用を行うことは、学術研究の誠実性を維持し、他の研究者が元のリソースを見つけるのを助けることにつながります。
Ultralytics Platform を使用して Caltech-101 データセットでモデルを学習できますか?
はい、Ultralytics Platform を使用して Caltech-101 データセットでモデルを学習できます。Ultralytics Platform は、データセットの管理、モデルの学習、そして広範なコーディングなしでのデプロイメントを可能にする直感的なプラットフォームを提供します。詳細なガイドについては、Ultralytics Platform でカスタムモデルを学習する方法というブログ記事を参照してください。