Link to this sectionCaltech-101 データセット#
Caltech-101 データセットは、物体認識タスクに広く使用されているデータセットで、101の物体カテゴリーにわたる約9,000枚の画像が含まれています。各カテゴリーは多様な現実世界の物体を反映するように選定されており、画像自体も物体認識アルゴリズムの挑戦的なベンチマークとなるよう慎重に選ばれ、アノテーションが施されています。
Caltech-101 データセットには、学習用と検証用の分割があらかじめ定義されていません。しかし、以下の使用例で提供されている学習コマンドを使用すると、Ultralytics フレームワークが自動的にデータセットを分割します。デフォルトでは、学習セットに80%、検証セットに20%が使用されます。
Link to this section主な特徴#
- Caltech-101 データセットは、101のカテゴリーに分類された約9,000枚のカラー画像で構成されています。
- カテゴリーには、動物、乗り物、家庭用品、人物など、多種多様な物体が含まれています。
- 各カテゴリーの画像数は一定ではなく、カテゴリーごとに約40枚から800枚の画像が含まれています。
- 画像のサイズはさまざまで、多くは中解像度です。
- Caltech-101 は、機械学習の分野、特に物体認識タスクの学習やテストに広く利用されています。
Link to this sectionデータセットの構造#
他の多くのデータセットとは異なり、Caltech-101 データセットは学習用とテスト用に正式に分割されていません。ユーザーは通常、自身のニーズに合わせて独自に分割を作成します。ただし、一般的にはランダムな画像サブセットを学習に使用し(例:カテゴリーごとに30枚)、残りの画像をテストに使用する方法が一般的です。
Link to this sectionアプリケーション#
The Caltech-101 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its wide variety of categories and high-quality images make it an excellent dataset for research and development in the field of machine learning and computer vision.
Link to this section使用方法#
Caltech-101 データセットで YOLO モデルを100 epochs 学習させるには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデル Training ページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionサンプル画像とアノテーション#
Caltech-101 データセットには、さまざまな物体の高品質なカラー画像が含まれており、image classification タスクのための構造化されたデータセットを提供します。データセットの画像例をいくつか紹介します。

この例は、Caltech-101 データセットに含まれる物体の多様性と複雑さを示しており、堅牢な物体認識モデルを学習するための多様なデータセットの重要性を強調しています。
Link to this section引用と謝辞#
研究や開発作業で Caltech-101 データセットを使用する場合は、以下の論文を引用してください。
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}機械学習およびコンピュータビジョンの研究コミュニティにとって価値あるリソースとして Caltech-101 データセットを作成・維持している Li Fei-Fei、Rob Fergus、Pietro Perona の各氏に感謝いたします。Caltech-101 データセットとその作成者に関する詳細については、Caltech-101 dataset website をご覧ください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionCaltech-101 データセットは何のために機械学習で使用されますか?#
Caltech-101 データセットは、機械学習において物体認識タスクに広く使用されています。101のカテゴリーにわたる約9,000枚の画像が含まれており、物体認識アルゴリズムを評価するための挑戦的なベンチマークを提供します。研究者は、コンピュータビジョンにおいて、特に Convolutional Neural Networks (CNNs) や Support Vector Machines (SVMs) などのモデルを学習・テストするためにこのデータセットを活用しています。
Link to this sectionUltralytics YOLO モデルを Caltech-101 データセットで学習させるにはどうすればよいですか?#
Ultralytics YOLO モデルを Caltech-101 データセットで学習させるには、提供されているコードスニペットを使用します。例えば、100エポック学習させる場合は以下の通りです。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)詳細な引数やオプションについては、モデル Training ページを参照してください。
Link to this sectionCaltech-101 データセットの主な特徴は何ですか?#
Caltech-101 データセットには以下の特徴があります。
- 101のカテゴリーにわたる約9,000枚のカラー画像。
- 動物、乗り物、家庭用品など、多様な物体をカバーするカテゴリー。
- カテゴリーごとに40枚から800枚程度の画像が収録されています。
- 画像サイズは可変で、多くは中解像度です。
これらの特徴により、機械学習やコンピュータビジョンにおける物体認識モデルの学習および評価に最適な選択肢となっています。
Link to this section研究で Caltech-101 データセットを引用すべき理由は何ですか?#
研究で Caltech-101 データセットを引用することは、作成者の貢献を認めることにつながり、このデータセットを利用する他の人々のための参照先となります。推奨される引用形式は以下の通りです。
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用を行うことは、学術的な誠実さを維持し、他の研究者が元のリソースを見つける際の助けとなります。
Link to this sectionUltralytics Platform を使用して Caltech-101 データセットでモデルを学習できますか?#
はい、Ultralytics Platform を使用して Caltech-101 データセットでモデルを学習できます。Ultralytics Platform は、高度なコーディングを必要とせずにデータセットの管理、モデルの学習、デプロイを行うための直感的なプラットフォームを提供します。詳細なガイドについては、how to train your custom models with Ultralytics Platform ブログ記事を参照してください。