Link to this sectionCaltech-101 データセット#
Caltech-101 データセットは、物体認識タスクに広く使用されているデータセットで、101のカテゴリに分類された約9,000枚の画像が含まれています。カテゴリは実世界の様々な物体を反映するように選定されており、画像自体も物体認識アルゴリズムの挑戦的なベンチマークとして提供するために慎重に選択され、アノテーションされています。
提供されている Caltech-101 データセットには、あらかじめ定義された学習用/検証用の分割は含まれていません。しかし、以下の使用例で提供されている学習コマンドを使用すると、Ultralytics フレームワークが自動的にデータセットを分割します。デフォルトでは、学習用セットに80%、検証用セットに20%が使用されます。
Link to this section主な特徴#
- Caltech-101 データセットは、101のカテゴリに分けられた約9,000枚のカラー画像で構成されています。
- カテゴリには、動物、乗り物、家庭用品、人物など、多種多様な物体が含まれています。
- カテゴリごとの画像数は一定ではなく、各カテゴリに約40から800枚の画像が含まれています。
- 画像のサイズは可変であり、その多くは中解像度です。
- Caltech-101 は、機械学習分野、特に物体認識タスクの学習やテストに広く利用されています。
Link to this sectionデータセットの構造#
他の多くのデータセットとは異なり、Caltech-101 データセットは学習用セットとテスト用セットに正式に分割されていません。ユーザーは通常、特定のニーズに基づいて独自の分割を作成します。ただし、学習用に画像のランダムなサブセット(例:カテゴリごとに30枚の画像)を使用し、残りの画像をテストに使用するのが一般的な方法です。
Link to this sectionアプリケーション#
The Caltech-101 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its wide variety of categories and high-quality images make it an excellent dataset for research and development in the field of machine learning and computer vision.
Link to this section使用方法#
Caltech-101 データセットで YOLO モデルを100 エポック学習させるには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルの学習ページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionサンプル画像とアノテーション#
Caltech-101 データセットには、様々な物体の高品質なカラー画像が含まれており、画像分類タスクのための適切に構造化されたデータセットを提供しています。データセットに含まれる画像の例をいくつか紹介します:

この例は、Caltech-101 データセットに含まれる物体の多様性と複雑さを示しており、堅牢な物体認識モデルを学習するための多様なデータセットの重要性を強調しています。
Link to this section引用と謝辞#
研究や開発活動で Caltech-101 データセットを使用する場合は、以下の論文を引用してください:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースである Caltech-101 データセットを作成・維持している Li Fei-Fei、Rob Fergus、および Pietro Perona の各氏に感謝いたします。Caltech-101 データセットとその作成者に関する詳細については、Caltech-101 データセットのウェブサイトをご覧ください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionCaltech-101 データセットは機械学習において何に使用されますか?#
Caltech-101 データセットは、機械学習における物体認識タスクに広く使用されています。101のカテゴリにわたる約9,000枚の画像が含まれており、物体認識アルゴリズムを評価するための挑戦的なベンチマークを提供します。研究者は、特にコンピュータビジョンにおけるニューラルネットワーク (CNN) やサポートベクターマシン (SVM) などのモデルを学習・テストするために活用しています。
Link to this sectionCaltech-101 データセットで Ultralytics YOLO モデルを学習するにはどうすればよいですか?#
Caltech-101 データセットで Ultralytics YOLO モデルを学習するには、提供されているコードスニペットを使用できます。例えば、100エポック学習させる場合は以下の通りです:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)より詳細な引数やオプションについては、モデルの学習ページを参照してください。
Link to this sectionCaltech-101 データセットの主な特徴は何ですか?#
Caltech-101 データセットには以下の特徴があります:
- 101カテゴリにわたる約9,000枚のカラー画像。
- 動物、乗り物、家庭用品など、多種多様な物体を網羅したカテゴリ。
- カテゴリごとの画像数は可変で、通常40枚から800枚。
- 画像サイズは可変で、多くは中解像度。
これらの特徴により、機械学習やコンピュータビジョンにおける物体認識モデルの学習と評価に最適です。
Link to this sectionなぜ研究で Caltech-101 データセットを引用すべきなのですか?#
研究で Caltech-101 データセットを引用することは、作成者の貢献を称えることになり、データセットを使用する可能性のある他の人々への参照元を提供することになります。推奨される引用形式は以下の通りです:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用は学術的成果の誠実さを維持するのに役立ち、また、他の研究者が元のリソースを探す助けにもなります。
Link to this sectionUltralytics Platform を使用して Caltech-101 データセットでモデルを学習できますか?#
はい、Ultralytics Platform を使用して Caltech-101 データセットでモデルを学習できます。Ultralytics Platform は、データセットの管理、モデルの学習、および大規模なコーディングなしでのデプロイを直感的に行えるプラットフォームを提供します。詳細なガイドについては、Ultralytics Platform を使ってカスタムモデルを学習する方法というブログ投稿を参照してください。