Link to this sectionCaltech-101 データセット#

Caltech-101 データセットは、101のオブジェクトカテゴリと1つの背景クラスにまたがる9,144枚の画像からなる、定番の画像分類ベンチマークです。各カテゴリには、動物、乗り物、日用品、人物といった現実世界のオブジェクトが約40から800枚含まれており、オブジェクト認識モデルにとってコンパクトでありながらも挑戦的なベンチマークとなっています。

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

データの自動分割

Caltech-101には、あらかじめ定義された学習/検証の分割データは含まれていません。以下の学習コマンドでは、自動的に80%を学習、20%を検証に分割するため、手動での準備は不要です。

Link to this section主な特徴#

Caltech-101には、101のオブジェクトカテゴリと1つの BACKGROUND_Google クラス（合計102のクラスフォルダ）にわたる9,144枚のカラー画像が含まれています。
カテゴリは、動物、乗り物、日用品、人物など、現実世界の幅広いオブジェクトにわたっています。
各カテゴリには約40から800枚の画像が含まれているため、クラスサイズには不均衡があります。
画像のサイズは可変で、ほとんどが約300x200ピクセル（中解像度）です。
Caltech-101は、画像分類やオブジェクト認識アルゴリズムのベンチマークとして広く使用されています。

Link to this sectionデータセットの構造#

Caltech-101は、101のオブジェクトカテゴリと1つの BACKGROUND_Google クラスをカバーする102のフォルダとして配布されており、あらかじめ定義された学習/検証の分割はありません。学習を開始すると、Ultralyticsが自動的に画像を分割するため、手動で設定することなく102の全クラスでモデルの学習が行われます。

クラス: 102（101のオブジェクトカテゴリ + 1つの背景）
総画像数: 9,144
学習/検証分割: 自動で80% / 20%（学習用約7,280枚、検証用約1,864枚）
クラスあたりの画像数: 約40から800（不均衡）

Link to this sectionアプリケーション#

Caltech-101は、画像分類や物体認識モデル（畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) を含む）の学習および評価に広く使用されています。幅広いカテゴリを網羅している点と、ラベル付けされたクリーンな画像であることから、機械学習およびコンピュータビジョンの研究やプロトタイピングにおいて人気の高いベンチマークとなっています。

Link to this section使用方法#

Caltech-101上でYOLOモデルを画像サイズ416で100エポック学習させます。利用可能な引数の完全なリストについては、学習ページおよび画像分類タスクガイドを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionサンプル画像とアノテーション#

Caltech-101 データセットには、さまざまな物体の高品質なカラー画像が含まれており、image classification タスクのための構造化されたデータセットを提供します。データセットの画像例をいくつか紹介します。

Caltech-101 image classification dataset samples

サンプル画像には、Caltech-101に典型的な様々なカテゴリと自然で中心に配置された構図が示されており、堅牢なオブジェクト認識モデルを学習させるためのクリーンな出発点となります。

Link to this section引用と謝辞#

研究や開発作業で Caltech-101 データセットを使用する場合は、以下の論文を引用してください。

引用

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

機械学習およびコンピュータビジョンの研究コミュニティにとって価値あるリソースとして Caltech-101 データセットを作成・維持している Li Fei-Fei、Rob Fergus、Pietro Perona の各氏に感謝いたします。Caltech-101 データセットとその作成者に関する詳細については、Caltech-101 dataset website をご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionCaltech-101 データセットは何のために機械学習で使用されますか？#

Caltech-101 データセットは、画像分類およびオブジェクト認識モデルの学習とベンチマークに広く使用されています。これには、101のオブジェクトカテゴリと背景クラスにわたる9,144枚の画像が含まれており、畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) などのアルゴリズムを評価するための挑戦的なベンチマークを提供します。

Link to this sectionUltralytics YOLO モデルを Caltech-101 データセットで学習させるにはどうすればよいですか？#

Caltech-101でUltralytics YOLOモデルを学習させるには、以下のコードスニペットを使用します。データセットは初回使用時に自動的にダウンロードされます。引数の完全なリストについては、モデルの学習ページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionCaltech-101データセットにはいくつのクラスがありますか？#

Caltech-101には101のオブジェクトカテゴリと1つの BACKGROUND_Google クラスがあり、合計で102のクラスフォルダと9,144枚の画像が含まれています。Ultralyticsで学習する場合、モデルは全102クラスを学習します。カテゴリサイズは不均衡で、それぞれ約40から800枚の画像で構成されています。

Link to this sectionCaltech-101データセットはどのように学習セットと検証セットに分割されますか？#

Caltech-101には定義済みの分割はありません。最初に学習を行う際、Ultralyticsは自動的に80%の学習用データと20%の検証用データ（学習用約7,280枚、検証用約1,864枚）に分割するため、手動で分割を作成する必要はありません。自分で分割を制御したい場合は、学習前に画像を train/ フォルダと val/ フォルダに整理してください。

Link to this sectionUltralytics Platform を使用して Caltech-101 データセットでモデルを学習できますか？#

はい。Ultralytics Platform を使用すると、データセットの管理、画像分類モデルの学習、および大規模なコーディングなしでの展開が可能になります。これはクラウド上でCaltech-101の実験を実行する便利な方法であり、詳細なオプションについては分類データセットの概要で確認できます。

貢献者

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

作成日 2023年11月12日更新日一昨日