Link to this sectionCaltech-256 データセット#

Caltech-256 データセットは、256のオブジェクトカテゴリと1つの背景クラスにまたがる30,607枚の画像からなる、古典的な画像分類のベンチマークです。各カテゴリには、動物、乗り物、家庭用品、人物など、現実世界のオブジェクト画像が少なくとも80枚含まれており、Caltech-101よりも大規模で挑戦的なオブジェクト認識モデルの後継データセットとなっています。

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

データの自動分割

Caltech-256には、あらかじめ定義された学習用／検証用の分割はありません。以下の学習コマンドでは、自動的に80%を学習用、20%を検証用に分割するため、手動で準備する必要はありません。

Link to this section主な特徴#

Caltech-256には、256のオブジェクトカテゴリと1つの 257.clutter 背景クラス（合計257のクラスフォルダ）にわたる30,607枚のカラー画像が含まれています。
カテゴリは、動物、乗り物、日用品、人物など、現実世界の幅広いオブジェクトにわたっています。
各カテゴリには少なくとも80枚の画像が含まれており、最大のカテゴリでは約800枚に達するため、クラスサイズは不均衡です。
画像サイズおよび解像度は一定ではありません。
Caltech-256は、画像分類およびオブジェクト認識アルゴリズムのベンチマークとして広く使用されています。

Link to this sectionデータセットの構造#

Caltech-256は、あらかじめ定義された学習用／検証用の分割なしで、クラスごとに1つ、合計256のオブジェクトカテゴリと1つの 257.clutter 背景クラスをカバーする257個のフォルダとして配布されています。学習を開始すると、Ultralyticsが自動的に画像をパーティション分割するため、手動の設定なしで257クラスすべてにわたってモデルを学習させることができます。

クラス: 257 (256のオブジェクトカテゴリ + 1つの背景クラス)
合計画像数: 30,607
学習用/検証用の分割: 自動で80% / 20% (学習用約24,385枚、検証用約6,222枚)
クラスごとの画像数: 少なくとも80枚 (不均衡であり、最大で約800枚)

Link to this sectionアプリケーション#

Caltech-256データセットは、画像分類や物体認識モデル（畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) を含む）のトレーニングや評価に広く使用されています。カテゴリ数が多く高品質な画像を備えているため、機械学習およびコンピュータビジョンの研究やプロトタイプ開発において人気のあるベンチマークとなっています。

Link to this section使用方法#

Caltech-256上でYOLOモデルを画像サイズ416で100エポック学習させます。利用可能な引数の全リストについては、学習ページおよび画像分類タスクガイドを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionサンプル画像とアノテーション#

Caltech-256データセットには、様々なオブジェクトの高品質なカラー画像が含まれており、画像分類タスクのための十分に構造化されたデータセットを提供しています。データセットからの画像の例をいくつか紹介します (クレジット):

Caltech-256画像分類データセットのサンプル

これらのサンプルは、Caltech-256データセットに含まれるオブジェクトの多様性と複雑さを示しており、堅牢なオブジェクト認識モデルを学習するための多様なデータセットの価値を裏付けています。

Link to this section引用と謝辞#

研究や開発においてCaltech-256データセットを使用する場合は、以下の論文を引用してください。

引用

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCaltech-256データセットを作成・維持してくださったGregory Griffin氏、Alex Holub氏、Pietro Perona氏に感謝の意を表します。Caltech-256データセットとその作成者に関する詳細については、Caltech-256データセットのウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionCaltech-256データセットは機械学習において何に使用されますか？#

Caltech-256 データセットは、画像分類およびオブジェクト認識モデルの学習やベンチマークに広く使用されています。256のオブジェクトカテゴリと1つの背景クラスにまたがる30,607枚の画像が含まれており、畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) といったアルゴリズムにとって、Caltech-101よりも大きく、より挑戦的なベンチマークとなっています。

Link to this sectionUltralytics YOLOモデルをCaltech-256データセットで学習させるにはどうすればよいですか？#

Ultralytics YOLOモデルをCaltech-256で学習させるには、以下のコードスニペットを使用してください。データセットは初回使用時に自動的にダウンロードされます。引数の完全なリストについては、モデルの学習ページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionCaltech-256データセットにはいくつのクラスがありますか？#

Caltech-256には256のオブジェクトカテゴリと1つの 257.clutter 背景クラスが含まれており、合計257のクラスフォルダと30,607枚の画像があります。Ultralyticsを使用して学習する場合、モデルは257クラスすべてを学習します。各カテゴリには少なくとも80枚の画像が含まれていますが、クラスサイズは不均衡で、最大のカテゴリには約800枚の画像が含まれています。

Link to this sectionCaltech-256データセットはどのように学習セットと検証セットに分割されますか？#

Caltech-256にはあらかじめ定義された分割はありません。初回学習時に、Ultralyticsが自動的に80%を学習用、20%を検証用に分割します（学習用約24,385枚、検証用約6,222枚）。そのため、手動で分割を作成する必要はありません。自分で分割を制御したい場合は、学習前に画像を train/ フォルダと val/ フォルダに整理してください。

Link to this sectionUltralytics Platformを使用してCaltech-256データセットでモデルを学習できますか？#

はい、可能です。Ultralytics Platform を使用すると、データセットの管理、画像分類モデルの学習、そして大規模なコーディングなしでのデプロイが可能になります。これはクラウドでCaltech-256の実験を行うのに便利な方法であり、詳細なオプションは画像分類データセットの概要から確認できます。

コントリビューター

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

作成日 2023年11月12日更新日 5 日前