Caltech-256データセット

Q: What is the Caltech-256 dataset and why is it important for machine learning?

Caltech-256データセットは、機械学習とコンピュータビジョンにおけるオブジェクト分類タスクで主に使用される大規模な画像データセットです。約30,000枚のカラー画像で構成され、257のカテゴリに分類されており、幅広い現実世界のオブジェクトをカバーしています。データセットの多様で高品質な画像は、堅牢な機械学習モデルの開発に不可欠なオブジェクト認識アルゴリズムを評価するための優れたベンチマークとなります。

Q: What are the most common use cases for the Caltech-256 dataset?

Caltech-256データセットは、以下のようなさまざまなオブジェクト認識タスクに広く使用されています。その多様性と包括的なアノテーションは、機械学習とコンピュータビジョンの研究開発に最適です。

Q: Why should I use Ultralytics YOLO for training models on the Caltech-256 dataset?

Ultralytics YOLO モデルは、Caltech-256データセットでのトレーニングにいくつかの利点があります。詳細については、包括的なトレーニングガイドを参照し、Ultralytics YOLO を使用した画像分類について学んでください。

Caltech-256データセットは、オブジェクト分類タスクに使用される画像の広範なコレクションです。約30,000枚の画像が含まれており、257のカテゴリ（256のオブジェクトカテゴリと1つの背景カテゴリ）に分類されています。画像は慎重にキュレーションおよびアノテーションされており、オブジェクト認識アルゴリズムに挑戦的で多様なベンチマークを提供します。

見る: トレーニング方法画像分類 Ultralytics を使用して Caltech-256 データセットでモデルを学習させる

自動データ分割

提供されているCaltech-256データセットには、事前定義されたtrain/validation分割は含まれていません。ただし、以下の使用例で提供されているトレーニングコマンドを使用すると、Ultralyticsフレームワークが自動的にデータセットを分割します。デフォルトで使用される分割は、トレーニングセットに80％、検証セットに20％です。

主な特徴

Caltech-256データセットは約30,000枚のカラー画像で構成され、257のカテゴリに分類されています。
各カテゴリには、最低80枚の画像が含まれています。
カテゴリには、動物、車両、家庭用品、人物など、幅広い現実世界のオブジェクトが含まれています。
画像のサイズと解像度は様々です。
Caltech-256は、機械学習、特に物体認識タスクのトレーニングとテストで広く使用されています。

データセットの構造

Caltech-101と同様に、Caltech-256データセットには、トレーニングセットとテストセットの正式な分割がありません。ユーザーは通常、特定のニーズに応じて独自の分割を作成します。一般的な方法としては、画像のランダムなサブセットをトレーニングに使用し、残りの画像をテストに使用します。

アプリケーション

Caltech-256データセットは、深層学習モデルをオブジェクト認識タスクでトレーニングおよび評価するために広く使用されています。たとえば、畳み込みニューラルネットワーク（CNN）、サポートベクターマシン（SVM）、およびその他のさまざまな機械学習アルゴリズムなどです。その多様なカテゴリと高品質の画像により、機械学習およびコンピュータビジョンの分野における研究開発に非常に貴重なデータセットとなっています。

使用法

Caltech-256データセットでYOLOモデルを100エポック学習させるには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

学習の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

サンプル画像とアノテーション

Caltech-256データセットには、さまざまなオブジェクトの高品質なカラー画像が含まれており、オブジェクト認識タスクのための包括的なデータセットを提供します。以下は、データセットからの画像の例です（クレジット）：

Caltech-256画像分類データセットのサンプル

この例は、Caltech-256データセット内のオブジェクトの多様性と複雑さを示しており、堅牢な物体認識モデルをトレーニングするための多様なデータセットの重要性を強調しています。

引用と謝辞

Caltech-256データセットを研究または開発で使用する場合は、次の論文を引用してください。

BibTeX

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCaltech-256データセットを作成および維持しているGregory Griffin、Alex Holub、Pietro Peronaに感謝します。Caltech-256データセットとその作成者の詳細については、Caltech-256データセットのWebサイトをご覧ください。

よくある質問