コンテンツへスキップ

Caltech-101 データセット

Caltech-101データセットは、物体認識タスクに広く利用されているデータセットであり、101の物体カテゴリから約9,000の画像を含んでいる。カテゴリは実世界の様々な物体を反映するように選択され、画像自体も物体認識アルゴリズムに挑戦的なベンチマークを提供するために注意深く選択され、注釈が付けられた。

主な特徴

  • Caltech-101データセットは、101のカテゴリーに分けられた約9,000枚のカラー画像から構成されている。
  • カテゴリーには、動物、乗り物、日用品、人間など、さまざまなものが含まれる。
  • 各カテゴリーに含まれる画像数は約40枚から800枚と様々です。
  • 画像のサイズは様々で、ほとんどの画像は中解像度です。
  • Caltech-101は、機械学習の分野、特に物体認識タスクのトレーニングとテストに広く使用されている。

データセット構造

他の多くのデータセットとは異なり、Caltech-101データセットはトレーニングセットとテストセットに正式に分割されていない。通常、ユーザは特定のニーズに基づいて独自の分割を作成する。しかし、一般的な方法としては、ランダムな画像のサブセットをトレーニングに使用し(例えば、カテゴリーごとに30枚の画像)、残りの画像をテストに使用する。

アプリケーション

Caltech-101データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、物体認識タスクにおけるディープラーニングモデルの学習や評価に広く利用されています。幅広いカテゴリと高品質な画像により、機械学習やコンピュータビジョンの分野における研究開発に最適なデータセットとなっています。

使用方法

Caltech-101 データセットでYOLO モデルを 100 エポック学習させるには、以下のコード・スニペットを使うことができる。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

サンプル画像と注釈

Caltech-101データセットには様々な物体の高品質なカラー画像が含まれており、物体認識タスクに適したデータセットとなっている。以下に、このデータセットに含まれる画像の例を示す:

データセットサンプル画像

この例は、Caltech-101データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストなオブジェクト認識モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

Caltech-101データセットを研究または開発で使用する場合は、以下の論文を引用してください:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるCaltech-101データセットの作成と管理をしてくれたLi Fei-Fei、Rob Fergus、Pietro Peronaに感謝したい。Caltech-101データセットとその作成者についての詳細は、Caltech-101データセットのウェブサイトをご覧ください。



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

コメント