コンテンツへスキップ

Caltech-256 データセット

Caltech-256データセットは、物体分類タスクに使用される画像の広範なコレクションである。約30,000枚の画像が257のカテゴリ(256の物体カテゴリと1つの背景カテゴリ)に分類されている。この画像は、物体認識アルゴリズムにとって挑戦的で多様なベンチマークを提供するために、注意深く管理され、注釈が付けられている。

主な特徴

  • Caltech-256データセットは、約30,000枚のカラー画像を257のカテゴリーに分類したものである。
  • 各カテゴリーには最低80枚の画像が含まれます。
  • カテゴリーには、動物、乗り物、日用品、人間など、現実世界のさまざまなものが含まれる。
  • 画像のサイズと解像度は可変です。
  • Caltech-256は、機械学習の分野、特に物体認識タスクのトレーニングとテストに広く使用されている。

データセット構造

Caltech-101のように、Caltech-256データセットにはトレーニングセットとテストセットの正式な分割はない。通常、ユーザーはそれぞれのニーズに応じて独自の分割を行う。一般的なやり方は、ランダムな画像のサブセットをトレーニングに使い、残りの画像をテストに使うというものです。

アプリケーション

Caltech-256データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、物体認識タスクにおけるディープラーニングモデルの学習や評価に広く利用されています。その多様なカテゴリと高品質な画像により、機械学習とコンピュータビジョンの分野における研究開発にとって非常に貴重なデータセットとなっています。

使用方法

Caltech-256 データセットでYOLO モデルを 100 エポック学習させるには、以下のコード・スニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングのページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech256', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

サンプル画像と注釈

Caltech-256データセットには様々な物体の高品質なカラー画像が含まれており、物体認識タスクのための包括的なデータセットを提供する。以下に、このデータセットに含まれる画像の例を示す(クレジット):

データセットサンプル画像

この例は、Caltech-256データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストなオブジェクト認識モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

Caltech-256データセットを研究または開発で使用する場合は、以下の論文を引用してください:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

機械学習とコンピュータ・ビジョンの研究コミュニティにとって貴重なリソースであるCaltech-256データセットを作成し、維持しているGregory Griffin、Alex Holub、Pietro Peronaに感謝したい。データセットに関する詳細は

Caltech-256データセットとその作成者は、Caltech-256データセットのウェブサイトをご覧ください。



作成日:2023-11-12 更新日:2023-11-22
作成者:glenn-jocher(3)

コメント