Meet YOLO26: next-gen vision AI.

Caltech-256データセット

Caltech-256データセットは、物体分類タスクに使用される大規模な画像コレクションです。これには257のカテゴリ(256の物体カテゴリと1つの背景カテゴリ)に分類された約30,000枚の画像が含まれています。画像は慎重にキュレーションおよびアノテーションされており、物体認識アルゴリズムのための挑戦的で多様なベンチマークを提供します。



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
自動データ分割

Caltech-256データセットには、あらかじめ定義されたトレーニング/検証セットの分割は含まれていません。しかし、以下の使用例で提供されているトレーニングコマンドを使用すると、Ultralyticsフレームワークが自動的にデータセットを分割します。デフォルトの分割は、トレーニングセットに80%、検証セットに20%が使用されます。

主な特徴

  • Caltech-256データセットは、257のカテゴリに分類された約30,000枚のカラー画像で構成されています。
  • 各カテゴリには最低80枚の画像が含まれています。
  • カテゴリは、動物、乗り物、家庭用品、人物など、多種多様な現実世界の物体を網羅しています。
  • 画像サイズや解像度は一定ではありません。
  • Caltech-256は、機械学習の分野、特に物体認識タスクのトレーニングやテストに広く使用されています。

データセットの構造

Caltech-101と同様に、Caltech-256データセットにはトレーニングセットとテストセットの正式な分割はありません。ユーザーは通常、特定のニーズに応じて独自の分割を作成します。一般的な慣習として、画像のランダムなサブセットをトレーニングに使用し、残りの画像をテストに使用します。

アプリケーション

The Caltech-256 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its diverse set of categories and high-quality images make it an invaluable dataset for research and development in the field of machine learning and computer vision.

使用方法

Caltech-256データセットでYOLOモデルを100エポック分トレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

サンプル画像とアノテーション

Caltech-256データセットには、さまざまな物体の高品質なカラー画像が含まれており、物体認識タスクのための包括的なデータセットを提供しています。以下はデータセットの画像の例です(提供):

Caltech-256画像分類データセットのサンプル

この例は、Caltech-256データセット内の物体の多様性と複雑さを示しており、堅牢な物体認識モデルをトレーニングするために多様なデータセットが重要であることを強調しています。

引用と謝辞

研究や開発活動でCaltech-256データセットを使用する場合は、次の論文を引用してください。

引用
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

機械学習およびコンピュータビジョンの研究コミュニティにとって価値あるリソースとしてCaltech-256データセットを作成し、維持しているGregory Griffin氏、Alex Holub氏、Pietro Perona氏に感謝の意を表します。Caltech-256データセットとその作成者の詳細については、Caltech-256データセットのウェブサイトをご覧ください。

FAQ

Caltech-256データセットとは何ですか?また、なぜ機械学習にとって重要なのですか?

Caltech-256データセットは、主に機械学習やコンピュータビジョンにおける物体分類タスクに使用される大規模な画像データセットです。これには、現実世界の幅広い物体をカバーする、257のカテゴリに分類された約30,000枚のカラー画像が含まれています。このデータセットの多様かつ高品質な画像は、堅牢な機械学習モデルを開発するために不可欠な、物体認識アルゴリズムを評価するための優れたベンチマークとなります。

PythonまたはCLIを使用して、Caltech-256データセットでYOLOモデルをトレーニングするにはどうすればよいですか?

Caltech-256データセットでYOLOモデルを100エポック分トレーニングするには、以下のコードスニペットを使用できます。その他のオプションについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Caltech-256データセットの最も一般的な使用例は何ですか?

Caltech-256データセットは、以下のようなさまざまな物体認識タスクに広く使用されています。

  • 畳み込みニューラルネットワーク(CNN)のトレーニング
  • サポートベクターマシン(SVM)の性能評価
  • 新しいディープラーニングアルゴリズムのベンチマーク
  • Ultralytics YOLOなどのフレームワークを使用した物体検出モデルの開発

その多様性と包括的なアノテーションにより、機械学習およびコンピュータビジョンの研究開発に最適です。

Caltech-256データセットはどのように構成されており、トレーニング用とテスト用にどのように分割されていますか?

Caltech-256データセットには、トレーニング用とテスト用の定義済みの分割は付属していません。ユーザーは通常、特定のニーズに応じて独自の分割を作成します。一般的なアプローチは、トレーニング用に画像のサブセットをランダムに選択し、残りの画像をテストに使用することです。この柔軟性により、ユーザーは特定のプロジェクト要件や実験セットアップに合わせてデータセットを調整できます。

Caltech-256データセットでモデルをトレーニングする際に、なぜUltralytics YOLOを使用すべきなのですか?

Ultralytics YOLOモデルには、Caltech-256データセットでのトレーニングにおいていくつかの利点があります。

  • 高精度: YOLOモデルは、物体検出タスクにおける最先端の性能で知られています。
  • 速度: リアルタイム推論機能を提供するため、迅速な予測を必要とするアプリケーションに適しています。
  • 使いやすさ: Ultralytics Platformを使用することで、広範なコーディングなしでモデルのトレーニング、検証、デプロイが可能です。
  • 事前学習済みモデル: yolo26n-cls.ptのような事前学習済みモデルから始めることで、トレーニング時間を大幅に短縮し、モデルの精度を向上させることができます。

詳細については、包括的なトレーニングガイドを確認し、Ultralytics YOLOを使用した画像分類について学習してください。

コメント