Caltech-256データセット
Caltech-256データセットは、オブジェクト分類タスクに使用される画像の広範なコレクションです。約30,000枚の画像が含まれており、257のカテゴリ(256のオブジェクトカテゴリと1つの背景カテゴリ)に分類されています。画像は慎重にキュレーションおよびアノテーションされており、オブジェクト認識アルゴリズムに挑戦的で多様なベンチマークを提供します。
見る: トレーニング方法 画像分類 Ultralytics HUBでCaltech-256データセットを使用するモデル
自動データ分割
提供されているCaltech-256データセットには、事前定義されたtrain/validation分割は含まれていません。ただし、以下の使用例で提供されているトレーニングコマンドを使用すると、Ultralyticsフレームワークが自動的にデータセットを分割します。デフォルトで使用される分割は、トレーニングセットに80%、検証セットに20%です。
主な特徴
- Caltech-256データセットは約30,000枚のカラー画像で構成され、257のカテゴリに分類されています。
- 各カテゴリには、最低80枚の画像が含まれています。
- カテゴリには、動物、車両、家庭用品、人物など、幅広い現実世界のオブジェクトが含まれています。
- 画像のサイズと解像度は様々です。
- Caltech-256は、機械学習、特に物体認識タスクのトレーニングとテストで広く使用されています。
データセットの構造
Caltech-101と同様に、Caltech-256データセットには、トレーニングセットとテストセットの正式な分割がありません。ユーザーは通常、特定のニーズに応じて独自の分割を作成します。一般的な方法としては、画像のランダムなサブセットをトレーニングに使用し、残りの画像をテストに使用します。
アプリケーション
Caltech-256データセットは、深層学習モデルをオブジェクト認識タスクでトレーニングおよび評価するために広く使用されています。たとえば、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、およびその他のさまざまな機械学習アルゴリズムなどです。その多様なカテゴリと高品質の画像により、機械学習およびコンピュータビジョンの分野における研究開発に非常に貴重なデータセットとなっています。
使用法
Caltech-256データセットでYOLOモデルを100エポック学習させるには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
サンプル画像とアノテーション
Caltech-256データセットには、さまざまなオブジェクトの高品質なカラー画像が含まれており、オブジェクト認識タスクのための包括的なデータセットを提供します。以下は、データセットからの画像の例です(クレジット):
この例は、Caltech-256データセット内のオブジェクトの多様性と複雑さを示しており、堅牢な物体認識モデルをトレーニングするための多様なデータセットの重要性を強調しています。
引用と謝辞
Caltech-256データセットを研究または開発で使用する場合は、次の論文を引用してください。
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}
機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCaltech-256データセットを作成および維持しているGregory Griffin、Alex Holub、Pietro Peronaに感謝します。Caltech-256データセットとその作成者の詳細については、Caltech-256データセットのWebサイトをご覧ください。
よくある質問
Caltech-256データセットとは何ですか?また、機械学習においてなぜ重要ですか?
Caltech-256データセットは、主に機械学習とコンピュータビジョンのオブジェクト分類タスクに使用される大規模な画像データセットです。約30,000枚のカラー画像で構成され、257のカテゴリに分類されており、幅広い現実世界のオブジェクトをカバーしています。データセットの多様で高品質な画像は、堅牢な機械学習モデルの開発に不可欠なオブジェクト認識アルゴリズムを評価するための優れたベンチマークとなっています。
PythonまたはCLIを使用して、Caltech-256データセットでYOLOモデルをトレーニングするにはどうすればよいですか?
Caltech-256データセットでYOLOモデルを100エポックトレーニングするには、次のコードスニペットを使用できます。追加のオプションについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Caltech-256データセットの最も一般的なユースケースは何ですか?
Caltech-256データセットは、以下のようなさまざまなオブジェクト認識タスクに広く使用されています。
- 畳み込みニューラルネットワーク(CNN)の学習
- サポートベクターマシン(SVM)の性能評価
- 新しい深層学習アルゴリズムのベンチマーク
- Ultralytics YOLOのようなフレームワークを使用した物体検出モデルの開発
その多様性と包括的なアノテーションは、機械学習とコンピュータビジョンの研究開発に最適です。
Caltech-256データセットは、トレーニングとテストのためにどのように構成され、分割されていますか?
Caltech-256データセットには、トレーニングとテスト用に事前定義された分割が付属していません。ユーザーは通常、特定のニーズに応じて独自の分割を作成します。一般的なアプローチは、トレーニング用に画像のサブセットをランダムに選択し、残りの画像をテストに使用することです。この柔軟性により、ユーザーはデータセットを特定のプロジェクト要件や実験設定に合わせて調整できます。
Caltech-256データセットでモデルをトレーニングするためにUltralytics YOLOを使用する理由は何ですか?
Ultralytics YOLOモデルは、Caltech-256データセットでのトレーニングにいくつかの利点があります。
- 高精度: YOLOモデルは、物体検出タスクにおいて最先端の性能で知られています。
- 速度: リアルタイム推論機能を提供し、迅速な予測を必要とするアプリケーションに適しています。
- 使いやすさ:Ultralytics HUBを使用すると、ユーザーは広範なコーディングなしでモデルをトレーニング、検証、およびデプロイできます。
- 学習済みモデル:学習済みのモデルから開始する場合、例えば、
yolo11n-cls.pt
は、トレーニング時間を大幅に短縮し、モデルを改善することができます 精度.
詳細については、包括的なトレーニングガイドをご覧になり、Ultralytics YOLO を使用した画像分類について学んでください。