Link to this sectionCaltech-101 데이터셋#

Caltech-101 데이터셋은 101개의 객체 카테고리와 1개의 배경 클래스를 포함하는 9,144개의 이미지로 구성된 고전적인 이미지 분류 벤치마크입니다. 각 카테고리에는 동물, 차량, 가정용품, 사람 등 실제 객체의 이미지가 약 40개에서 800개까지 포함되어 있어 객체 인식 모델을 위한 작지만 도전적인 벤치마크 역할을 합니다.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

자동 데이터 분할

Caltech-101은 사전 정의된 학습/검증 분할이 제공되지 않습니다. 아래의 학습 명령어를 사용하면 자동으로 80% 학습 / 20% 검증으로 분할되므로 별도의 수동 준비 작업이 필요하지 않습니다.

Link to this section주요 특징#

Caltech-101은 101개의 객체 카테고리와 1개의 BACKGROUND_Google 클래스(총 102개의 클래스 폴더)에 걸쳐 9,144개의 컬러 이미지를 포함합니다.
카테고리는 동물, 차량, 가정용품, 사람을 포함한 다양한 실제 객체로 구성되어 있습니다.
각 카테고리는 약 40개에서 800개의 이미지를 포함하고 있어 클래스 크기가 불균형합니다.
이미지 크기는 가변적이며, 대부분 약 300x200 픽셀(중간 해상도)입니다.
Caltech-101은 이미지 분류 및 객체 인식 알고리즘의 벤치마크로 널리 사용됩니다.

Link to this section데이터셋 구조#

Caltech-101은 102개의 폴더(클래스당 1개, 101개의 객체 카테고리 및 BACKGROUND_Google 클래스 포함)로 배포되며, 사전 정의된 학습/검증 분할이 없습니다. 학습을 시작하면 Ultralytics가 자동으로 이미지를 분할하여 모델이 102개 클래스 전체에 대해 학습하도록 설정하며, 별도의 수동 설정은 필요하지 않습니다:

클래스: 102개 (101개 객체 카테고리 + 1개 배경)
전체 이미지: 9,144개
학습/검증 분할: 자동 80% / 20% (학습 약 7,280개, 검증 약 1,864개)
클래스당 이미지: 약 40개에서 800개 (불균형)

Link to this section응용 분야#

Caltech-101은 이미지 분류 및 객체 인식 모델을 학습하고 평가하는 데 널리 사용되며, 여기에는 합성곱 신경망(CNN)과 서포트 벡터 머신(SVM)이 포함됩니다. 광범위한 카테고리 범위와 깔끔하게 라벨링된 이미지를 갖추고 있어 머신러닝 및 컴퓨터 비전 연구와 프로토타이핑을 위한 인기 있는 벤치마크로 활용됩니다.

Link to this section사용법#

Caltech-101에서 416 이미지 크기로 100 에포크 동안 YOLO 모델을 학습합니다. 사용 가능한 전체 인수 목록은 학습 페이지와 이미지 분류 작업 가이드를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this section샘플 이미지 및 주석#

Caltech-101 데이터셋에는 다양한 객체의 고품질 컬러 이미지가 포함되어 있어 이미지 분류(image classification) 작업을 위한 잘 구조화된 데이터셋을 제공합니다. 다음은 데이터셋 이미지의 몇 가지 예시입니다:

Caltech-101 이미지 분류 데이터셋 샘플

샘플은 Caltech-101의 전형적인 다양한 카테고리와 자연스럽고 중앙에 정렬된 구도를 보여주며, 이는 강력한 객체 인식 모델을 학습하기 위한 깔끔한 출발점을 제공합니다.

Link to this section인용 및 감사의 글#

연구나 개발 작업에 Caltech-101 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

머신러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 소중한 자원으로서 Caltech-101 데이터셋을 만들고 유지 관리해 온 Li Fei-Fei, Rob Fergus, Pietro Perona에게 감사를 표합니다. Caltech-101 데이터셋과 제작자에 대한 자세한 정보는 Caltech-101 데이터셋 웹사이트를 방문하십시오.

Link to this sectionFAQ#

Link to this sectionCaltech-101 데이터셋은 머신러닝에서 무엇을 위해 사용됩니까?#

Caltech-101 데이터셋은 이미지 분류 및 객체 인식 모델을 학습하고 벤치마킹하는 데 널리 사용됩니다. 이 데이터셋은 101개의 객체 카테고리와 하나의 배경 클래스에 걸쳐 9,144개의 이미지를 포함하고 있어, 합성곱 신경망(CNN) 및 서포트 벡터 머신(SVM)과 같은 알고리즘을 평가하기 위한 도전적인 벤치마크를 제공합니다.

Link to this sectionUltralytics YOLO 모델을 Caltech-101 데이터셋으로 학습하려면 어떻게 해야 합니까?#

Caltech-101에서 Ultralytics YOLO 모델을 학습하려면 아래의 코드 조각을 사용하십시오. 데이터셋은 처음 사용할 때 자동으로 다운로드됩니다. 전체 인수 목록은 모델 학습 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionCaltech-101 데이터셋에는 몇 개의 클래스가 있습니까?#

Caltech-101은 101개의 객체 카테고리와 1개의 BACKGROUND_Google 클래스를 포함하여 총 102개의 클래스 폴더와 9,144개의 이미지를 가지고 있습니다. Ultralytics로 학습할 때 모델은 102개 클래스 전체를 학습합니다. 카테고리 크기는 클래스당 약 40개에서 800개 이미지로 불균형합니다.

Link to this sectionCaltech-101 데이터셋은 어떻게 학습 및 검증 세트로 분할됩니까?#

Caltech-101은 사전 정의된 분할이 없습니다. 처음 학습할 때 Ultralytics가 자동으로 80% 학습 / 20% 검증으로 분할(학습 약 7,280개, 검증 약 1,864개 이미지)하므로 수동으로 분할을 생성할 필요가 없습니다. 직접 분할을 제어하려면 학습 전에 이미지를 train/ 및 val/ 폴더로 구성하십시오.

Link to this sectionUltralytics Platform을 사용하여 Caltech-101 데이터셋으로 모델을 학습할 수 있습니까?#

예. Ultralytics Platform을 사용하면 데이터셋을 관리하고, 이미지 분류 모델을 학습하며, 광범위한 코딩 없이 배포할 수 있습니다. 이는 클라우드에서 Caltech-101 실험을 실행하는 편리한 방법이며, 분류 데이터셋 개요에서 더 많은 옵션을 탐색할 수 있습니다.

기여자

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

생성됨 2023년 11월 12일업데이트됨 어제