Caltech-101 데이터 세트

Q: How can I train an Ultralytics YOLO model on the Caltech-101 dataset?

Ultralytics YOLO 데이터 세트에 대한 모델을 훈련하려면 제공된 코드 조각을 사용할 수 있습니다. 예를 들어, 100개 시대에 대해 훈련하려면: 자세한 인수 및 옵션은 모델 훈련 페이지를 참조하세요.

Q: Why should I cite the Caltech-101 dataset in my research?

연구에 Caltech-101 데이터 집합을 인용하면 제작자의 공헌을 인정하고 데이터 집합을 사용할 수 있는 다른 사람에게 참조를 제공할 수 있습니다. 인용은 학술 작업의 무결성을 유지하는 데 도움이 되며 동료들이 원본 리소스를 찾는 데 도움을 줍니다.

Caltech-101 데이터 세트는 물체 인식 작업에 널리 사용되는 데이터 세트로, 101개의 물체 범주에 속하는 약 9,000개의 이미지가 포함되어 있습니다. 카테고리는 다양한 실제 사물을 반영하도록 선택되었으며, 이미지 자체에 주석을 달아 사물 인식 알고리즘에 대한 까다로운 벤치마크를 제공하도록 신중하게 선택되었습니다.

주요 기능

Caltech-101 데이터 세트는 약 9,000개의 컬러 이미지가 101개의 카테고리로 나뉘어져 있습니다.
카테고리에는 동물, 차량, 가정용품, 사람 등 다양한 사물이 포함됩니다.
카테고리당 이미지 수는 각 카테고리에 약 40~800개의 이미지로 다양합니다.
이미지는 다양한 크기로 제공되며, 대부분의 이미지는 중간 해상도입니다.
Caltech-101은 머신러닝 분야, 특히 객체 인식 작업의 훈련 및 테스트에 널리 사용됩니다.

데이터 세트 구조

다른 많은 데이터 세트와 달리, Caltech-101 데이터 세트는 공식적으로 훈련 세트와 테스트 세트로 분할되지 않습니다. 사용자는 일반적으로 특정 요구 사항에 따라 자체적으로 분할을 생성합니다. 그러나 일반적으로 훈련용 이미지의 무작위 하위 집합(예: 카테고리당 30개의 이미지)을 사용하고 나머지 이미지를 테스트용으로 사용하는 것이 일반적입니다.

애플리케이션

Caltech-101 데이터 세트는 컨볼루션 신경망(CNN), 서포트 벡터 머신(SVM) 및 기타 다양한 머신 러닝 알고리즘과 같은 객체 인식 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 광범위하게 사용됩니다. 다양한 카테고리와 고품질 이미지로 구성되어 있어 머신 러닝 및 컴퓨터 비전 분야의 연구 개발을 위한 훌륭한 데이터 세트입니다.

사용법

다음 코드 조각을 사용하여 100개 신기원에 대한 Caltech-101 데이터 집합에서 YOLO 모델을 훈련할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하세요.

열차 예시

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

샘플 이미지 및 주석

Caltech-101 데이터 세트에는 다양한 물체의 고품질 컬러 이미지가 포함되어 있어 물체 인식 작업을 위한 잘 구조화된 데이터 세트를 제공합니다. 다음은 데이터 세트의 몇 가지 이미지 예시입니다:

데이터 세트 샘플 이미지

이 예는 Caltech-101 데이터 세트에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 학습하는 데 있어 다양한 데이터 세트의 중요성을 강조합니다.

인용 및 감사

연구 또는 개발 작업에 Caltech-101 데이터 집합을 사용하는 경우 다음 논문을 인용해 주세요:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스인 Caltech-101 데이터 세트를 만들고 유지 관리해 주신 Li Fei-Fei, Rob Fergus, Pietro Perona에게 감사의 말씀을 전합니다. Caltech-101 데이터 세트와 그 제작자에 대한 자세한 내용은 Caltech-101 데이터 세트 웹사이트를 참조하세요.

자주 묻는 질문

머신 러닝에서 Caltech-101 데이터 세트는 어떤 용도로 사용되나요?

Caltech-101 데이터 세트는 물체 인식 작업을 위한 머신 러닝에서 널리 사용됩니다. 101개 카테고리에 걸쳐 약 9,000개의 이미지가 포함되어 있어 물체 인식 알고리즘을 평가하기 위한 까다로운 벤치마크를 제공합니다. 연구원들은 컴퓨터 비전에서 특히 컨볼루션 신경망(CNN)과 서포트 벡터 머신(SVM)을 비롯한 모델을 훈련하고 테스트하는 데 이 데이터셋을 활용합니다.

Caltech-101 데이터 세트에서 Ultralytics YOLO 모델을 훈련하려면 어떻게 해야 하나요?

Ultralytics YOLO 데이터 세트에 대한 모델을 훈련하려면 제공된 코드 스니펫을 사용할 수 있습니다. 예를 들어, 100개의 에포크에 대해 훈련합니다:

열차 예시

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

자세한 인수 및 옵션은 모델 교육 페이지를 참조하세요.

Caltech-101 데이터 세트의 주요 기능은 무엇인가요?

Caltech-101 데이터 세트에는 다음이 포함됩니다: - 101개 카테고리에 걸쳐 약 9,000개의 컬러 이미지. - 동물, 차량, 가정용품 등 다양한 사물을 포괄하는 카테고리. - 카테고리당 이미지 수는 가변적이며, 일반적으로 40개에서 800개 사이입니다. - 이미지 크기는 다양하며 대부분 중간 해상도입니다.

이러한 기능 덕분에 머신러닝 및 컴퓨터 비전에서 객체 인식 모델을 훈련하고 평가하는 데 탁월한 선택이 될 수 있습니다.

내 연구에서 Caltech-101 데이터 집합을 인용해야 하는 이유는 무엇인가요?

연구에 Caltech-101 데이터 집합을 인용하면 작성자의 공헌을 인정하고 데이터 집합을 사용할 수 있는 다른 사람들에게 참조를 제공할 수 있습니다. 권장 인용은 다음과 같습니다: