Caltech-101 데이터셋
Caltech-101 데이터셋은 101개 객체 카테고리의 약 9,000개 이미지를 포함하는 객체 인식 작업을 위한 널리 사용되는 데이터셋입니다. 카테고리는 실제 객체의 다양성을 반영하도록 선정되었으며, 이미지 자체는 객체 인식 알고리즘에 대한 도전적인 벤치마크를 제공하기 위해 신중하게 선택되고 주석이 달렸습니다.
제공된 형태의 Caltech-101 데이터셋에는 사전 정의된 학습/검증 분할이 포함되어 있지 않습니다. 그러나 아래 사용 예제에 제공된 학습 명령을 사용하면 Ultralytics 프레임워크가 자동으로 데이터셋을 분할해 드립니다. 기본 분할은 학습 세트 80%, 검증 세트 20%로 설정되어 있습니다.
주요 특징
- Caltech-101 데이터셋은 101개 카테고리로 나뉜 약 9,000개의 컬러 이미지로 구성됩니다.
- 카테고리는 동물, 차량, 가정용품, 사람을 포함한 광범위한 객체를 포괄합니다.
- 카테고리별 이미지 수는 각 카테고리당 약 40개에서 800개로 다양합니다.
- 이미지 크기는 가변적이며 대부분 중간 해상도입니다.
- Caltech-101은 머신러닝 분야, 특히 객체 인식 작업의 학습 및 테스트에 널리 사용됩니다.
데이터셋 구조
다른 많은 데이터셋과 달리 Caltech-101 데이터셋은 공식적으로 학습 세트와 테스트 세트로 분할되어 있지 않습니다. 사용자는 일반적으로 자신의 특정 요구 사항에 따라 직접 분할을 생성합니다. 하지만 일반적인 관행은 이미지의 무작위 하위 집합을 학습용(예: 카테고리당 30개 이미지)으로 사용하고 나머지 이미지를 테스트용으로 사용하는 것입니다.
응용 분야
The Caltech-101 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its wide variety of categories and high-quality images make it an excellent dataset for research and development in the field of machine learning and computer vision.
사용법
Caltech-101 데이터셋으로 100 에포크 동안 YOLO 모델을 학습시키려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인자에 대한 전체 목록은 모델 학습 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)샘플 이미지 및 주석
Caltech-101 데이터셋은 다양한 객체의 고품질 컬러 이미지를 포함하고 있어 이미지 분류 작업을 위한 잘 구성된 데이터셋을 제공합니다. 다음은 데이터셋 이미지의 몇 가지 예입니다:

이 예제는 Caltech-101 데이터셋에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델 학습을 위한 데이터셋 다양성의 중요성을 강조합니다.
인용 및 감사의 글
연구 또는 개발 작업에 Caltech-101 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}머신러닝 및 컴퓨터 비전 연구 커뮤니티에 가치 있는 자원으로서 Caltech-101 데이터셋을 구축하고 유지 관리해 준 Li Fei-Fei, Rob Fergus 및 Pietro Perona에게 감사를 표합니다. Caltech-101 데이터셋 및 작성자에 대한 자세한 내용은 Caltech-101 데이터셋 웹사이트를 방문하십시오.
FAQ
머신러닝에서 Caltech-101 데이터셋은 어떤 용도로 사용됩니까?
Caltech-101 데이터셋은 머신러닝 분야의 객체 인식 작업에 널리 사용됩니다. 이 데이터셋은 101개 카테고리에 걸쳐 약 9,000개의 이미지를 포함하며 객체 인식 알고리즘 평가를 위한 도전적인 벤치마크를 제공합니다. 연구자들은 컴퓨터 비전 분야에서 모델, 특히 Convolutional Neural Networks (CNN) 및 Support Vector Machines (SVM)를 학습하고 테스트하는 데 이 데이터셋을 활용합니다.
Caltech-101 데이터셋에서 Ultralytics YOLO 모델을 어떻게 학습시킬 수 있습니까?
Caltech-101 데이터셋에서 Ultralytics YOLO 모델을 학습시키려면 제공된 코드 스니펫을 사용할 수 있습니다. 예를 들어 100 에포크 동안 학습하려면 다음과 같이 합니다:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)더 자세한 인자 및 옵션은 모델 학습 페이지를 참조하십시오.
Caltech-101 데이터셋의 주요 특징은 무엇입니까?
Caltech-101 데이터셋의 포함 항목:
- 101개 카테고리에 걸친 약 9,000개의 컬러 이미지.
- 동물, 차량, 가정용품을 포함한 다양한 범위의 객체를 다루는 카테고리.
- 카테고리당 가변적인 이미지 수(일반적으로 40~800개).
- 가변적인 이미지 크기(대부분 중간 해상도).
이러한 특징 덕분에 머신러닝 및 컴퓨터 비전 분야에서 객체 인식 모델을 학습하고 평가하는 데 탁월한 선택이 됩니다.
연구에서 Caltech-101 데이터셋을 인용해야 하는 이유는 무엇입니까?
연구에서 Caltech-101 데이터셋을 인용하면 작성자의 기여를 인정하고 데이터셋을 사용할 다른 사람들에게 참조를 제공할 수 있습니다. 권장되는 인용 형식은 다음과 같습니다:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}인용은 학술적 작업의 무결성을 유지하는 데 도움이 되며 동료들이 원본 자료를 찾는 데 도움을 줍니다.
Caltech-101 데이터셋에서 모델을 학습하기 위해 Ultralytics Platform을 사용할 수 있습니까?
네, Ultralytics Platform을 사용하여 Caltech-101 데이터셋에서 모델을 학습할 수 있습니다. Ultralytics Platform은 방대한 코딩 없이도 데이터셋 관리, 모델 학습 및 배포를 위한 직관적인 환경을 제공합니다. 자세한 가이드는 Ultralytics Platform으로 커스텀 모델을 학습하는 방법 블로그 게시물을 참조하십시오.