콘텐츠로 건너뛰기

Caltech-101 데이터 세트

Caltech-101 데이터 세트는 객체 인식 작업을 위해 널리 사용되는 데이터 세트이며, 101개의 객체 범주에서 약 9,000개의 이미지를 포함합니다. 범주는 다양한 실제 객체를 반영하도록 선택되었으며, 이미지 자체는 객체 인식 알고리즘에 대한 어려운 벤치마크를 제공하기 위해 신중하게 선택되고 주석이 추가되었습니다.



참고: 훈련 방법 이미지 분류 Ultralytics HUB를 사용하여 Caltech-256 데이터 세트로 모델링

자동 데이터 분할

제공된 Caltech-101 데이터 세트에는 사전 정의된 학습/검증 분할이 없습니다. 그러나 아래 사용 예에 제공된 학습 명령을 사용하면 Ultralytics 프레임워크가 데이터 세트를 자동으로 분할합니다. 사용되는 기본 분할은 학습 세트에 80%, 검증 세트에 20%입니다.

주요 기능

  • Caltech-101 데이터 세트는 101개의 범주로 나뉜 약 9,000개의 컬러 이미지로 구성됩니다.
  • 범주에는 동물, 차량, 가정용품 및 사람을 포함한 광범위한 객체가 포함됩니다.
  • 범주당 이미지 수는 다양하며, 각 범주에 약 40~800개의 이미지가 있습니다.
  • 이미지는 크기가 다양하며 대부분의 이미지는 중간 해상도입니다.
  • Caltech-101은 기계 학습 분야, 특히 객체 인식 작업에서 학습 및 테스트에 널리 사용됩니다.

데이터 세트 구조

다른 많은 데이터 세트와 달리 Caltech-101 데이터 세트는 공식적으로 학습 및 테스트 세트로 분할되지 않습니다. 사용자는 일반적으로 특정 요구 사항에 따라 자체 분할을 만듭니다. 그러나 일반적인 방법은 학습을 위해 임의의 이미지 하위 집합(예: 범주당 30개 이미지)을 사용하고 나머지 이미지를 테스트에 사용하는 것입니다.

응용 분야

Caltech-101 데이터 세트는 딥러닝 모델을 학습하고 객체 인식 작업에서 평가하는 데 널리 사용됩니다. 여기에는 합성곱 신경망(CNN), Support Vector Machines(SVM) 및 기타 다양한 머신 러닝 알고리즘이 포함됩니다. 다양한 범주와 고품질 이미지는 머신 러닝컴퓨터 비전 분야의 연구 개발에 훌륭한 데이터 세트가 됩니다.

사용법

Caltech-101 데이터 세트에서 100 epoch 동안 YOLO 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 전체 인수 목록은 모델 Training 페이지를 참조하세요.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

샘플 이미지 및 주석

Caltech-101 데이터 세트는 다양한 객체의 고품질 컬러 이미지를 포함하고 있으며, 이미지 분류 작업을 위한 잘 구성된 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 예시입니다.

데이터 세트 샘플 이미지

이 예는 Caltech-101 데이터 세트의 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 학습하기 위한 다양한 데이터 세트의 중요성을 강조합니다.

인용 및 감사의 말씀

연구 또는 개발 작업에서 Caltech-101 데이터 세트를 사용하는 경우 다음 논문을 인용해 주십시오.

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Caltech-101 데이터 세트를 만들고 유지 관리하여 머신 러닝 및 컴퓨터 비전 연구 커뮤니티에 귀중한 리소스를 제공해 주신 Li Fei-Fei, Rob Fergus 및 Pietro Perona에게 감사를 표합니다. Caltech-101 데이터 세트 및 제작자에 대한 자세한 내용은 Caltech-101 데이터 세트 웹사이트를 방문하십시오.

FAQ

Caltech-101 데이터 세트는 머신 러닝에서 어떤 용도로 사용되나요?

Caltech-101 데이터 세트는 객체 인식 작업을 위한 머신 러닝에서 널리 사용됩니다. 101개 카테고리에 걸쳐 약 9,000개의 이미지를 포함하고 있어 객체 인식 알고리즘을 평가하기 위한 까다로운 벤치마크를 제공합니다. 연구자들은 컴퓨터 비전에서 컨볼루션 신경망(CNN) 및 지원 벡터 머신(SVM)과 같은 모델을 훈련하고 테스트하는 데 활용합니다.

Caltech-101 데이터 세트에서 Ultralytics YOLO 모델을 어떻게 훈련할 수 있나요?

Caltech-101 데이터 세트에서 Ultralytics YOLO 모델을 학습하려면 제공된 코드 스니펫을 사용할 수 있습니다. 예를 들어 100 epoch 동안 학습하려면 다음과 같이 하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

더 자세한 인자와 옵션은 모델 학습 페이지를 참조하세요.

Caltech-101 데이터 세트의 주요 기능은 무엇인가요?

Caltech-101 데이터 세트는 다음을 포함합니다.

  • 101개 범주에 걸쳐 약 9,000개의 컬러 이미지.
  • 동물, 차량 및 가정용품을 포함한 다양한 범위의 객체를 포괄하는 범주.
  • 범주당 이미지 수는 가변적이며, 일반적으로 40개에서 800개 사이입니다.
  • 이미지 크기는 가변적이며, 대부분 중간 해상도입니다.

이러한 기능은 머신 러닝 및 컴퓨터 비전에서 객체 인식 모델을 학습하고 평가하는 데 탁월한 선택이 되도록 합니다.

연구에서 Caltech-101 데이터 세트를 인용해야 하는 이유는 무엇인가요?

연구에서 Caltech-101 데이터 세트를 인용하는 것은 제작자의 기여를 인정하고 데이터 세트를 사용할 수 있는 다른 사람들을 위한 참고 자료를 제공하는 것입니다. 권장되는 인용문은 다음과 같습니다.

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

인용은 학문적 연구의 무결성을 유지하는 데 도움이 되며 동료들이 원본 리소스를 찾는 데 도움을 줍니다.

Caltech-101 데이터 세트에서 모델을 훈련하는 데 Ultralytics HUB를 사용할 수 있습니까?

예, Ultralytics HUB를 사용하여 Caltech-101 데이터 세트에 대한 모델을 훈련할 수 있습니다. Ultralytics HUB는 광범위한 코딩 없이 데이터 세트 관리, 모델 훈련 및 배포를 위한 직관적인 플랫폼을 제공합니다. 자세한 내용은 Ultralytics HUB로 사용자 지정 모델을 훈련하는 방법 블로그 게시물을 참조하십시오.



📅 1년 전에 생성됨 ✏️ 4개월 전에 업데이트됨

댓글