Caltech-101 데이터 세트
Caltech-101 데이터 세트는 물체 인식 작업에 널리 사용되는 데이터 세트로, 101개의 물체 범주에 속하는 약 9,000개의 이미지가 포함되어 있습니다. 카테고리는 다양한 실제 사물을 반영하도록 선택되었으며, 이미지 자체에 주석을 달아 사물 인식 알고리즘에 대한 까다로운 벤치마크를 제공하도록 신중하게 선택되었습니다.
주요 기능
- Caltech-101 데이터 세트는 약 9,000개의 컬러 이미지가 101개의 카테고리로 나뉘어져 있습니다.
- 카테고리에는 동물, 차량, 가정용품, 사람 등 다양한 사물이 포함됩니다.
- 카테고리당 이미지 수는 각 카테고리에 약 40~800개의 이미지로 다양합니다.
- 이미지는 다양한 크기로 제공되며, 대부분의 이미지는 중간 해상도입니다.
- Caltech-101은 머신러닝 분야, 특히 객체 인식 작업의 훈련 및 테스트에 널리 사용됩니다.
데이터 세트 구조
다른 많은 데이터 세트와 달리, Caltech-101 데이터 세트는 공식적으로 훈련 세트와 테스트 세트로 분할되지 않습니다. 사용자는 일반적으로 특정 요구 사항에 따라 자체적으로 분할을 생성합니다. 그러나 일반적으로 훈련용 이미지의 무작위 하위 집합(예: 카테고리당 30개의 이미지)을 사용하고 나머지 이미지를 테스트용으로 사용하는 것이 일반적입니다.
애플리케이션
Caltech-101 데이터 세트는 컨볼루션 신경망 (CNN), 서포트 벡터 머신 (SVM) 및 기타 다양한 머신 러닝 알고리즘과 같은 객체 인식 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 광범위하게 사용됩니다. 다양한 카테고리와 고품질 이미지로 구성되어 있어 머신 러닝 및 컴퓨터 비전 분야의 연구 개발을 위한 훌륭한 데이터 세트입니다.
사용법
100개 시대에 대한 Caltech-101 데이터 세트에서 YOLO 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.
열차 예시
샘플 이미지 및 주석
Caltech-101 데이터 세트에는 다양한 물체의 고품질 컬러 이미지가 포함되어 있어 이미지 분류 작업을 위한 잘 구조화된 데이터 세트를 제공합니다. 다음은 데이터 세트의 몇 가지 이미지 예시입니다:
이 예는 Caltech-101 데이터 세트에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 학습하는 데 있어 다양한 데이터 세트의 중요성을 강조합니다.
인용 및 감사
연구 또는 개발 작업에 Caltech-101 데이터 집합을 사용하는 경우 다음 논문을 인용해 주세요:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스인 Caltech-101 데이터 세트를 만들고 유지 관리해 주신 Li Fei-Fei, Rob Fergus, Pietro Perona에게 감사의 말씀을 전합니다. Caltech-101 데이터 세트와 그 제작자에 대한 자세한 내용은 Caltech-101 데이터 세트 웹사이트를 참조하세요.
자주 묻는 질문
머신 러닝에서 Caltech-101 데이터 세트는 어떤 용도로 사용되나요?
Caltech-101 데이터 세트는 물체 인식 작업을 위한 머신 러닝에서 널리 사용됩니다. 101개 카테고리에 걸쳐 약 9,000개의 이미지가 포함되어 있어 물체 인식 알고리즘을 평가하기 위한 까다로운 벤치마크를 제공합니다. 연구자들은 컴퓨터 비전에서 특히 컨볼루션 신경망 (CNN)과 서포트 벡터 머신(SVM)을 비롯한 모델을 훈련하고 테스트하는 데 이 데이터를 활용합니다.
Caltech-101 데이터 세트에서 Ultralytics YOLO 모델을 훈련하려면 어떻게 해야 하나요?
Caltech-101 데이터 세트에서 Ultralytics YOLO 모델을 훈련하려면 제공된 코드 스니펫을 사용할 수 있습니다. 예를 들어, 100개의 에포크에 대해 훈련할 수 있습니다:
열차 예시
자세한 인수 및 옵션은 모델 교육 페이지를 참조하세요.
Caltech-101 데이터 세트의 주요 기능은 무엇인가요?
Caltech-101 데이터 세트에는 다음이 포함됩니다:
- 101개 카테고리에 걸쳐 약 9,000개의 컬러 이미지가 있습니다.
- 동물, 차량, 가정용품 등 다양한 사물을 아우르는 카테고리가 있습니다.
- 카테고리당 이미지 수는 가변적이며, 일반적으로 40~800개 사이입니다.
- 이미지 크기는 다양하며 대부분 중간 해상도입니다.
이러한 기능 덕분에 머신러닝 및 컴퓨터 비전에서 객체 인식 모델을 훈련하고 평가하는 데 탁월한 선택이 될 수 있습니다.
내 연구에서 Caltech-101 데이터 집합을 인용해야 하는 이유는 무엇인가요?
연구에 Caltech-101 데이터 집합을 인용하면 작성자의 공헌을 인정하고 데이터 집합을 사용할 수 있는 다른 사람들에게 참조를 제공할 수 있습니다. 권장 인용은 다음과 같습니다:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
인용은 학술 작업의 무결성을 유지하는 데 도움이 되며 동료들이 원본 리소스를 찾는 데 도움을 줍니다.
Caltech-101 데이터 세트의 모델 학습에 Ultralytics HUB를 사용할 수 있나요?
예, Caltech-101 데이터 세트에서 모델을 훈련하는 데 Ultralytics HUB를 사용할 수 있습니다. Ultralytics HUB는 데이터 세트 관리, 모델 학습 및 배포를 위한 직관적인 플랫폼을 제공하여 광범위한 코딩 없이도 모델을 학습할 수 있습니다. 자세한 가이드는 Ultralytics HUB로 사용자 지정 모델을 훈련하는 방법 블로그 게시물을 참조하세요.