Skip to content

Caltech-256 데이터 세트

Caltech-256 데이터 세트는 물체 분류 작업에 사용되는 광범위한 이미지 모음입니다. 257개의 카테고리(256개의 물체 카테고리와 1개의 배경 카테고리)로 나뉜 약 30,000개의 이미지가 포함되어 있습니다. 이 이미지들은 물체 인식 알고리즘을 위한 도전적이고 다양한 벤치마크를 제공하기 위해 신중하게 선별되고 주석을 달았습니다.



Watch: 교육 방법 이미지 분류 Caltech-256 데이터세트와 Ultralytics HUB를 사용한 모델링

주요 기능

  • Caltech-256 데이터 세트는 257개의 카테고리로 나뉜 약 30,000개의 컬러 이미지로 구성되어 있습니다.
  • 각 카테고리에는 최소 80개의 이미지가 포함됩니다.
  • 카테고리에는 동물, 차량, 가정용품, 사람 등 다양한 실제 사물이 포함됩니다.
  • 이미지의 크기와 해상도는 다양합니다.
  • Caltech-256은 머신러닝 분야, 특히 객체 인식 작업의 훈련 및 테스트에 널리 사용됩니다.

데이터 세트 구조

Caltech-101과 마찬가지로, Caltech-256 데이터 세트는 훈련 세트와 테스트 세트 사이에 공식적인 분할이 없습니다. 사용자는 일반적으로 특정 필요에 따라 자체적으로 분할을 생성합니다. 일반적으로 이미지의 무작위 하위 집합을 트레이닝에 사용하고 나머지 이미지를 테스트에 사용하는 것이 일반적입니다.

애플리케이션

Caltech-256 데이터 세트는 컨볼루션 신경망 (CNN), 서포트 벡터 머신 (SVM) 및 기타 다양한 머신 러닝 알고리즘과 같은 객체 인식 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 광범위하게 사용됩니다. 다양한 카테고리와 고품질 이미지로 구성되어 있어 머신 러닝 및 컴퓨터 비전 분야의 연구와 개발에 매우 유용한 데이터 세트입니다.

사용법

100개 시대에 대한 Caltech-256 데이터 세트에서 YOLO 모델을 훈련하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

샘플 이미지 및 주석

Caltech-256 데이터 세트에는 다양한 물체의 고품질 컬러 이미지가 포함되어 있어 물체 인식 작업을 위한 포괄적인 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 몇 가지 예시입니다(크레딧):

데이터 세트 샘플 이미지

이 예는 Caltech-256 데이터 세트에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 훈련하기 위해서는 다양한 데이터 세트가 중요하다는 점을 강조합니다.

인용 및 감사

연구 또는 개발 작업에 Caltech-256 데이터 집합을 사용하는 경우 다음 논문을 인용해 주세요:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스인 Caltech-256 데이터 세트를 만들고 유지 관리해 주신 Gregory Griffin, Alex Holub, Pietro Perona에게 감사의 말씀을 전합니다. Caltech-256 데이터 세트와 제작자에 대한 자세한 내용은 Caltech-256 데이터 세트 웹사이트를 참조하세요.

자주 묻는 질문

Caltech-256 데이터 세트는 무엇이며 머신 러닝에 중요한 이유는 무엇인가요?

Caltech-256 데이터 세트는 주로 머신 러닝과 컴퓨터 비전의 객체 분류 작업에 사용되는 대규모 이미지 데이터 세트입니다. 257개의 카테고리로 나뉜 약 30,000개의 컬러 이미지로 구성되어 있으며, 다양한 실제 사물을 포괄합니다. 이 데이터 세트의 다양하고 고품질의 이미지는 강력한 머신 러닝 모델을 개발하는 데 중요한 물체 인식 알고리즘을 평가하는 데 훌륭한 벤치마크가 됩니다.

Python 또는 CLI 을 사용하여 Caltech-256 데이터 세트에서 YOLO 모델을 훈련하려면 어떻게 해야 하나요?

다음 코드 스니펫을 사용하여 100개의 에포크에 대해 Caltech-256 데이터 집합에서 YOLO 모델을 훈련할 수 있습니다. 추가 옵션은 모델 학습 페이지를 참조하세요.

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Caltech-256 데이터 집합의 가장 일반적인 사용 사례는 무엇인가요?

Caltech-256 데이터 세트는 다음과 같은 다양한 물체 인식 작업에 널리 사용됩니다:

  • 컨볼루션 신경망 (CNN) 훈련하기
  • 서포트 벡터 머신(SVM)의 성능 평가하기
  • 새로운 딥러닝 알고리즘 벤치마킹
  • 다음과 같은 프레임워크를 사용하여 객체 감지 모델 개발하기 Ultralytics YOLO

다양성과 포괄적인 주석으로 머신 러닝 및 컴퓨터 비전 분야의 연구 개발에 이상적입니다.

교육 및 테스트를 위해 Caltech-256 데이터 세트는 어떻게 구조화되고 분할되나요?

Caltech-256 데이터 세트에는 교육 및 테스트를 위한 사전 정의된 분할이 제공되지 않습니다. 일반적으로 사용자는 특정 필요에 따라 직접 분할을 생성합니다. 일반적인 접근 방식은 훈련용 이미지의 하위 집합을 무작위로 선택하고 나머지 이미지를 테스트에 사용하는 것입니다. 이러한 유연성 덕분에 사용자는 특정 프로젝트 요구 사항과 실험 설정에 맞게 데이터 세트를 조정할 수 있습니다.

Caltech-256 데이터 세트의 모델 학습에 Ultralytics YOLO 을 사용해야 하는 이유는 무엇인가요?

Ultralytics YOLO 모델은 Caltech-256 데이터 세트에 대한 교육에 몇 가지 이점을 제공합니다:

  • 높은 정확도: YOLO 모델은 물체 감지 작업에서 최첨단 성능으로 잘 알려져 있습니다.
  • 속도: 실시간 추론 기능을 제공하므로 빠른 예측이 필요한 애플리케이션에 적합합니다.
  • 사용의 용이성: 사용자는 Ultralytics HUB를 사용하여 광범위한 코딩 없이 모델을 학습, 검증 및 배포할 수 있습니다.
  • 사전 학습된 모델: 다음과 같이 사전 학습된 모델부터 시작 yolo11n-cls.pt를 사용하면 훈련 시간을 크게 줄이고 모델을 개선할 수 있습니다. 정확성.

자세한 내용은 종합 교육 가이드를 살펴보고 Ultralytics YOLO 사용한 이미지 분류에 대해 알아보세요.

📅1 년 전 생성됨 ✏️ 11 일 전 업데이트됨

댓글