Skip to content

Caltech-256 데이터 세트

Caltech-256 데이터 세트는 객체 분류 작업에 사용되는 광범위한 이미지 모음입니다. 약 30,000개의 이미지가 257개의 범주(256개의 객체 범주와 1개의 배경 범주)로 나뉩니다. 이 이미지들은 객체 인식 알고리즘을 위한 도전적이고 다양한 벤치마크를 제공하기 위해 신중하게 선별되고 주석이 추가되었습니다.



참고: 훈련 방법 이미지 분류 Ultralytics HUB를 사용하여 Caltech-256 데이터 세트로 모델링

자동 데이터 분할

제공된 Caltech-256 데이터 세트에는 사전 정의된 학습/검증 분할이 없습니다. 그러나 아래 사용 예에 제공된 학습 명령을 사용하면 Ultralytics 프레임워크가 데이터 세트를 자동으로 분할합니다. 사용되는 기본 분할은 학습 세트에 80%, 검증 세트에 20%입니다.

주요 기능

  • Caltech-256 데이터 세트는 257개의 범주로 나뉜 약 30,000개의 컬러 이미지로 구성됩니다.
  • 각 범주에는 최소 80개의 이미지가 포함되어 있습니다.
  • 이러한 범주는 동물, 차량, 가정용품 및 사람을 포함한 광범위한 실제 객체를 포함합니다.
  • 이미지는 다양한 크기와 해상도를 가집니다.
  • Caltech-256은 머신 러닝, 특히 객체 인식 작업 분야에서 학습 및 테스트에 널리 사용됩니다.

데이터 세트 구조

Caltech-101과 마찬가지로 Caltech-256 데이터 세트에는 훈련 및 테스트 세트 간의 공식적인 분할이 없습니다. 사용자는 일반적으로 특정 요구 사항에 따라 자체 분할을 만듭니다. 일반적인 방법은 훈련을 위해 이미지의 임의 하위 집합을 사용하고 나머지 이미지는 테스트에 사용하는 것입니다.

응용 분야

Caltech-256 데이터 세트는 딥러닝 모델을 학습하고 객체 인식 작업에서 평가하는 데 널리 사용됩니다. 여기에는 합성곱 신경망(CNN), Support Vector Machines(SVM) 및 기타 다양한 머신 러닝 알고리즘이 포함됩니다. 다양한 범주와 고품질 이미지는 머신 러닝 및 컴퓨터 비전 분야의 연구 개발에 매우 귀중한 데이터 세트가 됩니다.

사용법

Caltech-256 데이터 세트에서 100 epoch 동안 YOLO 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 전체 인수 목록은 모델 Training 페이지를 참조하세요.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

샘플 이미지 및 주석

Caltech-256 데이터 세트에는 다양한 물체의 고품질 컬러 이미지가 포함되어 있어 물체 인식 작업을 위한 포괄적인 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 몇 가지 예시입니다(크레딧):

데이터 세트 샘플 이미지

이 예는 Caltech-256 데이터 세트에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 훈련하기 위해서는 다양한 데이터 세트가 중요하다는 점을 강조합니다.

인용 및 감사의 말씀

연구 또는 개발 작업에 Caltech-256 데이터 세트를 사용하는 경우 다음 논문을 인용해 주십시오.

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스로서 Caltech-256 데이터 세트를 만들고 유지 관리해 주신 Gregory Griffin, Alex Holub, Pietro Perona에게 감사를 드립니다. Caltech-256 데이터 세트 및 제작자에 대한 자세한 내용은 Caltech-256 데이터 세트 웹사이트를 방문하십시오.

FAQ

Caltech-256 데이터 세트란 무엇이며 머신 러닝에 왜 중요한가요?

Caltech-256 데이터 세트는 머신 러닝 및 컴퓨터 비전에서 주로 객체 분류 작업에 사용되는 대규모 이미지 데이터 세트입니다. 약 30,000개의 컬러 이미지가 257개의 범주로 나뉘어 있으며, 광범위한 실제 객체를 다룹니다. 이 데이터 세트의 다양하고 고품질 이미지는 강력한 머신 러닝 모델 개발에 중요한 객체 인식 알고리즘을 평가하기 위한 훌륭한 벤치마크가 됩니다.

Python 또는 CLI를 사용하여 Caltech-256 데이터 세트에서 YOLO 모델을 어떻게 훈련할 수 있나요?

Caltech-256 데이터 세트에서 YOLO 모델을 100 epoch 동안 훈련하려면 다음 코드 스니펫을 사용할 수 있습니다. 추가 옵션은 모델 훈련 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Caltech-256 데이터 세트의 가장 일반적인 사용 사례는 무엇입니까?

Caltech-256 데이터 세트는 다음과 같은 다양한 객체 인식 작업에 널리 사용됩니다.

  • 합성곱 신경망(CNN) 훈련
  • SVM(Support Vector Machines)의 성능을 평가합니다.
  • 새로운 딥 러닝 알고리즘 벤치마킹
  • Ultralytics YOLO와 같은 프레임워크를 사용하여 객체 감지 모델 개발

다양성과 포괄적인 주석 덕분에 머신 러닝 및 컴퓨터 비전 연구 개발에 이상적입니다.

Caltech-256 데이터 세트는 훈련 및 테스트를 위해 어떻게 구성되고 분할됩니까?

Caltech-256 데이터 세트는 훈련 및 테스트를 위한 사전 정의된 분할을 제공하지 않습니다. 사용자는 일반적으로 특정 요구 사항에 따라 자체 분할을 만듭니다. 일반적인 접근 방식은 훈련을 위해 이미지의 하위 집합을 임의로 선택하고 나머지 이미지를 테스트에 사용하는 것입니다. 이러한 유연성을 통해 사용자는 특정 프로젝트 요구 사항 및 실험 설정에 맞게 데이터 세트를 조정할 수 있습니다.

Caltech-256 데이터 세트에서 모델을 훈련하는 데 Ultralytics YOLO를 사용해야 하는 이유는 무엇입니까?

Ultralytics YOLO 모델은 Caltech-256 데이터 세트에서 학습할 때 다음과 같은 여러 가지 장점을 제공합니다.

  • 높은 정확도: YOLO 모델은 객체 감지 작업에서 최첨단 성능으로 알려져 있습니다.
  • 속도: 빠른 예측이 필요한 애플리케이션에 적합한 실시간 추론 기능을 제공합니다.
  • 사용 편의성: Ultralytics HUB를 통해 사용자는 광범위한 코딩 없이 모델을 학습, 검증 및 배포할 수 있습니다.
  • 사전 훈련된 모델: 사전 훈련된 모델부터 시작하여, yolo11n-cls.pt는 훈련 시간을 크게 줄이고 모델을 개선할 수 있습니다. 정확도.

자세한 내용은 종합적인 트레이닝 가이드를 살펴보고 Ultralytics YOLO를 이용한 이미지 분류에 대해 알아보세요.



📅 1년 전에 생성됨 ✏️ 4개월 전에 업데이트됨

댓글