Link to this sectionCaltech-256 데이터셋#

Caltech-256 데이터셋은 256개의 객체 카테고리와 1개의 배경 클래스로 구성된 30,607장의 이미지로 이루어진 고전적인 이미지 분류 벤치마크입니다. 각 카테고리는 동물, 차량, 가정용품, 사람 등 실세계 객체 이미지 80장 이상을 포함하고 있으며, 이는 객체 인식 모델을 위한 Caltech-101의 더 크고 도전적인 후속 버전입니다.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

자동 데이터 분할

Caltech-256은 사전 정의된 학습/검증 분할 없이 제공됩니다. 아래의 학습 명령어는 이를 자동으로 80% 학습 / 20% 검증으로 분할하므로 수동으로 준비할 필요가 없습니다.

Link to this section주요 특징#

Caltech-256은 256개의 객체 카테고리와 1개의 257.clutter 배경 클래스(총 257개의 클래스 폴더)에 걸쳐 총 30,607장의 컬러 이미지를 포함합니다.
카테고리는 동물, 차량, 가정용품, 사람을 포함한 다양한 실제 객체로 구성되어 있습니다.
각 카테고리는 최소 80장의 이미지를 보유하고 있으며, 가장 큰 카테고리는 최대 약 800장의 이미지를 보유하고 있어 클래스 크기가 불균형합니다.
이미지는 다양한 크기와 해상도를 가지고 있습니다.
Caltech-256은 이미지 분류 및 객체 인식 알고리즘을 벤치마킹하는 데 널리 사용됩니다.

Link to this section데이터셋 구조#

Caltech-256은 256개의 객체 카테고리와 1개의 257.clutter 배경 클래스를 포함하는 257개의 폴더로 배포되며, 사전 정의된 학습/검증 분할이 없습니다. 학습을 시작하면 Ultralytics가 자동으로 이미지를 분할하여 수동 설정 없이도 257개 클래스 전체에 걸쳐 모델이 학습되도록 합니다:

클래스: 257 (256개 객체 카테고리 + 1개 배경)
전체 이미지: 30,607장
학습/검증 분할: 자동 80% / 20% (학습 약 24,385장, 검증 약 6,222장)
클래스당 이미지 수: 최소 80장 (불균형, 최대 약 800장까지)

Caltech-256 데이터셋은 image classification 및 객체 인식 모델을 훈련하고 평가하는 데 널리 사용되며, Convolutional Neural Networks(CNN)과 Support Vector Machines(SVM)을 포함합니다. 방대한 카테고리 수와 고품질 이미지를 갖추고 있어 machine learning 및 computer vision 연구와 프로토타이핑을 위한 인기 있는 벤치마크입니다.

Link to this section사용법#

416 이미지 크기에서 100 에폭 동안 Caltech-256으로 YOLO 모델을 학습하십시오. 사용 가능한 전체 인수 목록은 학습 페이지와 이미지 분류 작업 가이드를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this section샘플 이미지 및 주석#

Caltech-256 데이터셋은 다양한 객체의 고품질 컬러 이미지를 포함하고 있어 이미지 분류 작업을 위한 잘 구성된 데이터셋을 제공합니다. 다음은 데이터셋의 이미지 예시입니다(출처):

Caltech-256 이미지 분류 데이터셋 샘플

이 샘플들은 Caltech-256 데이터셋에 포함된 객체의 다양성과 복잡성을 보여주며, 견고한 객체 인식 모델을 학습하기 위한 다양한 데이터셋의 가치를 강조합니다.

Link to this section인용 및 감사의 글#

연구 또는 개발 작업에 Caltech-256 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:

인용

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Caltech-256 데이터셋을 머신러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 가치 있는 자원으로 만들고 유지 관리해 준 Gregory Griffin, Alex Holub, Pietro Perona에게 감사를 표합니다. Caltech-256 데이터셋과 제작자에 대한 자세한 내용은 Caltech-256 데이터셋 웹사이트를 방문하십시오.

Link to this sectionFAQ#

Link to this sectionCaltech-256 데이터셋은 머신러닝에서 어떤 용도로 사용됩니까?#

Caltech-256 데이터셋은 이미지 분류 및 객체 인식 모델을 학습하고 벤치마킹하는 데 널리 사용됩니다. 이 데이터셋은 256개의 객체 카테고리와 1개의 배경 클래스에 걸쳐 30,607장의 이미지를 포함하고 있으며, 신경망(CNN) 및 서포트 벡터 머신(SVM)과 같은 알고리즘을 위해 Caltech-101보다 더 크고 도전적인 벤치마크를 제공합니다.

Link to this sectionCaltech-256 데이터셋으로 Ultralytics YOLO 모델을 어떻게 학습할 수 있습니까?#

Caltech-256에서 Ultralytics YOLO 모델을 학습하려면 아래 코드 스니펫을 사용하십시오. 데이터셋은 처음 사용할 때 자동으로 다운로드됩니다. 전체 인수 목록은 모델 학습 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionCaltech-256 데이터셋에는 몇 개의 클래스가 있습니까?#

Caltech-256은 256개의 객체 카테고리와 1개의 257.clutter 배경 클래스를 포함하여 총 257개의 클래스 폴더와 30,607장의 이미지가 있습니다. Ultralytics로 학습할 때 모델은 257개 클래스를 모두 학습합니다. 각 카테고리는 최소 80장의 이미지를 보유하고 있지만, 클래스 크기는 불균형하며 가장 큰 카테고리는 최대 약 800장의 이미지를 보유합니다.

Link to this sectionCaltech-256 데이터셋은 어떻게 학습 및 검증 세트로 분할됩니까?#

Caltech-256은 사전 정의된 분할이 없습니다. 처음 학습할 때 Ultralytics는 자동으로 이를 80% 학습 / 20% 검증으로 분할(학습 약 24,385장, 검증 약 6,222장)하므로 수동으로 분할을 생성할 필요가 없습니다. 직접 분할을 제어하려면 학습 전에 이미지를 train/ 및 val/ 폴더로 구성하십시오.

Link to this sectionUltralytics Platform을 사용하여 Caltech-256 데이터셋에서 모델을 학습할 수 있습니까?#

네. Ultralytics Platform을 사용하면 데이터셋을 관리하고 이미지 분류 모델을 학습하며 복잡한 코딩 없이 배포할 수 있습니다. 이는 클라우드에서 Caltech-256 실험을 실행하는 편리한 방법이며, 분류 데이터셋 개요에서 더 많은 옵션을 탐색할 수 있습니다.

기여자

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

생성됨 2023년 11월 12일업데이트됨 어제