Caltech-256 데이터셋

Caltech-256 데이터셋은 객체 분류 작업에 사용되는 방대한 이미지 컬렉션입니다. 이 데이터셋은 257개의 카테고리(256개의 객체 카테고리와 1개의 배경 카테고리)로 나뉜 약 30,000개의 이미지를 포함하고 있습니다. 이미지들은 객체 인식 알고리즘을 위한 도전적이고 다양한 벤치마크를 제공하도록 세심하게 선별되고 주석이 달려 있습니다.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
자동 데이터 분할

Caltech-256 데이터셋은 사전 정의된 학습/검증 분할(split)을 제공하지 않습니다. 하지만 아래 사용 예시에 제공된 학습 명령어를 사용하면 Ultralytics 프레임워크가 자동으로 데이터셋을 분할해 줍니다. 기본 분할 비율은 학습 세트 80%, 검증 세트 20%입니다.

주요 특징

  • Caltech-256 데이터셋은 257개의 카테고리로 나뉜 약 30,000개의 컬러 이미지로 구성되어 있습니다.
  • 각 카테고리에는 최소 80개의 이미지가 포함되어 있습니다.
  • 카테고리는 동물, 차량, 가정용품, 사람을 포함하여 다양한 실제 객체를 포괄합니다.
  • 이미지의 크기와 해상도는 다양합니다.
  • Caltech-256은 머신러닝 분야, 특히 객체 인식 작업의 학습 및 테스트에 널리 사용됩니다.

데이터셋 구조

Caltech-101과 마찬가지로, Caltech-256 데이터셋은 학습 세트와 테스트 세트 간의 공식적인 분할이 없습니다. 사용자는 일반적으로 자신의 특정 요구 사항에 따라 직접 분할을 생성합니다. 흔히 사용되는 방식은 이미지의 무작위 하위 집합을 학습에 사용하고 나머지 이미지를 테스트에 사용하는 것입니다.

응용 분야

The Caltech-256 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its diverse set of categories and high-quality images make it an invaluable dataset for research and development in the field of machine learning and computer vision.

사용법

Caltech-256 데이터셋으로 YOLO 모델을 100 epochs 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 Training 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

샘플 이미지 및 주석

Caltech-256 데이터셋은 다양한 객체의 고품질 컬러 이미지를 포함하고 있어 객체 인식 작업을 위한 포괄적인 데이터셋을 제공합니다. 다음은 데이터셋 이미지의 몇 가지 예시입니다(출처):

Caltech-256 이미지 분류 데이터셋 샘플

이 예시는 Caltech-256 데이터셋에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 객체 인식 모델을 학습하는 데 있어 데이터셋 다양성의 중요성을 강조합니다.

인용 및 감사의 글

연구 또는 개발 작업에서 Caltech-256 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

machine learning 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 자원으로서 Caltech-256 데이터셋을 생성하고 유지 관리해 준 Gregory Griffin, Alex Holub, Pietro Perona에게 감사를 표합니다. Caltech-256 데이터셋과 제작자에 대한 자세한 내용은 Caltech-256 데이터셋 웹사이트를 방문하십시오.

FAQ

Caltech-256 데이터셋이란 무엇이며 머신러닝에서 왜 중요한가요?

Caltech-256 데이터셋은 주로 머신러닝 및 컴퓨터 비전의 객체 분류 작업에 사용되는 대규모 이미지 데이터셋입니다. 이 데이터셋은 257개의 카테고리로 나뉜 약 30,000개의 컬러 이미지로 구성되어 있으며 다양한 실제 객체를 다룹니다. 데이터셋의 다양하고 품질 높은 이미지는 강력한 머신러닝 모델 개발에 필수적인 객체 인식 알고리즘 평가를 위한 훌륭한 벤치마크가 됩니다.

Python 또는 CLI를 사용하여 Caltech-256 데이터셋으로 YOLO 모델을 학습하려면 어떻게 해야 하나요?

Caltech-256 데이터셋으로 YOLO 모델을 100 epochs 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 추가 옵션은 모델 Training 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Caltech-256 데이터셋의 가장 일반적인 사용 사례는 무엇인가요?

Caltech-256 데이터셋은 다음과 같은 다양한 객체 인식 작업에 널리 사용됩니다:

  • Convolutional Neural Networks (CNNs) 학습
  • Support Vector Machines (SVMs) 성능 평가
  • 새로운 딥러닝 알고리즘 벤치마킹
  • Ultralytics YOLO와 같은 프레임워크를 사용한 object detection 모델 개발

이 데이터셋의 다양성과 포괄적인 주석은 머신러닝 및 컴퓨터 비전 연구 개발에 이상적입니다.

Caltech-256 데이터셋은 어떻게 구성되어 있으며 학습 및 테스트를 위해 어떻게 분할되나요?

Caltech-256 데이터셋은 학습 및 테스트를 위한 사전 정의된 분할을 제공하지 않습니다. 사용자는 일반적으로 자신의 특정 요구 사항에 따라 직접 분할을 생성합니다. 일반적인 접근 방식은 학습을 위해 이미지의 하위 집합을 무작위로 선택하고 나머지 이미지를 테스트에 사용하는 것입니다. 이러한 유연성 덕분에 사용자는 특정 프로젝트 요구 사항 및 실험 설정에 맞게 데이터셋을 조정할 수 있습니다.

Caltech-256 데이터셋에서 모델을 학습할 때 Ultralytics YOLO를 사용해야 하는 이유는 무엇인가요?

Ultralytics YOLO 모델은 Caltech-256 데이터셋 학습에 다음과 같은 몇 가지 장점을 제공합니다:

  • 높은 정확도: YOLO 모델은 객체 탐지 작업에서 최첨단 성능을 내는 것으로 유명합니다.
  • 속도: 실시간 추론 기능을 제공하여 빠른 예측이 필요한 애플리케이션에 적합합니다.
  • 사용 편의성: Ultralytics Platform을 사용하면 복잡한 코딩 없이 모델을 학습, 검증 및 배포할 수 있습니다.
  • 사전 학습된 모델: yolo26n-cls.pt와 같이 사전 학습된 모델에서 시작하면 학습 시간을 크게 단축하고 모델 accuracy를 향상할 수 있습니다.

자세한 내용은 포괄적인 학습 가이드를 살펴보고 Ultralytics YOLO를 사용한 이미지 분류에 대해 알아보십시오.

댓글