CIFAR-100 데이터셋

CIFAR-100 (캐나다 고등연구원, Canadian Institute For Advanced Research) 데이터셋은 CIFAR-10 데이터셋을 대폭 확장한 것으로, 100개의 서로 다른 클래스에 속한 60,000개의 32x32 컬러 이미지로 구성되어 있습니다. 이 데이터셋은 CIFAR 연구소 연구원들이 개발했으며, 더 복잡한 머신러닝 및 컴퓨터 비전 작업을 위한 도전적인 데이터셋을 제공합니다.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

주요 특징

  • CIFAR-100 데이터셋은 100개의 클래스로 나뉜 60,000개의 이미지로 구성됩니다.
  • 각 클래스는 600개의 이미지를 포함하며, 500개는 학습용, 100개는 테스트용으로 나뉩니다.
  • 이미지는 컬러이며 크기는 32x32 픽셀입니다.
  • 100개의 서로 다른 클래스는 상위 수준 분류를 위해 20개의 거친 범주(coarse categories)로 그룹화되어 있습니다.
  • CIFAR-100은 머신러닝 및 컴퓨터 비전 분야에서 학습 및 테스트용으로 널리 사용됩니다.

데이터셋 구조

CIFAR-100 데이터셋은 두 개의 하위 세트로 나뉩니다:

  1. 학습 세트(Training Set): 이 서브셋은 머신러닝 모델 학습에 사용되는 50,000개의 이미지를 포함합니다.
  2. 테스트 세트(Testing Set): 이 서브셋은 학습된 모델을 테스트하고 벤치마킹하는 데 사용되는 10,000개의 이미지로 구성됩니다.

응용 분야

CIFAR-100 데이터셋은 이미지 분류 작업에서 합성곱 신경망 (CNN), 서포트 벡터 머신 (SVM) 및 기타 다양한 머신러닝 알고리즘과 같은 딥러닝 모델을 학습하고 평가하는 데 광범위하게 사용됩니다. 클래스 관점에서의 다양성과 컬러 이미지의 존재는 이 데이터셋을 머신러닝 및 컴퓨터 비전 분야의 연구 개발을 위한 더욱 도전적이고 포괄적인 데이터셋으로 만들어 줍니다.

사용법

CIFAR-100 데이터셋에서 이미지 크기 32x32로 100 에포크(epoch) 동안 YOLO 모델을 학습시키려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습(Training) 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

샘플 이미지 및 주석

CIFAR-100 데이터셋은 다양한 객체의 컬러 이미지를 포함하고 있어 이미지 분류 작업을 위한 잘 구조화된 데이터셋을 제공합니다. 다음은 데이터셋 이미지의 몇 가지 예시입니다:

CIFAR-100 이미지 분류 데이터셋 샘플

이 예시는 CIFAR-100 데이터셋에 있는 객체의 다양성과 복잡성을 보여주며, 강력한 이미지 분류 모델을 학습하기 위한 다양한 데이터셋의 중요성을 강조합니다.

인용 및 감사의 글

연구 또는 개발 작업에 CIFAR-100 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

머신러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 자원으로서 CIFAR-100 데이터셋을 생성하고 유지 관리한 Alex Krizhevsky에게 감사를 표합니다. CIFAR-100 데이터셋과 그 제작자에 대한 자세한 내용은 CIFAR-100 데이터셋 웹사이트를 방문하십시오.

FAQ

CIFAR-100 데이터셋이란 무엇이며 왜 중요한가요?

The CIFAR-100 dataset is a large collection of 60,000 32x32 color images classified into 100 classes. Developed by the Canadian Institute For Advanced Research (CIFAR), it provides a challenging dataset ideal for complex machine learning and computer vision tasks. Its significance lies in the diversity of classes and the small size of the images, making it a valuable resource for training and testing deep learning models, like Convolutional Neural Networks (CNNs), using frameworks such as Ultralytics YOLO.

CIFAR-100 데이터셋에서 YOLO 모델을 어떻게 학습시키나요?

Python 또는 CLI 명령어를 사용하여 CIFAR-100 데이터셋에서 YOLO 모델을 학습시킬 수 있습니다. 방법은 다음과 같습니다:

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

사용 가능한 인수의 전체 목록은 모델 학습(Training) 페이지를 참조하십시오.

CIFAR-100 데이터셋의 주요 애플리케이션은 무엇인가요?

CIFAR-100 데이터셋은 이미지 분류를 위한 딥러닝 모델의 학습 및 평가에 널리 사용됩니다. 20개의 거친 범주로 그룹화된 100개의 다양한 클래스 세트는 합성곱 신경망(CNN), 서포트 벡터 머신(SVM) 및 기타 다양한 머신러닝 접근 방식을 테스트하기 위한 도전적인 환경을 제공합니다. 이 데이터셋은 머신러닝 및 컴퓨터 비전 분야, 특히 객체 인식 및 분류 작업의 연구 개발에서 핵심적인 자원입니다.

CIFAR-100 데이터셋은 어떻게 구성되어 있나요?

CIFAR-100 데이터셋은 두 개의 주요 하위 세트로 나뉩니다:

  1. 학습 세트(Training Set): 머신러닝 모델 학습에 사용되는 50,000개의 이미지를 포함합니다.
  2. 테스트 세트(Testing Set): 학습된 모델을 테스트하고 벤치마킹하는 데 사용되는 10,000개의 이미지로 구성됩니다.

100개의 각 클래스는 600개의 이미지를 포함하며, 500개는 학습용, 100개는 테스트용으로 제공되어 엄격한 학술 및 산업 연구에 독특하게 적합합니다.

CIFAR-100 데이터셋의 샘플 이미지와 주석은 어디서 찾을 수 있나요?

CIFAR-100 데이터셋에는 다양한 객체의 컬러 이미지들이 포함되어 있어 이미지 분류 작업을 위한 구조화된 데이터셋이 됩니다. 샘플 이미지 및 주석을 보려면 문서 페이지를 참조하십시오. 이 예시들은 강력한 이미지 분류 모델을 학습하는 데 중요한 데이터셋의 다양성과 복잡성을 강조합니다. 분류 작업에 적합한 더 많은 데이터셋은 Ultralytics 분류 데이터셋 개요에서 확인하십시오.

댓글