콘텐츠로 건너뛰기

CIFAR-100 데이터 세트

CIFAR-100 (Canadian Institute For Advanced Research) 데이터 세트는 CIFAR-10 데이터 세트의 중요한 확장판으로, 100개의 서로 다른 클래스에 60,000개의 32x32 컬러 이미지로 구성됩니다. CIFAR 연구소의 연구원들이 개발했으며, 보다 복잡한 머신 러닝 및 컴퓨터 비전 작업을 위한 더 어려운 데이터 세트를 제공합니다.



참고: CIFAR-100에서 Ultralytics YOLO11을 훈련하는 방법 | 단계별 이미지 분류 튜토리얼 🚀

주요 기능

  • CIFAR-100 데이터 세트는 100개의 클래스로 나뉜 60,000개의 이미지로 구성됩니다.
  • 각 클래스는 600개의 이미지를 포함하며, 훈련용으로 500개, 테스트용으로 100개로 나뉩니다.
  • 이미지는 컬러이며 크기는 32x32 픽셀입니다.
  • 100개의 서로 다른 클래스는 더 높은 수준의 분류를 위해 20개의 대략적인 범주로 그룹화됩니다.
  • CIFAR-100은 기계 학습 및 컴퓨터 비전 분야에서 학습 및 테스트에 일반적으로 사용됩니다.

데이터 세트 구조

CIFAR-100 데이터 세트는 다음과 같이 두 개의 하위 집합으로 나뉩니다.

  1. 학습 세트: 이 하위 집합은 머신 러닝 모델 학습에 사용되는 50,000개의 이미지를 포함합니다.
  2. 테스트 세트: 이 하위 집합은 훈련된 모델의 테스트 및 벤치마킹에 사용되는 10,000개의 이미지로 구성됩니다.

응용 분야

CIFAR-100 데이터 세트는 이미지 분류 작업에서 딥러닝 모델을 학습하고 평가하는 데 널리 사용됩니다. 여기에는 합성곱 신경망(CNN), Support Vector Machines(SVM) 및 기타 다양한 머신 러닝 알고리즘이 포함됩니다. 클래스 측면에서 데이터 세트의 다양성과 컬러 이미지의 존재는 머신 러닝 및 컴퓨터 비전 분야의 연구 개발에 더욱 어렵고 포괄적인 데이터 세트가 됩니다.

사용법

32x32 이미지 크기로 CIFAR-100 데이터 세트에서 YOLO 모델을 100 epochs 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 Training 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

샘플 이미지 및 주석

CIFAR-100 데이터 세트는 다양한 객체의 컬러 이미지를 포함하고 있으며, 이미지 분류 작업을 위한 잘 구성된 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 예시입니다.

데이터 세트 샘플 이미지

이 예는 CIFAR-100 데이터 세트의 객체의 다양성과 복잡성을 보여주며, 강력한 이미지 분류 모델을 훈련하기 위한 다양한 데이터 세트의 중요성을 강조합니다.

인용 및 감사의 말씀

연구 또는 개발 작업에 CIFAR-100 데이터 세트를 사용하는 경우 다음 논문을 인용해 주세요:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

기계 학습 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스로서 CIFAR-100 데이터 세트를 만들고 유지 관리해 주신 Alex Krizhevsky에게 감사를 드립니다. CIFAR-100 데이터 세트 및 제작자에 대한 자세한 내용은 CIFAR-100 데이터 세트 웹사이트를 방문하십시오.

FAQ

CIFAR-100 데이터 세트란 무엇이며 왜 중요한가요?

CIFAR-100 데이터 세트는 100개의 클래스로 분류된 60,000개의 32x32 컬러 이미지로 구성된 대규모 컬렉션입니다. Canadian Institute For Advanced Research(CIFAR)에서 개발했으며 복잡한 머신 러닝 및 컴퓨터 비전 작업에 이상적인 까다로운 데이터 세트를 제공합니다. 그 중요성은 클래스의 다양성과 이미지의 작은 크기에 있으며, Ultralytics YOLO와 같은 프레임워크를 사용하여 컨볼루션 신경망(CNN)과 같은 딥 러닝 모델을 훈련하고 테스트하는 데 유용한 리소스입니다.

CIFAR-100 데이터 세트에서 YOLO 모델을 어떻게 훈련하나요?

Python 또는 CLI 명령을 사용하여 CIFAR-100 데이터 세트에서 YOLO 모델을 학습시킬 수 있습니다. 방법은 다음과 같습니다.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

사용 가능한 인자의 전체 목록은 모델 학습 페이지를 참조하십시오.

CIFAR-100 데이터 세트의 주요 응용 분야는 무엇입니까?

CIFAR-100 데이터 세트는 이미지 분류를 위한 딥러닝 모델을 훈련하고 평가하는 데 널리 사용됩니다. 20개의 대략적인 범주로 그룹화된 100개의 다양한 클래스 세트는 합성곱 신경망(CNN), Support Vector Machines(SVM) 및 기타 다양한 머신 러닝 접근 방식과 같은 알고리즘을 테스트하기 위한 어려운 환경을 제공합니다. 이 데이터 세트는 특히 객체 인식 및 분류 작업에서 머신 러닝 및 컴퓨터 비전 분야 내 연구 개발의 핵심 리소스입니다.

CIFAR-100 데이터 세트는 어떻게 구성되어 있습니까?

CIFAR-100 데이터 세트는 두 개의 주요 하위 세트로 나뉩니다.

  1. 훈련 세트: 머신 러닝 모델을 훈련하는 데 사용되는 50,000개의 이미지가 포함되어 있습니다.
  2. 테스트 세트: 훈련된 모델을 테스트하고 벤치마킹하는 데 사용되는 10,000개의 이미지로 구성됩니다.

100개의 클래스 각각은 600개의 이미지를 포함하며, 500개의 이미지는 훈련용으로, 100개의 이미지는 테스트용으로 사용되어 엄격한 학술 및 산업 연구에 적합합니다.

CIFAR-100 데이터 세트에서 샘플 이미지와 주석은 어디에서 찾을 수 있습니까?

CIFAR-100 데이터 세트에는 다양한 객체의 다양한 컬러 이미지가 포함되어 있어 이미지 분류 작업을 위한 구조화된 데이터 세트가 됩니다. 샘플 이미지와 주석을 보려면 설명서 페이지를 참조하십시오. 이러한 예는 강력한 이미지 분류 모델을 훈련하는 데 중요한 데이터 세트의 다양성과 복잡성을 강조합니다. 분류 작업에 적합한 더 많은 데이터 세트를 보려면 Ultralytics의 분류 데이터 세트 개요를 확인하십시오.



📅 1년 전에 생성됨 ✏️ 5개월 전에 업데이트됨

댓글