콘텐츠로 건너뛰기

CIFAR-100 데이터 세트

CIFAR-100 (캐나다 고급 연구 연구소) 데이터 세트는 100가지 클래스의 32x32 컬러 이미지 60,000개로 구성된 CIFAR-10 데이터 세트의 중요한 확장판입니다. CIFAR 연구소의 연구원들이 개발했으며, 보다 복잡한 머신 러닝 및 컴퓨터 비전 작업을 위한 더 까다로운 데이터 세트를 제공합니다.



Watch: CIFAR-100 교육 방법 Ultralytics YOLO11 | 단계별 이미지 분류 튜토리얼 🚀

주요 기능

  • CIFAR-100 데이터 세트는 60,000개의 이미지로 구성되어 있으며, 100개의 클래스로 나뉩니다.
  • 각 클래스에는 교육용 이미지 500개와 테스트용 이미지 100개로 나뉜 600개의 이미지가 포함되어 있습니다.
  • 이미지는 컬러이며 크기는 32x32픽셀입니다.
  • 100가지 클래스는 더 높은 수준의 분류를 위해 20개의 대략적인 카테고리로 그룹화됩니다.
  • CIFAR-100은 일반적으로 머신러닝 및 컴퓨터 비전 분야의 교육 및 테스트에 사용됩니다.

데이터 세트 구조

CIFAR-100 데이터 세트는 두 개의 하위 집합으로 나뉩니다:

  1. 훈련 세트: 이 하위 집합에는 머신러닝 모델 학습에 사용되는 50,000개의 이미지가 포함되어 있습니다.
  2. 테스트 세트: 이 하위 집합은 학습된 모델을 테스트하고 벤치마킹하는 데 사용되는 10,000개의 이미지로 구성됩니다.

애플리케이션

CIFAR-100 데이터 세트는 컨볼루션 신경망 (CNN), 서포트 벡터 머신 (SVM) 및 기타 다양한 머신 러닝 알고리즘과 같은 이미지 분류 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 광범위하게 사용됩니다. 클래스 측면에서 데이터 세트의 다양성과 컬러 이미지의 존재로 인해 머신 러닝 및 컴퓨터 비전 분야의 연구 개발을 위한 더욱 도전적이고 포괄적인 데이터 세트가 되었습니다.

사용법

이미지 크기가 32x32인 100개의 에포크에 대해 CIFAR-100 데이터 세트에서 YOLO 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하세요.

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

샘플 이미지 및 주석

CIFAR-100 데이터 세트에는 다양한 물체의 컬러 이미지가 포함되어 있어 이미지 분류 작업을 위한 잘 구조화된 데이터 세트를 제공합니다. 다음은 데이터 세트의 몇 가지 이미지 예시입니다:

데이터 세트 샘플 이미지

이 예는 CIFAR-100 데이터 세트에 포함된 객체의 다양성과 복잡성을 보여주며, 강력한 이미지 분류 모델을 훈련하기 위해서는 다양한 데이터 세트가 중요하다는 것을 강조합니다.

인용 및 감사

연구 또는 개발 작업에 CIFAR-100 데이터 세트를 사용하는 경우 다음 논문을 인용해 주세요:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스인 CIFAR-100 데이터 세트를 만들고 유지 관리해 주신 Alex Krizhevsky에게 감사의 말씀을 전하고 싶습니다. CIFAR-100 데이터 세트와 제작자에 대한 자세한 내용은 CIFAR-100 데이터 세트 웹사이트를 참조하세요.

자주 묻는 질문

CIFAR-100 데이터 세트는 무엇이며 왜 중요한가요?

CIFAR-100 데이터 세트는 100개의 클래스로 분류된 60,000개의 32x32 컬러 이미지로 구성된 대규모 컬렉션입니다. 캐나다 고급 연구 연구소(CIFAR)에서 개발한 이 데이터 세트는 복잡한 머신 러닝 및 컴퓨터 비전 작업에 이상적인 고난이도 데이터 세트를 제공합니다. 클래스의 다양성과 이미지의 작은 크기로 인해 다음과 같은 프레임워크를 사용하여 컨볼루션 신경망 (CNN)과 같은 딥 러닝 모델을 훈련하고 테스트하는 데 유용한 리소스로 활용할 수 있습니다. Ultralytics YOLO.

CIFAR-100 데이터 세트에서 YOLO 모델을 훈련하려면 어떻게 하나요?

Python 또는 CLI 명령을 사용하여 CIFAR-100 데이터 세트에서 YOLO 모델을 학습시킬 수 있습니다. 방법은 다음과 같습니다:

열차 예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

사용 가능한 인수의 전체 목록은 모델 교육 페이지를 참조하세요.

CIFAR-100 데이터 세트의 주요 활용 분야는 무엇인가요?

CIFAR-100 데이터 세트는 이미지 분류를 위한 딥 러닝 모델을 훈련하고 평가하는 데 광범위하게 사용됩니다. 20개의 대략적인 카테고리로 그룹화된 100개의 다양한 클래스 세트는 컨볼루션 신경망(CNN), 서포트 벡터 머신(SVM) 및 기타 다양한 머신 러닝 접근법과 같은 알고리즘을 테스트할 수 있는 까다로운 환경을 제공합니다. 이 데이터 세트는 머신 러닝 및 컴퓨터 비전 분야의 연구 개발, 특히 객체 인식 및 분류 작업의 핵심 리소스입니다.

CIFAR-100 데이터 세트는 어떻게 구성되어 있나요?

CIFAR-100 데이터 세트는 두 가지 주요 하위 집합으로 나뉩니다:

  1. 트레이닝 세트: 머신러닝 모델 학습에 사용되는 50,000개의 이미지가 포함되어 있습니다.
  2. 테스트 세트: 학습된 모델을 테스트하고 벤치마킹하는 데 사용되는 10,000개의 이미지로 구성됩니다.

100개의 클래스에는 각각 500개의 교육용 이미지와 100개의 테스트용 이미지로 구성된 600개의 이미지가 포함되어 있어 엄격한 학술 및 산업 연구에 매우 적합합니다.

CIFAR-100 데이터 세트의 샘플 이미지와 주석은 어디에서 찾을 수 있나요?

CIFAR-100 데이터 세트에는 다양한 물체의 다양한 컬러 이미지가 포함되어 있어 이미지 분류 작업을 위한 구조화된 데이터 세트입니다. 문서 페이지를 참조하여 샘플 이미지와 주석을 확인할 수 있습니다. 이러한 예는 강력한 이미지 분류 모델을 훈련하는 데 중요한 데이터 세트의 다양성과 복잡성을 강조합니다. 분류 작업에 적합한 더 많은 데이터 세트는 Ultralytics 분류 데이터 세트 개요를 참조하세요.

📅1 년 전 생성됨 ✏️ 11 일 전 업데이트됨

댓글