CIFAR-10 데이터 세트
CIFAR-10 (Canadian Institute For Advanced Research) 데이터 세트는 머신 러닝 및 컴퓨터 비전 알고리즘에 널리 사용되는 이미지 모음입니다. CIFAR 연구소의 연구원들이 개발했으며 10개의 서로 다른 클래스에 60,000개의 32x32 컬러 이미지로 구성됩니다.
참고: 훈련 방법 이미지 분류 Ultralytics YOLO11을 사용한 CIFAR-10 데이터 세트 모델
주요 기능
- CIFAR-10 데이터 세트는 10개의 클래스로 나뉜 60,000개의 이미지로 구성됩니다.
- 각 클래스는 6,000개의 이미지를 포함하며, 학습용으로 5,000개, 테스트용으로 1,000개로 분할됩니다.
- 이미지는 컬러이며 크기는 32x32 픽셀입니다.
- 10개의 서로 다른 클래스는 비행기, 자동차, 새, 고양이, 사슴, 개, 개구리, 말, 배 및 트럭을 나타냅니다.
- CIFAR-10은 머신 러닝 및 컴퓨터 비전 분야에서 학습 및 테스트에 일반적으로 사용됩니다.
데이터 세트 구조
CIFAR-10 데이터 세트는 다음과 같이 두 개의 하위 집합으로 나뉩니다.
- 학습 세트: 이 하위 집합은 머신 러닝 모델 학습에 사용되는 50,000개의 이미지를 포함합니다.
- 테스트 세트: 이 하위 집합은 훈련된 모델의 테스트 및 벤치마킹에 사용되는 10,000개의 이미지로 구성됩니다.
응용 분야
CIFAR-10 데이터 세트는 딥러닝 모델을 학습하고 이미지 분류 작업에서 평가하는 데 널리 사용됩니다. 여기에는 합성곱 신경망(CNN), Support Vector Machines(SVM) 및 기타 다양한 머신 러닝 알고리즘이 포함됩니다. 클래스 측면에서 데이터 세트의 다양성과 컬러 이미지의 존재는 머신 러닝 및 컴퓨터 비전 분야의 연구 개발에 적합한 데이터 세트입니다.
사용법
이미지 크기가 32x32인 CIFAR-10 데이터 세트에서 100 epoch 동안 YOLO 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 전체 인수 목록은 모델 Training 페이지를 참조하세요.
훈련 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
샘플 이미지 및 주석
CIFAR-10 데이터 세트에는 다양한 객체의 컬러 이미지가 포함되어 있어 이미지 분류 작업을 위한 잘 구성된 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 예시입니다.
이 예는 CIFAR-10 데이터 세트의 객체의 다양성과 복잡성을 보여주며, 강력한 이미지 분류 모델을 훈련하기 위한 다양한 데이터 세트의 중요성을 강조합니다.
인용 및 감사의 말씀
연구 또는 개발 작업에 CIFAR-10 데이터 세트를 사용하는 경우 다음 논문을 인용해 주세요:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
머신러닝 및 컴퓨터 비전 연구 커뮤니티에 귀중한 자료인 CIFAR-10 데이터 세트를 만들고 유지 관리해 주신 Alex Krizhevsky님께 감사의 말씀을 드립니다. CIFAR-10 데이터 세트와 제작자에 대한 자세한 내용은 CIFAR-10 데이터 세트 웹사이트를 방문하세요.
FAQ
CIFAR-10 데이터 세트에서 YOLO 모델을 어떻게 훈련할 수 있나요?
Ultralytics를 사용하여 CIFAR-10 데이터 세트에서 YOLO 모델을 학습하려면 python 및 CLI 모두에 대해 제공된 예제를 따를 수 있습니다. 다음은 32x32 픽셀의 이미지 크기로 모델을 100 epoch 동안 학습하는 기본 예제입니다.
예시
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
자세한 내용은 모델 학습 페이지를 참조하세요.
CIFAR-10 데이터 세트의 주요 특징은 무엇입니까?
CIFAR-10 데이터 세트는 10개의 클래스로 나뉜 60,000개의 컬러 이미지로 구성됩니다. 각 클래스는 6,000개의 이미지를 포함하며, 5,000개는 학습용이고 1,000개는 테스트용입니다. 이미지는 크기가 32x32 픽셀이며 다음 범주에 따라 다릅니다.
- 비행기
- 자동차
- 새
- 고양이
- 사슴
- 개
- 개구리
- 말
- 배
- 트럭
이 다양한 데이터 세트는 머신 러닝 및 컴퓨터 비전과 같은 분야에서 이미지 분류 모델을 훈련하는 데 필수적입니다. 자세한 내용은 데이터 세트 구조 및 응용 분야의 CIFAR-10 섹션을 참조하십시오.
이미지 분류 작업에 CIFAR-10 데이터 세트를 사용하는 이유는 무엇입니까?
CIFAR-10 데이터 세트는 다양성과 구조로 인해 이미지 분류를 위한 훌륭한 벤치마크입니다. 10개의 서로 다른 범주에 걸쳐 60,000개의 레이블이 지정된 이미지의 균형 잡힌 혼합이 포함되어 있어 강력하고 일반화된 모델을 훈련하는 데 도움이 됩니다. 컨볼루션 신경망(CNN) 및 기타 머신 러닝 알고리즘을 포함한 딥 러닝 모델을 평가하는 데 널리 사용됩니다. 데이터 세트는 비교적 작기 때문에 빠른 실험 및 알고리즘 개발에 적합합니다. 응용 분야 섹션에서 다양한 응용 프로그램을 살펴보십시오.
CIFAR-10 데이터 세트는 어떻게 구성되어 있습니까?
CIFAR-10 데이터 세트는 두 개의 주요 하위 집합으로 구성됩니다.
- 훈련 세트: 머신 러닝 모델을 훈련하는 데 사용되는 50,000개의 이미지가 포함되어 있습니다.
- 테스트 세트: 훈련된 모델을 테스트하고 벤치마킹하기 위한 10,000개의 이미지로 구성됩니다.
각 하위 집합은 10개의 클래스로 분류된 이미지로 구성되며, 해당 주석은 모델 훈련 및 평가에 즉시 사용할 수 있습니다. 자세한 내용은 데이터 세트 구조 섹션을 참조하십시오.
내 연구에서 CIFAR-10 데이터 세트를 어떻게 인용할 수 있습니까?
연구 또는 개발 프로젝트에서 CIFAR-10 데이터 세트를 사용하는 경우 다음 논문을 인용해야 합니다.
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
데이터 세트 제작자를 인정하는 것은 해당 분야의 지속적인 연구 및 개발을 지원하는 데 도움이 됩니다. 자세한 내용은 인용 및 감사의 말씀 섹션을 참조하십시오.
CIFAR-10 데이터 세트 사용의 실제 예는 무엇입니까?
CIFAR-10 데이터 세트는 일반적으로 합성곱 신경망(CNN) 및 Support Vector Machines(SVM)과 같은 이미지 분류 모델을 훈련하는 데 사용됩니다. 이러한 모델은 객체 감지, 이미지 인식 및 자동 태깅을 포함한 다양한 컴퓨터 비전 작업에 사용될 수 있습니다. 실제 예제를 보려면 사용 섹션의 코드 조각을 확인하십시오.