MNIST 데이터 세트
MNIST 데이터 세트는 잘란도의 기사 이미지 데이터베이스로, 60,000개의 예제로 구성된 훈련 세트와 10,000개의 예제로 구성된 테스트 세트로 구성되어 있습니다. 각 예제는 28x28 흑백 이미지로, 10개 클래스의 레이블과 연관되어 있습니다. MNIST 머신 러닝 알고리즘 벤치마킹을 위해 원래의 MNIST 데이터 세트를 직접 대체할 수 있도록 고안되었습니다.
참고: 수행 방법 이미지 분류 Ultralytics YOLO11 사용한 패션 MNIST 데이터 세트 분석
주요 기능
- MNIST 잘란도의 기사 이미지 중 60,000개의 트레이닝 이미지와 10,000개의 테스트 이미지가 포함되어 있습니다.
- 데이터 세트는 크기가 28x28픽셀인 회색조 이미지로 구성됩니다.
- 각 픽셀에는 해당 픽셀의 밝기 또는 어둡기를 나타내는 단일 픽셀 값이 연결되어 있으며, 숫자가 높을수록 더 어둡습니다. 이 픽셀 값은 0과 255 사이의 정수입니다.
- MNIST 머신러닝 분야, 특히 이미지 분류 작업의 훈련 및 테스트에 널리 사용됩니다.
데이터 세트 구조
MNIST 데이터 집합은 두 개의 하위 집합으로 나뉩니다:
- 학습 세트: 이 하위 집합은 머신 러닝 모델 학습에 사용되는 60,000개의 이미지를 포함합니다.
- 테스트 세트: 이 하위 집합은 훈련된 모델의 테스트 및 벤치마킹에 사용되는 10,000개의 이미지로 구성됩니다.
레이블
각 학습 및 테스트 예제는 다음 레이블 중 하나에 할당됩니다.
0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot
응용 분야
MNIST 데이터 세트는 컨볼루션 신경망 (CNN), 서포트 벡터 머신 (SVM) 및 기타 다양한 머신 러닝 알고리즘과 같은 이미지 분류 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 널리 사용됩니다. 데이터 세트의 형식이 간단하고 체계적이어서 머신 러닝 및 컴퓨터 비전 분야의 연구자와 실무자에게 필수적인 리소스입니다.
사용법
이미지 크기가 28x28인 100개의 에포크에 대한 MNIST 데이터 세트에 대해 CNN 모델을 훈련하려면 다음 코드 조각을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.
훈련 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28
샘플 이미지 및 주석
MNIST 데이터 세트에는 잘란도의 기사 이미지가 포함된 회색조 이미지가 포함되어 있어 이미지 분류 작업을 위한 잘 구조화된 데이터 세트를 제공합니다. 다음은 데이터 세트의 몇 가지 이미지 예시입니다:

이 예는 MNIST 데이터 세트에 포함된 이미지의 다양성과 복잡성을 보여주며, 강력한 이미지 분류 모델을 훈련하기 위해서는 다양한 데이터 세트가 중요하다는 것을 강조합니다.
감사의 말씀
연구 또는 개발 작업에 MNIST 데이터셋을 사용하는 경우, GitHub 리포지토리에 링크하여 데이터셋을 인정해 주세요. 이 데이터 세트는 잘란도 리서치에서 제공했습니다.
FAQ
MNIST 데이터 세트는 무엇이며, MNIST 어떻게 다른가요?
MNIST 데이터 세트는 잘란도의 기사 이미지 70,000개의 흑백 이미지 모음으로, 원래의 MNIST 데이터 세트를 현대적으로 대체하기 위한 것입니다. 이미지 분류 작업의 맥락에서 머신 러닝 모델의 벤치마크 역할을 합니다. 손으로 쓴 숫자가 포함된 MNIST 달리, MNIST 티셔츠/상의, 바지, 앵클부츠 등 10개의 패션 관련 클래스로 분류된 28x28픽셀 이미지로 구성되어 있습니다.
MNIST 데이터 세트에서 YOLO 모델을 훈련하려면 어떻게 해야 하나요?
MNIST 데이터 세트에 대해 Ultralytics YOLO 모델을 훈련하려면 Python CLI 명령을 모두 사용할 수 있습니다. 다음은 시작하는 데 도움이 되는 간단한 예제입니다:
훈련 예제
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo11n-cls.pt")
# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28
자세한 학습 파라미터는 학습 페이지를 참조하십시오.
머신 러닝 모델을 벤치마킹할 때 MNIST 데이터 세트를 사용해야 하는 이유는 무엇인가요?
MNIST 데이터 세트는 딥러닝 커뮤니티에서 MNIST 강력한 대안으로 널리 인정받고 있습니다. 더 복잡하고 다양한 이미지 세트를 제공하기 때문에 이미지 분류 모델을 벤치마킹하는 데 탁월한 선택입니다. 60,000개의 훈련 이미지와 10,000개의 테스트 이미지로 구성된 데이터 세트의 구조는 각각 10개의 클래스 중 하나로 레이블이 지정되어 있어 보다 까다로운 상황에서 다양한 머신 러닝 알고리즘의 성능을 평가하는 데 이상적입니다.
MNIST 같은 이미지 분류 작업에 Ultralytics YOLO 사용할 수 있나요?
예, Ultralytics YOLO 모델은 MNIST 데이터 세트와 관련된 작업을 포함해 이미지 분류 작업에 사용할 수 있습니다. 예를 들어 YOLO11 감지, 세분화, 분류와 같은 다양한 비전 작업을 지원합니다. 이미지 분류 작업을 시작하려면 분류 페이지를 참조하세요.
MNIST 데이터 세트의 주요 특징과 구조는 무엇인가요?
MNIST 데이터 세트는 60,000개의 훈련 이미지와 10,000개의 테스트 이미지의 두 가지 주요 하위 집합으로 나뉩니다. 각 이미지는 10개의 패션 관련 클래스 중 하나를 나타내는 28x28픽셀의 흑백 사진입니다. 단순하고 잘 구조화된 형식 덕분에 머신러닝 및 컴퓨터 비전 작업에서 모델을 훈련하고 평가하는 데 이상적입니다. 데이터 세트 구조에 대한 자세한 내용은 데이터 세트 구조 섹션을 참조하세요.
내 연구에서 MNIST 데이터 세트의 사용을 인정받으려면 어떻게 해야 하나요?
연구 또는 개발 프로젝트에서 MNIST 데이터셋을 활용하는 경우, GitHub 리포지토리에 링크하여 이를 인정하는 것이 중요합니다. 이렇게 하면 데이터 세트를 공개적으로 사용할 수 있도록 제공한 잘란도 리서치에 데이터 출처를 표시하는 데 도움이 됩니다.