ImageNet10 데이터세트
ImageNet10 데이터 세트는 Ultralytics에서 개발하고 CI 테스트, 건전성 검사 및 학습 파이프라인의 빠른 테스트를 위해 설계된 ImageNet 데이터베이스의 소규모 하위 세트입니다. 이 데이터 세트는 ImageNet의 처음 10개 클래스의 학습 세트에서 첫 번째 이미지와 유효성 검사 세트에서 첫 번째 이미지로 구성됩니다. 크기는 훨씬 작지만 원래 ImageNet 데이터 세트의 구조와 다양성을 유지합니다.
주요 기능
- ImageNet10은 ImageNet의 축소 버전으로, 원본 데이터세트의 처음 10개 클래스를 나타내는 20개의 이미지를 포함합니다.
- 이 데이터 세트는 전체 ImageNet 데이터 세트의 구조를 반영하여 WordNet 계층 구조에 따라 구성됩니다.
- CI 테스트, 건전성 검사 및 컴퓨터 비전 작업에서 훈련 파이프라인의 빠른 테스트에 이상적입니다.
- 모델 벤치마킹용으로 설계되지는 않았지만 모델의 기본 기능과 정확성을 빠르게 확인할 수 있습니다.
데이터 세트 구조
원본 ImageNet과 마찬가지로 ImageNet10 데이터 세트는 WordNet 계층 구조를 사용하여 구성됩니다. ImageNet10의 10개 클래스는 각각 동의어 모음인 synset으로 설명됩니다. ImageNet10의 이미지는 하나 이상의 synset으로 어노테이션 처리되어 다양한 객체와 그 관계를 인식하도록 모델을 테스트하기 위한 간결한 리소스를 제공합니다.
응용 분야
ImageNet10 데이터 세트는 컴퓨터 비전 모델 및 파이프라인을 신속하게 테스트하고 디버깅하는 데 유용합니다. 크기가 작기 때문에 빠른 반복이 가능하여 지속적인 통합 테스트 및 건전성 검사에 적합합니다. 또한 전체 ImageNet 데이터 세트를 사용한 본격적인 테스트로 넘어가기 전에 새로운 모델 또는 기존 모델 변경 사항에 대한 빠른 예비 테스트에도 사용할 수 있습니다.
사용법
이미지 크기가 224x224인 ImageNet10 데이터 세트에서 딥 러닝 모델을 테스트하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습 페이지를 참조하십시오.
테스트 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
샘플 이미지 및 주석
ImageNet10 데이터 세트는 원래 ImageNet 데이터 세트의 이미지 하위 집합을 포함합니다. 이러한 이미지는 데이터 세트의 처음 10개 클래스를 나타내도록 선택되어 빠른 테스트 및 평가를 위한 다양하면서도 컴팩트한 데이터 세트를 제공합니다.
이 예는 ImageNet10 데이터 세트의 이미지의 다양성과 복잡성을 보여주며, 건전성 검사와 컴퓨터 비전 모델의 빠른 테스트에 유용함을 강조합니다.
인용 및 감사의 말씀
ImageNet10 데이터 세트를 연구 또는 개발 작업에 사용하는 경우 원래 ImageNet 논문을 인용하십시오.
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
ImageNet 데이터 세트를 만들고 유지 관리해 주신 Olga Russakovsky, Jia Deng, Li Fei-Fei가 이끄는 ImageNet 팀에게 감사를 드립니다. ImageNet10 데이터 세트는 컴팩트한 하위 집합이지만 머신 러닝 및 컴퓨터 비전 연구 커뮤니티에서 빠른 테스트 및 디버깅을 위한 귀중한 리소스입니다. ImageNet 데이터 세트 및 제작자에 대한 자세한 내용은 ImageNet 웹사이트를 방문하십시오.
FAQ
ImageNet10 데이터 세트는 무엇이며, 전체 ImageNet 데이터 세트와 어떻게 다릅니까?
ImageNet10 데이터 세트는 Ultralytics에서 빠른 CI 테스트, 건전성 검사 및 학습 파이프라인 평가를 위해 만든 원래 ImageNet 데이터베이스의 소형 하위 세트입니다. ImageNet10은 ImageNet의 처음 10개 클래스의 학습 및 유효성 검사 세트에서 첫 번째 이미지를 나타내는 20개의 이미지만으로 구성됩니다. 작은 크기에도 불구하고 전체 데이터 세트의 구조와 다양성을 유지하므로 빠른 테스트에는 이상적이지만 모델 벤치마킹에는 적합하지 않습니다.
ImageNet10 데이터 세트를 사용하여 딥 러닝 모델을 어떻게 테스트할 수 있습니까?
이미지 크기가 224x224인 ImageNet10 데이터 세트에서 딥 러닝 모델을 테스트하려면 다음 코드 스니펫을 사용하십시오.
테스트 예제
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
사용 가능한 인수의 전체 목록은 Training 페이지를 참조하십시오.
CI 테스트 및 건전성 검사에 ImageNet10 데이터 세트를 사용해야 하는 이유는 무엇인가요?
ImageNet10 데이터 세트는 딥러닝 파이프라인에서 CI 테스트, 건전성 검사 및 빠른 평가를 위해 특별히 설계되었습니다. 작은 크기로 인해 빠른 반복 및 테스트가 가능하므로 속도가 중요한 지속적 통합 프로세스에 적합합니다. 원래 ImageNet 데이터 세트의 구조적 복잡성과 다양성을 유지함으로써 ImageNet10은 대규모 데이터 세트를 처리하는 오버헤드 없이 모델의 기본 기능과 정확성에 대한 신뢰할 수 있는 지표를 제공합니다.
ImageNet10 데이터 세트의 주요 특징은 무엇입니까?
ImageNet10 데이터 세트에는 다음과 같은 주요 기능이 있습니다.
- 컴팩트한 크기: 단 20개의 이미지만으로 빠른 테스트와 디버깅이 가능합니다.
- 구조화된 구성: 전체 ImageNet 데이터 세트와 유사하게 WordNet 계층 구조를 따릅니다.
- CI 및 Sanity Checks: 지속적인 통합 테스트 및 Sanity Checks에 이상적입니다.
- 벤치마킹용 아님: 빠른 모델 평가에는 유용하지만 광범위한 벤치마킹을 위해 설계되지는 않았습니다.
ImageNet10은 ImageNette와 같은 다른 작은 데이터 세트와 어떻게 비교되나요?
ImageNet10과 ImageNette는 모두 ImageNet의 하위 집합이지만 서로 다른 목적을 수행합니다. ImageNet10은 ImageNet의 처음 10개 클래스에서 20개의 이미지(클래스당 2개)만 포함하므로 CI 테스트 및 빠른 건전성 검사를 위해 매우 가볍습니다. 대조적으로 ImageNette는 10개의 쉽게 구별할 수 있는 클래스에 걸쳐 수천 개의 이미지를 포함하므로 실제 모델 훈련 및 개발에 더 적합합니다. ImageNet10은 파이프라인 기능 검증을 위해 설계되었고 ImageNette는 의미 있지만 전체 ImageNet보다 빠른 훈련 실험에 더 적합합니다.