ImageNet10 데이터셋

The ImageNet10 dataset is a small-scale subset of the ImageNet database, developed by Ultralytics and designed for CI tests, sanity checks, and fast testing of training pipelines. This dataset is composed of the first image in the training set and the first image from the validation set of the first 10 classes in ImageNet. Although significantly smaller, it retains the structure and diversity of the original ImageNet dataset.

주요 특징

  • ImageNet10은 ImageNet의 압축 버전이며, 원본 데이터셋의 상위 10개 클래스를 대표하는 20개의 이미지로 구성되어 있습니다.
  • 이 데이터셋은 WordNet 계층 구조에 따라 구성되어 있으며, 전체 ImageNet 데이터셋의 구조를 반영합니다.
  • 이 데이터셋은 computer vision 작업에서 CI 테스트, 정상 작동 확인 및 학습 파이프라인의 신속한 테스트에 이상적입니다.
  • 모델 벤치마킹을 위해 설계된 것은 아니지만, 모델의 기본적인 기능과 정확성을 빠르게 확인하는 용도로 활용할 수 있습니다.

데이터셋 구조

ImageNet10 데이터셋은 원본 ImageNet과 마찬가지로 WordNet 계층 구조를 사용하여 구성됩니다. ImageNet10의 10개 클래스는 각각 신셋(synset, 동의어 집합)으로 설명됩니다. ImageNet10의 이미지들은 하나 이상의 신셋으로 주석 처리되어 있으며, 다양한 객체와 그 관계를 인식하도록 모델을 테스트하는 데 유용한 압축된 자원을 제공합니다.

응용 분야

ImageNet10 데이터셋은 컴퓨터 비전 모델 및 파이프라인을 빠르게 테스트하고 디버깅하는 데 유용합니다. 작은 크기 덕분에 신속한 반복 작업이 가능하여 continuous integration 테스트 및 정상 작동 확인에 이상적입니다. 또한, 전체 ImageNet 데이터셋을 사용한 본격적인 테스트를 진행하기 전에 새로운 모델이나 기존 모델의 변경 사항을 빠르게 예비 테스트하는 용도로도 사용할 수 있습니다.

사용법

224x224 이미지 크기로 ImageNet10 데이터셋에서 딥러닝 모델을 테스트하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 자세한 목록은 모델 Training 페이지를 참조하십시오.

테스트 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

샘플 이미지 및 주석

ImageNet10 데이터셋은 원본 ImageNet 데이터셋의 이미지 하위 집합을 포함하고 있습니다. 이 이미지들은 데이터셋의 상위 10개 클래스를 나타내도록 선택되었으며, 빠른 테스트 및 평가를 위한 다양하면서도 압축된 데이터셋을 제공합니다.

ImageNet-10 분류 데이터셋 샘플 이미지

이 예제는 ImageNet10 데이터셋에 포함된 이미지의 다양성과 복잡성을 보여주며, 컴퓨터 비전 모델의 정상 작동 확인 및 빠른 테스트에 대한 유용성을 강조합니다.

인용 및 감사의 글

연구 또는 개발 작업에 ImageNet10 데이터셋을 사용하는 경우, 원본 ImageNet 논문을 인용해 주십시오:

인용
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Olga Russakovsky, Jia Deng, Li Fei-Fei가 이끄는 ImageNet 팀이 ImageNet 데이터셋을 구축하고 유지 관리하는 노고에 감사를 표합니다. ImageNet10 데이터셋은 비록 압축된 하위 집합이지만, machine learning 및 컴퓨터 비전 연구 커뮤니티에서 빠른 테스트와 디버깅을 위한 귀중한 자원입니다. ImageNet 데이터셋과 그 제작자에 대한 자세한 내용은 ImageNet 웹사이트를 방문하십시오.

FAQ

ImageNet10 데이터셋이란 무엇이며 전체 ImageNet 데이터셋과 어떻게 다릅니까?

ImageNet10 데이터셋은 신속한 CI 테스트, 정상 작동 확인 및 학습 파이프라인 평가를 위해 Ultralytics에서 생성한 원본 ImageNet 데이터베이스의 압축된 하위 집합입니다. ImageNet10은 ImageNet의 상위 10개 클래스에 대한 학습 및 검증 세트의 첫 번째 이미지만을 나타내는 20개의 이미지로 구성됩니다. 크기는 작지만 전체 데이터셋의 구조와 다양성을 유지하고 있어, 모델 벤치마킹이 아닌 빠른 테스트에 이상적입니다.

ImageNet10 데이터셋을 사용하여 딥러닝 모델을 테스트하려면 어떻게 해야 합니까?

224x224 이미지 크기로 ImageNet10 데이터셋에서 딥러닝 모델을 테스트하려면 다음 코드 스니펫을 사용하십시오.

테스트 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

사용 가능한 인수에 대한 전체 목록은 학습(Training) 페이지를 참조하십시오.

CI 테스트와 정상 작동 확인을 위해 왜 ImageNet10 데이터셋을 사용해야 합니까?

ImageNet10 데이터셋은 deep learning 파이프라인의 CI 테스트, 정상 작동 확인 및 신속한 평가를 위해 특별히 설계되었습니다. 작은 크기 덕분에 반복 테스트가 빠르며, 속도가 중요한 지속적 통합(continuous integration) 프로세스에 적합합니다. ImageNet10은 원본 ImageNet 데이터셋의 구조적 복잡성과 다양성을 유지함으로써, 대규모 데이터셋을 처리하는 오버헤드 없이 모델의 기본 기능과 정확성을 신뢰성 있게 확인할 수 있습니다.

ImageNet10 데이터셋의 주요 특징은 무엇입니까?

ImageNet10 데이터셋에는 다음과 같은 몇 가지 주요 특징이 있습니다:

  • 압축된 크기: 20개의 이미지만으로 구성되어 있어 빠른 테스트와 디버깅이 가능합니다.
  • 구조화된 구성: 전체 ImageNet 데이터셋과 유사하게 WordNet 계층 구조를 따릅니다.
  • CI 및 정상 작동 확인: 지속적 통합 테스트와 정상 작동 확인에 이상적입니다.
  • 벤치마킹 용도 아님: 빠른 모델 평가에는 유용하지만, 광범위한 벤치마킹을 위해 설계된 것은 아닙니다.

ImageNet10은 ImageNette와 같은 다른 소규모 데이터셋과 비교하면 어떻습니까?

ImageNet10ImageNette은 모두 ImageNet의 하위 집합이지만, 각각 목적이 다릅니다. ImageNet10은 ImageNet의 상위 10개 클래스에서 각 2개씩, 총 20개의 이미지만 포함하고 있어 CI 테스트와 빠른 정상 작동 확인에 매우 가볍게 활용됩니다. 반면, ImageNette는 10개의 쉽게 구분되는 클래스에 걸쳐 수천 개의 이미지를 포함하고 있어 실제 모델 학습 및 개발에 더 적합합니다. ImageNet10은 파이프라인 기능 검증을 위해 설계되었으며, ImageNette는 전체 ImageNet보다 더 빠르면서도 의미 있는 학습 실험에 더 적합합니다.

댓글