Link to this sectionImageNet 데이터셋#

Name: ImageNet 이미지 분류 데이터셋
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, 이미지 분류, 딥러닝, 컴퓨터 비전, 사전 학습 모델, YOLO, 데이터셋, WordNet

The Ultralytics ImageNet dataset (data="imagenet") is the ImageNet-1k / ILSVRC-2012 subset used to train and benchmark image classification models. It contains 1,000 object classes with 1,281,167 training images and 50,000 validation images at a 224x224 image size, and downloads to roughly 144 GB of data. The broader ImageNet database is far larger — over 14 million high-resolution images annotated with WordNet synsets across more than 20,000 categories — but Ultralytics trains on the standardized 1,000-class ILSVRC subset that became the de-facto benchmark for deep learning in computer vision.

Link to this sectionImageNet 사전 학습 모델#

모델	크기 ^(픽셀)	acc ^top1	acc ^top5	속도 ^{CPU ONNX (ms)}	속도 ^{T4 TensorRT10 (ms)}	파라미터 ^(M)	FLOPs ^{(B) at 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this section주요 특징#

Ultralytics imagenet 데이터셋은 이미지 분류를 위한 표준 사전 학습 벤치마크인 1,000개의 클래스(1,281,167개의 학습 이미지 및 50,000개의 검증 이미지, ILSVRC-2012 기준)를 제공합니다.
클래스는 WordNet 계층 구조에 따라 구성되며, 각 클래스는 synset(동의어 집합)에 해당합니다.
이미지는 224x224 크기로 학습되며, 전체 데이터셋은 약 144 GB에 달하는 대용량 다운로드입니다.
연례 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)는 컴퓨터 비전 연구를 발전시키는 데 중요한 역할을 해왔습니다.

Link to this section데이터셋 구조#

Ultralytics ImageNet 데이터셋은 ILSVRC-2012 분할을 사용합니다:

Split	이미지	클래스
학습(Train)	1,281,167	1,000
검증	50,000	1,000

이미지는 WordNet synset ID(예: n01440764)로 명명된 클래스별 폴더에 저장되며, 이는 Ultralytics 분류 학습이 요구하는 레이아웃입니다. 1,000개의 각 클래스는 WordNet synset에 매핑되며 별도의 테스트 분할이 없으므로, 정확도를 측정하기 위해 50,000개의 이미지로 구성된 검증 세트를 사용합니다.

다운로드 크기

ImageNet-1k는 약 144 GB를 다운로드해야 하므로 학습 전에 충분한 디스크 공간이 있는지 확인하십시오. 빠른 실험을 원하시면 동일한 폴더 형식을 사용하면서 훨씬 짧은 시간에 학습이 가능한 ImageNette 및 ImageNet10 하위 집합을 사용하십시오.

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

매년 개최되는 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)는 연구자들이 일관된 평가 지표를 갖춘 대규모 표준화 데이터셋에서 알고리즘을 벤치마킹할 수 있도록 합니다. 이는 이미지 분류, 객체 탐지 및 기타 비전 작업을 위한 딥러닝의 주요 발전을 이끌었으며, 특히 현대 딥러닝 시대의 시작을 알린 AlexNet의 2012년 우승 사례가 유명합니다.

Link to this section응용 분야#

ImageNet 데이터셋은 이미지 분류, 객체 탐지 및 객체 위치 파악을 위한 딥러닝 모델을 학습하고 평가하는 데 널리 사용됩니다. AlexNet, VGG, ResNet과 같은 기념비적인 아키텍처들은 모두 ImageNet에서 개발 및 벤치마킹되었으며, ImageNet으로 사전 학습된 가중치는 다양한 비전 작업에서 전이 학습을 위한 일반적인 시작점으로 사용됩니다.

Link to this section사용법#

224x224 이미지 크기로 100 에포크 동안 ImageNet에서 YOLO 분류 모델을 학습하려면 아래의 코드 스니펫을 사용하십시오. 사용 가능한 인자에 대한 전체 목록은 모델 학습 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Ultralytics Platform을 사용하면 분류 데이터셋을 관리하고 클라우드에서 학습을 실행할 수 있습니다.

Link to this section샘플 이미지 및 주석#

ImageNet 데이터셋은 1,000개의 ILSVRC-2012 클래스를 포괄하며, 컴퓨터 비전 모델을 학습하고 평가하기 위한 다양하고 방대한 리소스를 제공합니다. 데이터셋의 이미지 예시는 다음과 같습니다:

ImageNet 분류 데이터셋 샘플 이미지

Link to this section인용 및 감사의 글#

연구 또는 개발 작업에 ImageNet 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오.

인용

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

머신러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 소중한 자원으로서 ImageNet 데이터셋을 구축하고 유지 관리하는 Olga Russakovsky, Jia Deng, Li Fei-Fei가 이끄는 ImageNet 팀에 감사드립니다. ImageNet 데이터셋과 제작자에 대한 자세한 내용은 ImageNet 웹사이트를 방문하십시오.

Link to this sectionFAQ#

Link to this sectionImageNet 데이터셋이란 무엇이며 컴퓨터 비전에서 어떻게 사용되나요?#

ImageNet 데이터셋은 더 광범위한 컬렉션에 WordNet synset으로 주석이 달린 1,400만 장 이상의 고해상도 이미지를 보유한 대규모 이미지 데이터베이스입니다. Ultralytics에서 data="imagenet"은 이미지 분류 사전 학습의 사실상 표준 벤치마크인 1,000개 클래스의 ILSVRC-2012 하위 집합을 사용합니다. AlexNet, VGG, ResNet과 같은 기념비적인 모델들이 ImageNet에서 학습 및 벤치마킹되었으며, 이는 컴퓨터 비전 발전에 있어 이 데이터셋의 역할을 강조합니다.

Link to this sectionImageNet 데이터셋에는 몇 개의 클래스와 이미지가 포함되어 있습니까?#

Ultralytics imagenet 데이터셋은 1,000개의 클래스, 1,281,167개의 학습 이미지, 50,000개의 검증 이미지(224x224 크기)로 구성된 ILSVRC-2012 하위 집합을 사용하며, 총 다운로드 크기는 약 144 GB입니다. 전체 ImageNet 데이터베이스는 훨씬 더 크지만(20,000개 이상의 WordNet synset에 걸쳐 1,400만 장 이상의 이미지 포함), 분류 학습 및 벤치마킹에는 1,000개 클래스의 하위 집합이 사용됩니다.

Link to this sectionImageNet 데이터셋에서 이미지 분류를 위해 YOLO 모델을 어떻게 학습할 수 있습니까?#

Ultralytics YOLO 모델을 ImageNet에서 학습하려면 사전 학습된 분류 모델을 로드하고 data를 imagenet으로 지정하십시오:

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

더 자세한 학습 지침은 학습(Training) 페이지를 참조하십시오.

Link to this section내 ImageNet 데이터셋 프로젝트에 Ultralytics YOLO26 사전 학습 모델을 사용해야 하는 이유는 무엇인가요?#

Ultralytics YOLO26 사전 학습 모델은 다양한 컴퓨터 비전 작업에서 속도와 정확도 측면에서 최첨단 성능을 제공합니다. 예를 들어, Top-1 정확도 71.4%, Top-5 정확도 90.1%를 기록하는 YOLO26n-cls 모델은 실시간 애플리케이션에 최적화되어 있습니다. 사전 학습된 모델은 처음부터 학습하는 데 필요한 컴퓨팅 자원을 줄이고 개발 주기를 가속화합니다. YOLO26 모델의 성능 지표에 대한 자세한 내용은 ImageNet 사전 학습 모델 섹션에서 확인하십시오.

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)는 컴퓨터 비전에서 어떤 역할을 하나요?#

매년 개최되는 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)는 대규모 표준화 데이터셋에서 알고리즘을 평가하기 위한 경쟁 플랫폼을 제공함으로써 컴퓨터 비전의 발전을 견인했습니다. 일관된 평가 지표는 이미지 분류, 객체 탐지, 이미지 세그멘테이션 분야의 혁신을 촉진하며 딥러닝과 컴퓨터 비전의 경계를 지속적으로 확장해 왔습니다.

기여자

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

생성됨 2023년 11월 12일업데이트됨 그저께