콘텐츠로 건너뛰기

ImageWoof 데이터세트

ImageWoof 데이터 세트는 모두 개 품종이므로 분류하기 어려운 10개의 클래스로 구성된 ImageNet의 하위 집합입니다. 보다 발전된 모델 개발을 장려하기 위해 이미지 분류 알고리즘이 해결해야 할 더 어려운 작업으로 만들어졌습니다.

주요 기능

  • ImageWoof는 오스트레일리안 테리어, 보더 테리어, 사모예드, 비글, 시추, 잉글리시 폭스하운드, 로디지안 리지백, 딩고, 골든 리트리버, 올드 잉글리시 쉽독의 10가지 다른 견종의 이미지를 포함합니다.
  • 이 데이터 세트는 다양한 해상도(전체 크기, 320px, 160px)의 이미지를 제공하여 다양한 계산 능력 및 연구 요구 사항을 충족합니다.
  • 또한 레이블이 항상 신뢰할 수 없는 보다 현실적인 시나리오를 제공하기 위해 노이즈 레이블이 있는 버전도 포함되어 있습니다.

데이터 세트 구조

ImageWoof 데이터 세트 구조는 견종 클래스를 기반으로 하며, 각 품종에는 자체 이미지 디렉터리가 있습니다. 다른 분류 데이터 세트와 마찬가지로 훈련 및 검증 세트에 대한 별도의 폴더가 있는 분할 디렉터리 형식을 따릅니다.

응용 분야

ImageWoof 데이터 세트는 이미지 분류 작업에서 딥러닝 모델을 훈련하고 평가하는 데 널리 사용되며, 특히 더 복잡하고 유사한 클래스의 경우에 그렇습니다. 이 데이터 세트의 과제는 견종 간의 미묘한 차이에 있으며, 모델의 성능과 일반화의 한계를 뛰어넘습니다. 특히 다음과 같은 경우에 유용합니다.

  • 세분화된 범주에서 분류 모델 성능 벤치마킹
  • 유사하게 보이는 클래스에 대한 모델의 견고성 테스트
  • 미묘한 시각적 차이를 구별할 수 있는 알고리즘 개발
  • 일반 도메인에서 특정 도메인으로의 전이 학습 능력을 평가합니다.

사용법

224x224 이미지 크기로 ImageWoof 데이터 세트에서 CNN 모델을 100 epochs 동안 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 포괄적인 목록은 모델 Training 페이지를 참조하십시오.

훈련 예제

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

데이터 세트 변형

ImageWoof 데이터세트는 다양한 연구 요구 사항 및 계산 능력을 수용하기 위해 세 가지 다른 크기로 제공됩니다.

  1. 전체 크기 (imagewoof): ImageWoof 데이터 세트의 원본 버전입니다. 전체 크기 이미지를 포함하고 있어 최종 학습 및 성능 벤치마킹에 적합합니다.

  2. 중간 크기 (imagewoof320): 이 버전은 최대 가장자리 길이가 320 픽셀이 되도록 크기가 조정된 이미지를 포함합니다. 모델 성능을 크게 저하시키지 않으면서 더 빠른 학습에 적합합니다.

  3. 작은 크기 (imagewoof160): 이 버전은 최대 가장자리 길이가 160 픽셀이 되도록 크기가 조정된 이미지를 포함합니다. 학습 속도가 우선시되는 빠른 프로토타입 제작 및 실험을 위해 설계되었습니다.

학습 시 이러한 변형을 사용하려면 데이터 세트 인수의 'imagewoof'를 'imagewoof320' 또는 'imagewoof160'으로 바꾸기만 하면 됩니다. 예를 들어 다음과 같습니다.

예시

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

더 작은 이미지를 사용하면 분류 정확도 측면에서 성능이 낮아질 수 있다는 점에 유의해야 합니다. 하지만 모델 개발 및 프로토타입 제작 초기 단계에서 빠르게 반복하는 데 유용합니다.

샘플 이미지 및 주석

ImageWoof 데이터 세트는 다양한 견종의 다채로운 이미지를 포함하고 있어 이미지 분류 작업에 대한 도전적인 데이터 세트를 제공합니다. 다음은 데이터 세트의 이미지 예시입니다.

데이터 세트 샘플 이미지

이 예는 ImageWoof 데이터 세트에서 다양한 견종 간의 미묘한 차이점과 유사점을 보여주며, 분류 작업의 복잡성과 어려움을 강조합니다.

인용 및 감사의 말씀

연구 또는 개발 작업에 ImageWoof 데이터 세트를 사용하는 경우 공식 데이터 세트 저장소 링크를 통해 데이터 세트 제작자를 반드시 언급해 주시기 바랍니다.

머신 러닝컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스로서 ImageWoof 데이터 세트를 만들고 유지 관리해 주신 FastAI 팀에게 감사를 드립니다. ImageWoof 데이터 세트에 대한 자세한 내용은 ImageWoof 데이터 세트 리포지토리를 방문하십시오.

FAQ

Ultralytics의 ImageWoof 데이터 세트는 무엇입니까?

ImageWoof 데이터 세트는 10개의 특정 개 품종에 초점을 맞춘 ImageNet의 까다로운 하위 세트입니다. 이미지 분류 모델의 한계를 뛰어넘기 위해 만들어졌으며 비글, 시추 및 골든 리트리버와 같은 품종을 특징으로 합니다. 이 데이터 세트에는 다양한 해상도(전체 크기, 320px, 160px)의 이미지와 보다 현실적인 학습 시나리오를 위한 노이즈 레이블까지 포함되어 있습니다. 이러한 복잡성으로 인해 ImageWoof는 보다 고급 딥 러닝 모델을 개발하는 데 이상적입니다.

Ultralytics YOLO를 사용하여 ImageWoof 데이터 세트로 모델을 어떻게 훈련할 수 있습니까?

Ultralytics YOLO를 사용하여 224x224 이미지 크기로 ImageWoof 데이터 세트에서 Convolutional Neural Network(CNN) 모델을 100 epoch 동안 학습하려면 다음 코드를 사용할 수 있습니다.

훈련 예제

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

사용 가능한 학습 인수에 대한 자세한 내용은 학습 페이지를 참조하십시오.

ImageWoof 데이터 세트의 어떤 버전이 사용 가능한가요?

ImageWoof 데이터 세트는 세 가지 크기로 제공됩니다.

  1. 전체 크기(imagewoof): 최종 훈련 및 벤치마킹에 이상적이며, 전체 크기 이미지를 포함합니다.
  2. 중간 크기 (imagewoof320): 최대 가장자리 길이가 320 픽셀로 조정된 이미지로, 더 빠른 학습에 적합합니다.
  3. 작은 크기(imagewoof160): 최대 가장자리 길이가 160픽셀인 크기가 조정된 이미지로, 빠른 프로토타입 제작에 적합합니다.

데이터 세트 인수에 'imagewoof'를 적절히 대체하여 이러한 버전을 사용하십시오. 단, 이미지가 작을수록 분류 정확도가 낮아질 수 있지만 빠른 반복에 유용할 수 있습니다.

ImageWoof 데이터 세트의 노이즈 레이블이 학습에 어떤 이점을 제공하나요?

ImageWoof 데이터 세트의 노이즈 레이블은 레이블이 항상 정확하지 않을 수 있는 실제 조건을 시뮬레이션합니다. 이 데이터로 모델을 훈련하면 이미지 분류 작업에서 견고성과 일반화를 개발하는 데 도움이 됩니다. 이는 모델이 실제 응용 프로그램에서 자주 발생하는 모호하거나 잘못 레이블이 지정된 데이터를 효과적으로 처리할 수 있도록 준비합니다.

ImageWoof 데이터 세트를 사용할 때의 주요 과제는 무엇인가요?

ImageWoof 데이터 세트의 주요 과제는 포함된 견종 간의 미묘한 차이에 있습니다. 10개의 밀접하게 관련된 품종에 초점을 맞추고 있기 때문에 이들을 구별하려면 더욱 발전되고 세밀하게 조정된 이미지 분류 모델이 필요합니다. 따라서 ImageWoof는 딥러닝 모델의 성능과 개선 사항을 테스트하기에 훌륭한 벤치마크입니다.



📅 1년 전에 생성됨 ✏️ 5개월 전에 업데이트됨

댓글