ImageWoof 데이터셋

ImageWoof 데이터셋은 ImageNet의 하위 집합으로, 분류하기 까다로운 10가지 개 품종으로 구성되어 있습니다. 이 데이터셋은 더 발전된 모델의 개발을 장려하기 위해 이미지 분류 알고리즘이 해결해야 할 더 어려운 작업으로서 생성되었습니다.

주요 특징

  • ImageWoof에는 오스트레일리안 테리어, 보더 테리어, 사모예드, 비글, 시추, 잉글리시 폭스하운드, 로디지안 리지백, 딩고, 골든 리트리버, 올드 잉글리시 쉽독 등 10가지 다른 개 품종의 이미지가 포함되어 있습니다.
  • 이 데이터셋은 다양한 해상도(전체 크기, 320px, 160px)로 이미지를 제공하여 다양한 컴퓨팅 기능과 연구 요구 사항을 수용합니다.
  • 또한 레이블이 항상 신뢰할 수 있는 것은 아닌 보다 현실적인 시나리오를 제공하는 노이즈 레이블 버전도 포함되어 있습니다.

데이터셋 구조

ImageWoof 데이터셋 구조는 개 품종 클래스를 기반으로 하며, 각 품종은 고유한 이미지 디렉토리를 가집니다. 다른 분류 데이터셋과 마찬가지로 학습 및 검증 세트를 위한 별도의 폴더가 있는 분할 디렉토리 형식을 따릅니다.

응용 분야

ImageWoof 데이터셋은 이미지 분류 작업에서 딥러닝 모델을 학습하고 평가하는 데 널리 사용되며, 특히 더 복잡하고 유사한 클래스를 다룰 때 유용합니다. 이 데이터셋의 도전 과제는 개 품종 간의 미묘한 차이에 있으며, 이는 모델 성능과 일반화의 한계를 시험합니다. 특히 다음과 같은 경우에 유용합니다:

  • 미세 카테고리(fine-grained)에 대한 분류 모델 성능 벤치마킹
  • 유사해 보이는 클래스에 대한 모델 견고성 테스트
  • 미묘한 시각적 차이를 구별할 수 있는 알고리즘 개발
  • 일반 도메인에서 특정 도메인으로의 전이 학습 역량 평가

사용법

224x224 이미지 크기로 100 에포크 동안 ImageWoof 데이터셋에서 CNN 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 포괄적인 목록은 모델 학습 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

데이터셋 변형

ImageWoof 데이터셋은 다양한 연구 요구 사항과 컴퓨팅 성능을 수용하기 위해 세 가지 크기로 제공됩니다:

  1. 전체 크기(imagewoof): ImageWoof 데이터셋의 원본 버전입니다. 전체 크기 이미지가 포함되어 있어 최종 학습 및 성능 벤치마킹에 이상적입니다.

  2. 중간 크기(imagewoof320): 최대 가장자리 길이가 320픽셀이 되도록 크기가 조정된 이미지가 포함된 버전입니다. 모델 성능을 크게 저하시키지 않으면서 더 빠른 학습을 수행하기에 적합합니다.

  3. 작은 크기(imagewoof160): 최대 가장자리 길이가 160픽셀이 되도록 크기가 조정된 이미지가 포함된 버전입니다. 학습 속도가 우선인 빠른 프로토타이핑 및 실험을 위해 설계되었습니다.

학습에 이러한 변형을 사용하려면 데이터셋 인수에서 'imagewoof'를 'imagewoof320' 또는 'imagewoof160'으로 바꾸기만 하면 됩니다. 예시:

예시
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

더 작은 이미지를 사용하면 분류 정확도 측면에서 성능이 낮아질 수 있다는 점을 유의해야 합니다. 하지만 모델 개발 및 프로토타이핑 초기 단계에서 빠르게 반복하기에는 훌륭한 방법입니다.

샘플 이미지 및 주석

ImageWoof 데이터셋은 다양한 개 품종의 컬러 이미지를 포함하고 있어 이미지 분류 작업에 도전적인 데이터셋입니다. 다음은 데이터셋 이미지의 몇 가지 예입니다:

ImageWoof 개 품종 분류 데이터셋 샘플

이 예제는 ImageWoof 데이터셋 내 서로 다른 개 품종 간의 미묘한 차이와 유사점을 보여주며, 분류 작업의 복잡성과 난이도를 강조합니다.

인용 및 감사의 글

연구 또는 개발 작업에서 ImageWoof 데이터셋을 사용하는 경우, 공식 데이터셋 저장소에 링크를 걸어 데이터셋 제작자에게 공로를 인정해 주시기 바랍니다.

We would like to acknowledge the FastAI team for creating and maintaining the ImageWoof dataset as a valuable resource for the machine learning and computer vision research community. For more information about the ImageWoof dataset, visit the ImageWoof dataset repository.

FAQ

Ultralytics에서 ImageWoof 데이터셋이란 무엇입니까?

ImageWoof 데이터셋은 10가지 특정 개 품종에 초점을 맞춘 ImageNet의 까다로운 하위 집합입니다. 이미지 분류 모델의 한계를 시험하기 위해 생성되었으며 비글, 시추, 골든 리트리버와 같은 품종을 포함합니다. 이 데이터셋은 다양한 해상도(전체 크기, 320px, 160px)의 이미지와 보다 현실적인 학습 시나리오를 위한 노이즈 레이블까지 포함합니다. 이러한 복잡성 덕분에 ImageWoof는 더 발전된 딥러닝 모델을 개발하는 데 이상적입니다.

Ultralytics YOLO를 사용하여 ImageWoof 데이터셋으로 모델을 학습하려면 어떻게 해야 합니까?

Ultralytics YOLO를 사용하여 ImageWoof 데이터셋에서 합성곱 신경망(CNN) 모델을 224x224 이미지 크기로 100 에포크 동안 학습하려면 다음 코드를 사용할 수 있습니다:

학습 예제
from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

사용 가능한 학습 인수에 대한 자세한 내용은 학습 페이지를 참조하십시오.

ImageWoof 데이터셋의 어떤 버전을 사용할 수 있습니까?

ImageWoof 데이터셋은 세 가지 크기로 제공됩니다:

  1. 전체 크기(imagewoof): 전체 크기 이미지를 포함하며 최종 학습 및 벤치마킹에 이상적입니다.
  2. 중간 크기(imagewoof320): 최대 가장자리 길이가 320픽셀인 크기 조정된 이미지로, 더 빠른 학습에 적합합니다.
  3. 작은 크기(imagewoof160): 최대 가장자리 길이가 160픽셀인 크기 조정된 이미지로, 빠른 프로토타이핑에 완벽합니다.

데이터셋 인수에서 'imagewoof'를 적절히 교체하여 이러한 버전을 사용하십시오. 단, 더 작은 이미지는 분류 정확도가 낮아질 수 있지만 더 빠른 반복에는 유용할 수 있습니다.

ImageWoof 데이터셋의 노이즈 레이블은 학습에 어떤 이점을 줍니까?

ImageWoof 데이터셋의 노이즈 레이블은 레이블이 항상 정확하지 않을 수 있는 실제 상황을 시뮬레이션합니다. 이 데이터로 모델을 학습하면 이미지 분류 작업에서 견고성과 일반화 능력을 개발하는 데 도움이 됩니다. 이는 모델이 실제 응용 분야에서 흔히 접하는 모호하거나 잘못 레이블이 지정된 데이터를 효과적으로 처리하도록 준비시킵니다.

ImageWoof 데이터셋 사용의 주요 과제는 무엇입니까?

ImageWoof 데이터셋의 주요 과제는 포함된 개 품종 간의 미묘한 차이에 있습니다. 밀접하게 관련된 10가지 품종에 초점을 맞추고 있기 때문에 이를 구별하려면 더 발전되고 미세 조정된 이미지 분류 모델이 필요합니다. 따라서 ImageWoof는 딥러닝 모델의 성능과 개선 사항을 테스트하는 훌륭한 벤치마크가 됩니다.

댓글