ImageWoof 데이터 세트
ImageWoof 데이터 세트는 모두 개 품종이기 때문에 분류하기 어려운 10가지 클래스로 구성된 ImageNet의 하위 집합입니다. 이미지 분류 알고리즘이 풀기 어려운 과제로서, 고급 모델 개발을 장려하기 위해 만들어졌습니다.
주요 기능
- ImageWoof에는 10가지 견종의 이미지가 포함되어 있습니다: 호주 테리어, 보더 테리어, 사모예드, 비글, 시추, English 폭스하운드, 로디지안 리지백, 딩고, 골든 리트리버, 올드 English 시프도그입니다.
- 이 데이터 세트는 다양한 계산 능력과 연구 요구에 맞춰 다양한 해상도(전체 크기, 320픽셀, 160픽셀)의 이미지를 제공합니다.
- 또한 노이즈 레이블이 있는 버전도 포함되어 있어 레이블을 항상 신뢰할 수 없는 보다 현실적인 시나리오를 제공합니다.
데이터 세트 구조
ImageWoof 데이터 세트 구조는 개 품종 분류를 기반으로 하며, 각 품종마다 고유한 이미지 디렉토리가 있습니다. 다른 분류 데이터 세트와 마찬가지로, 훈련 및 검증 세트에 대한 별도의 폴더가 있는 분할 디렉터리 형식을 따릅니다.
애플리케이션
ImageWoof 데이터 세트는 이미지 분류 작업에서 딥 러닝 모델을 훈련하고 평가하는 데 널리 사용되며, 특히 더 복잡하고 유사한 클래스의 경우 더욱 그렇습니다. 이 데이터 세트의 도전 과제는 개 품종 간의 미묘한 차이로 인해 모델의 성능과 일반화의 한계를 뛰어넘는 것입니다. 특히 다음과 같은 경우에 유용합니다:
- 세분화된 카테고리에 대한 분류 모델 성능 벤치마킹
- 비슷해 보이는 클래스에 대한 모델 견고성 테스트
- 미묘한 시각적 차이를 구분할 수 있는 알고리즘 개발
- 일반 영역에서 특정 영역으로의 이전 학습 능력 평가하기
사용법
이미지 크기가 224x224인 100개의 에포크에 대해 ImageWoof 데이터 세트에서 CNN 모델을 훈련하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 훈련 페이지를 참조하세요.
열차 예시
데이터 집합 변형
ImageWoof 데이터 세트는 다양한 연구 요구와 계산 능력을 수용할 수 있도록 세 가지 크기로 제공됩니다:
-
전체 크기(이미지우프): 이미지우프 데이터 세트의 원본 버전입니다. 전체 크기 이미지가 포함되어 있으며 최종 교육 및 성능 벤치마킹에 이상적입니다.
-
중간 크기(imagewoof320): 이 버전에는 최대 가장자리 길이가 320픽셀이 되도록 크기가 조정된 이미지가 포함되어 있습니다. 모델 성능을 크게 저하시키지 않으면서 더 빠른 훈련에 적합합니다.
-
작은 크기(이미지 크기 160): 이 버전에는 최대 가장자리 길이가 160픽셀이 되도록 크기가 조정된 이미지가 포함되어 있습니다. 트레이닝 속도가 우선시되는 신속한 프로토타이핑 및 실험을 위해 설계되었습니다.
이러한 변형을 훈련에 사용하려면 데이터 세트 인수의 'imagewoof'를 'imagewoof320' 또는 'imagewoof160'으로 바꾸기만 하면 됩니다. 예를 들어
예
작은 이미지를 사용하면 분류 정확도 측면에서 성능이 저하될 수 있다는 점에 유의하세요. 하지만 모델 개발 및 프로토타이핑의 초기 단계에서 빠르게 반복할 수 있는 훌륭한 방법입니다.
샘플 이미지 및 주석
ImageWoof 데이터 세트에는 다양한 견종의 다채로운 이미지가 포함되어 있어 이미지 분류 작업을 위한 까다로운 데이터 세트를 제공합니다. 다음은 이 데이터 세트의 이미지 몇 가지 예시입니다:
이 예는 ImageWoof 데이터 세트의 다양한 견종 간의 미묘한 차이점과 유사점을 보여주며, 분류 작업의 복잡성과 난이도를 강조합니다.
인용 및 감사
연구 또는 개발 작업에 ImageWoof 데이터셋을 사용하는 경우, 공식 데이터셋 리포지토리로 링크하여 데이터셋의 제작자를 반드시 인정해 주세요.
머신 러닝 및 컴퓨터 비전 연구 커뮤니티를 위한 귀중한 리소스인 ImageWoof 데이터 세트를 만들고 유지 관리해 주신 FastAI 팀에 감사의 말씀을 전합니다. ImageWoof 데이터 세트에 대한 자세한 내용은 ImageWoof 데이터 세트 리포지토리를 참조하세요.
자주 묻는 질문
Ultralytics 의 ImageWoof 데이터 세트는 무엇인가요?
ImageWoof 데이터 세트는 10가지 특정 견종에 초점을 맞춘 ImageNet의 까다로운 하위 집합입니다. 이미지 분류 모델의 한계를 뛰어넘기 위해 만들어진 이 데이터 세트는 비글, 시추, 골든 리트리버와 같은 품종을 특징으로 합니다. 데이터 세트에는 다양한 해상도(전체 크기, 320px, 160px)의 이미지와 보다 사실적인 훈련 시나리오를 위한 노이즈 레이블까지 포함되어 있습니다. 이러한 복잡성 덕분에 ImageWoof는 고급 딥러닝 모델을 개발하는 데 이상적입니다.
ImageWoof 데이터 세트를 사용하여 모델을 훈련하려면 어떻게 해야 하나요 Ultralytics YOLO ?
이미지 크기 224x224의 100개 에포크에 대해 Ultralytics YOLO 을 사용하여 ImageWoof 데이터 세트에서 컨볼루션 신경망 (CNN) 모델을 훈련하려면 다음 코드를 사용할 수 있습니다:
열차 예시
사용 가능한 교육 인수에 대한 자세한 내용은 교육 페이지를 참조하세요.
어떤 버전의 ImageWoof 데이터세트를 사용할 수 있나요?
ImageWoof 데이터 세트는 세 가지 크기로 제공됩니다:
- 전체 크기(이미지): 전체 크기 이미지가 포함된 최종 교육 및 벤치마킹에 이상적입니다.
- 중간 크기(imagewoof320): 최대 가장자리 길이가 320픽셀인 크기 조정된 이미지로, 빠른 교육에 적합합니다.
- 작은 크기(imagewoof160): 최대 가장자리 길이가 160픽셀인 크기 조정된 이미지로, 신속한 프로토타입 제작에 적합합니다.
데이터 세트 인수의 'imagewoof'를 적절히 대체하여 이 버전을 사용하세요. 그러나 이미지 크기가 작을수록 분류 정확도가 낮아질 수 있지만 더 빠른 반복에는 유용할 수 있습니다.
ImageWoof 데이터 세트의 노이즈가 있는 레이블이 학습에 어떤 도움이 되나요?
ImageWoof 데이터 세트의 노이즈가 있는 라벨은 라벨이 항상 정확하지 않을 수 있는 실제 상황을 시뮬레이션합니다. 이 데이터로 모델을 훈련하면 이미지 분류 작업의 견고성과 일반화를 개발하는 데 도움이 됩니다. 이를 통해 실제 애플리케이션에서 자주 발생하는 모호하거나 잘못 레이블이 지정된 데이터를 효과적으로 처리할 수 있도록 모델을 준비할 수 있습니다.
ImageWoof 데이터 세트 사용의 주요 과제는 무엇인가요?
ImageWoof 데이터 세트의 주요 과제는 포함된 개 품종 간의 미묘한 차이에 있습니다. 서로 밀접하게 관련된 10가지 품종에 초점을 맞추기 때문에 이들을 구별하려면 보다 고급의 세밀한 이미지 분류 모델이 필요합니다. 따라서 ImageWoof는 딥러닝 모델의 기능과 개선 사항을 테스트할 수 있는 훌륭한 벤치마크입니다.