데이터 세트 개요
Ultralytics 는 감지, 인스턴스 분할, 포즈 추정, 분류 및 다중 객체 추적과 같은 컴퓨터 비전 작업을 용이하게 하기 위해 다양한 데이터 세트를 지원합니다. 아래는 주요 Ultralytics 데이터 세트 목록과 각 컴퓨터 비전 작업 및 해당 데이터 세트에 대한 요약입니다.
Watch: Ultralytics 데이터 세트 개요
물체 감지
경계 상자 객체 감지는 각 객체 주위에 경계 상자를 그려 이미지에서 객체를 감지하고 위치를 파악하는 컴퓨터 비전 기법입니다.
- Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- COCO: 컨텍스트 내 공통 개체(COCO)는 80개의 개체 범주로 구성된 대규모 개체 감지, 세분화 및 캡션 데이터 세트입니다.
- LVIS: 1203개의 객체 카테고리가 포함된 대규모 객체 감지, 세분화 및 캡션 데이터 세트입니다.
- COCO8: 빠른 테스트에 적합한 COCO train 및 COCO val의 처음 4개 이미지의 작은 하위 집합입니다.
- COCO128: 테스트에 적합한 COCO train 및 COCO val의 첫 128개 이미지의 작은 하위 집합입니다.
- 글로벌 밀 2020: 글로벌 밀 챌린지 2020의 밀 머리 이미지가 포함된 데이터 세트입니다.
- Objects365: 365개의 물체 카테고리와 60만 개 이상의 주석이 달린 이미지가 포함된 고품질의 대규모 물체 감지 데이터 세트입니다.
- OpenImagesV7: 170만 개의 열차 이미지와 4만 2천 개의 유효성 검사 이미지가 포함된 Google 의 포괄적인 데이터 세트입니다.
- SKU-110K: 11K 개 이상의 이미지와 170만 개의 경계 상자로 구성된 소매 환경에서의 고밀도 물체 감지 기능을 갖춘 데이터 세트입니다.
- VisDrone: 10K 이상의 이미지와 비디오 시퀀스가 포함된 드론으로 캡처한 이미지의 객체 감지 및 다중 객체 추적 데이터가 포함된 데이터 세트입니다.
- VOC: 20개의 객체 클래스와 11,000개 이상의 이미지가 포함된 객체 감지 및 분할을 위한 파스칼 시각 객체 클래스(VOC) 데이터 세트입니다.
- xView: 60개의 객체 카테고리와 100만 개 이상의 주석이 달린 오버헤드 이미지에서 객체를 감지하기 위한 데이터 세트입니다.
- RF100: 포괄적인 모델 평가를 위해 7개 이미지 영역에 걸친 100개의 데이터 세트로 구성된 다양한 물체 감지 벤치마크입니다.
- 뇌종양: 뇌종양을 감지하기 위한 데이터 세트에는 종양의 존재 여부, 위치 및 특성에 대한 세부 정보가 포함된 MRI 또는 CT 스캔 이미지가 포함됩니다.
- 아프리카 야생동물: 버팔로, 코끼리, 코뿔소, 얼룩말 등 아프리카 야생동물의 이미지가 포함된 데이터 세트입니다.
- 서명: 서명: 주석이 달린 서명이 있는 다양한 문서 이미지로 구성된 데이터 세트로, 문서 검증 및 사기 탐지 연구를 지원합니다.
- 의료용 알약: 의약품 품질 관리, 분류, 업계 표준 준수 보장 등의 작업을 지원하도록 설계된 의료용 알약의 라벨이 부착된 이미지가 포함된 데이터 세트입니다.
인스턴스 세분화
인스턴스 분할은 픽셀 수준에서 이미지의 객체를 식별하고 위치를 파악하는 컴퓨터 비전 기법입니다. 각 픽셀만 분류하는 시맨틱 분할과 달리 인스턴스 분할 은 같은 클래스의 여러 인스턴스를 구분합니다.
- COCO: 200만 개 이상의 레이블이 지정된 이미지가 포함된 객체 감지, 분할 및 캡션 작업을 위해 설계된 대규모 데이터 세트입니다.
- COCO8-seg: 세분화 주석이 있는 8개의 COCO 이미지 하위 집합을 포함하는 인스턴스 세분화 작업을 위한 더 작은 데이터 세트입니다.
- COCO128-seg: 세분화 주석이 있는 128개의 COCO 이미지 하위 집합을 포함하는 인스턴스 세분화 작업을 위한 더 작은 데이터 세트입니다.
- 균열 세그먼트: 도로와 벽의 균열을 감지하기 위해 특별히 제작된 데이터 세트로, 물체 감지 및 분할 작업에 모두 사용할 수 있습니다.
- 패키지 세그먼트: 창고 또는 산업 환경에서 패키지를 식별하기 위한 맞춤형 데이터 세트로, 물체 감지 및 세분화 애플리케이션에 모두 적합합니다.
- Carparts-seg: 차량 부품을 식별하기 위해 특별히 제작된 데이터 세트로, 설계, 제조 및 연구 요구 사항을 충족합니다. 객체 감지 및 세분화 작업에 모두 사용됩니다.
포즈 추정
포즈 추정은 카메라 또는 세계 좌표계를 기준으로 물체의 포즈를 결정하는 데 사용되는 기술입니다. 여기에는 물체, 특히 사람이나 동물의 주요 지점이나 관절을 식별하는 것이 포함됩니다.
- COCO: 포즈 추정 작업을 위해 설계된 사람 포즈 주석이 포함된 대규모 데이터 세트입니다.
- COCO8-pose: 포즈 추정 작업을 위한 더 작은 데이터 집합으로, 사람의 포즈 주석이 있는 8개의 COCO 이미지 하위 집합을 포함합니다.
- 호랑이 포즈: 호랑이에 초점을 맞춘 263개의 이미지로 구성된 컴팩트한 데이터 세트이며, 포즈 추정 작업을 위해 호랑이당 12개의 키포인트가 주석 처리되어 있습니다.
- 손 키포인트: 사람의 손을 중심으로 한 26,000개 이상의 이미지에 손당 21개의 키포인트로 주석을 단 간결한 데이터 세트로, 포즈 추정 작업을 위해 설계되었습니다.
- 개-포즈: 포즈 추정 작업에 맞게 개당 24개의 키포인트로 주석이 달린 개에 초점을 맞춘 약 6,000개의 이미지가 포함된 포괄적인 데이터 세트입니다.
분류
이미지 분류는 시각적 콘텐츠에 따라 이미지를 하나 이상의 사전 정의된 클래스 또는 카테고리로 분류하는 컴퓨터 비전 작업입니다.
- Caltech 101: 이미지 분류 작업을 위한 101개 객체 카테고리의 이미지가 포함된 데이터 세트입니다.
- Caltech 256: 256개의 개체 범주와 더 어려운 이미지가 포함된 Caltech 101의 확장 버전입니다.
- CIFAR-10: 10개의 클래스로 구성된 60K 32x32 컬러 이미지 데이터 세트(클래스당 6K 이미지)입니다.
- CIFAR-100: 100개의 객체 카테고리와 클래스당 600개의 이미지가 포함된 CIFAR-10의 확장 버전입니다.
- Fashion-MNIST: 이미지 분류 작업을 위한 10가지 패션 카테고리의 70,000개의 흑백 이미지로 구성된 데이터 세트입니다.
- ImageNet: 1,400만 개 이상의 이미지와 20,000개 이상의 카테고리가 포함된 물체 감지 및 이미지 분류를 위한 대규모 데이터 세트입니다.
- ImageNet-10: 더 빠른 실험과 테스트를 위해 10개의 카테고리로 구성된 ImageNet의 작은 하위 집합입니다.
- 이미지넷: 더 빠른 교육과 테스트를 위해 쉽게 구분할 수 있는 10개의 클래스를 포함하는 ImageNet의 작은 하위 집합입니다.
- 이미지 우프: 이미지 분류 작업을 위한 10가지 견종 카테고리를 포함하는 ImageNet의 더 까다로운 하위 집합입니다.
- MNIST: 이미지 분류 작업을 위한 70,000개의 손으로 쓴 숫자로 구성된 회색조 이미지 데이터 세트입니다.
- MNIST160: MNIST 데이터 세트에서 각 MNIST 카테고리의 첫 8개 이미지입니다. 데이터 세트에는 총 160개의 이미지가 포함되어 있습니다.
OBB(오리엔티드 바운딩 박스)
회전된 바운딩 박스를 사용하여 이미지에서 각진 물체를 감지하는 컴퓨터 비전의 한 방법으로, 주로 항공 및 위성 이미지에 적용됩니다. 기존의 바운딩 박스와 달리 OBB는 다양한 방향의 물체를 더 잘 맞출 수 있습니다.
- DOTA-v2: 170만 개의 인스턴스와 11,268개의 이미지가 포함된 인기 있는 OBB 항공 이미지 데이터 세트입니다.
- DOTA8: DOTAv1 분할 세트의 처음 8개 이미지 중 더 작은 하위 집합으로, 4개는 훈련용, 4개는 유효성 검사용으로 빠른 테스트에 적합합니다.
다중 객체 추적
다중 객체 추적은 비디오 시퀀스에서 시간 경과에 따라 여러 객체를 감지하고 추적하는 컴퓨터 비전 기술입니다. 이 작업은 여러 프레임에 걸쳐 객체의 일관된 식별을 유지하여 객체 감지 기능을 확장합니다.
- Argoverse: 다중 객체 추적 작업을 위한 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- VisDrone: 10K 이상의 이미지와 비디오 시퀀스가 포함된 드론으로 캡처한 이미지의 객체 감지 및 다중 객체 추적 데이터가 포함된 데이터 세트입니다.
새 데이터 세트 기여
새 데이터 집합을 기여하려면 기존 인프라와 잘 맞도록 하기 위해 몇 가지 단계를 거쳐야 합니다. 다음은 필요한 단계입니다:
Watch: Ultralytics 애널리틱스 데이터 세트에 기여하는 방법 🚀
새 데이터 집합을 기여하는 단계
- 이미지 수집: 데이터 집합에 속한 이미지를 수집합니다. 공개 데이터베이스나 자체 컬렉션 등 다양한 소스에서 이미지를 수집할 수 있습니다.
- 이미지에 주석을 달기: 작업에 따라 경계 상자, 세그먼트 또는 키포인트로 이미지에 주석을 달 수 있습니다.
- 주석 내보내기: 이러한 주석을 YOLO
*.txt
파일 형식을 지원하는 Ultralytics . -
데이터 집합 구성: 데이터 집합을 올바른 폴더 구조로 정렬합니다. 다음이 있어야 합니다.
train/
그리고val/
최상위 디렉터리와 각 디렉터리 내에images/
그리고labels/
하위 디렉터리로 이동합니다. -
만들기
data.yaml
파일: 데이터 집합의 루트 디렉터리에data.yaml
데이터 세트, 클래스 및 기타 필요한 정보를 설명하는 파일입니다. - 이미지 최적화(선택 사항): 보다 효율적인 처리를 위해 데이터 세트의 크기를 줄이려면 아래 코드를 사용하여 이미지를 최적화할 수 있습니다. 필수는 아니지만 데이터 세트 크기를 줄이고 다운로드 속도를 높이려면 권장됩니다.
- 데이터 집합 압축: 전체 데이터 집합 폴더를 zip 파일로 압축합니다.
- 문서 및 홍보: 데이터 세트가 기존 프레임워크에 어떻게 들어맞는지 설명하는 문서 페이지를 만드세요. 그런 다음 풀 리퀘스트(PR)를 제출합니다. PR을 제출하는 방법에 대한 자세한 내용은 Ultralytics 기여 가이드라인을 참조하세요.
데이터 집합을 최적화하고 압축하는 코드 예제
데이터 집합 최적화 및 압축
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
다음 단계에 따라 Ultralytics' 기존 구조와 잘 통합되는 새 데이터 집합을 기여할 수 있습니다.
자주 묻는 질문
Ultralytics 에서 객체 감지를 위해 지원하는 데이터 세트는 무엇인가요?
Ultralytics 다음을 포함하여 객체 감지를 위한 다양한 데이터 세트를 지원합니다:
- COCO: 80개의 객체 카테고리가 포함된 대규모 객체 감지, 세분화 및 캡션 데이터 세트입니다.
- LVIS: 1203개의 객체 카테고리가 포함된 광범위한 데이터 세트로, 보다 세분화된 객체 감지 및 세분화를 위해 설계되었습니다.
- Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- VisDrone: 드론으로 촬영한 이미지에서 물체 감지 및 다중 물체 추적 데이터가 포함된 데이터 세트입니다.
- SKU-110K: 11K 이상의 이미지로 소매 환경에서 고밀도 물체 감지가 가능합니다.
이러한 데이터 세트를 통해 강력한 교육이 가능합니다. Ultralytics YOLO 다양한 객체 감지 애플리케이션을 위한 모델입니다.
Ultralytics 에 새 데이터 집합을 기여하려면 어떻게 해야 하나요?
새 데이터 집합을 기여하려면 몇 가지 단계를 거쳐야 합니다:
- 이미지 수집: 공개 데이터베이스 또는 개인 컬렉션에서 이미지를 수집합니다.
- 이미지에 주석을 달기: 작업에 따라 경계 상자, 세그먼트 또는 키포인트를 적용합니다.
- 주석 내보내기: 어노테이션을 YOLO
*.txt
형식입니다. - 데이터 집합 구성: 다음과 같은 폴더 구조 사용
train/
그리고val/
디렉토리에 각각images/
그리고labels/
하위 디렉터리로 이동합니다. - 만들기
data.yaml
파일: 데이터 세트 설명, 클래스 및 기타 관련 정보를 포함합니다. - 이미지 최적화(선택 사항): 효율성을 위해 데이터 세트 크기를 줄입니다.
- 데이터 집합 압축: 데이터 집합을 zip 파일로 압축합니다.
- 문서 및 홍보: 데이터 집합을 설명하고 Ultralytics 기여 가이드라인에 따라 풀 리퀘스트를 제출하세요.
종합 가이드를 보려면 새 데이터 세트 기여를 방문하세요.
데이터 집합에 Ultralytics HUB를 사용해야 하는 이유는 무엇인가요?
Ultralytics HUB는 데이터 집합 관리 및 분석을 위한 다음과 같은 강력한 기능을 제공합니다:
- 원활한 데이터 세트 관리: 한 곳에서 데이터세트를 업로드, 정리, 관리하세요.
- 즉각적인 훈련 통합: 추가 설정 없이 업로드된 데이터 세트를 모델 학습에 바로 사용할 수 있습니다.
- 시각화 도구: 데이터 집합 이미지와 주석을 탐색하고 시각화합니다.
- 데이터 집합 분석: 데이터 세트 분포와 특성에 대한 인사이트를 얻으세요.
이 플랫폼은 데이터 세트 관리에서 모델 학습으로의 전환을 간소화하여 전체 프로세스를 더욱 효율적으로 만들어 줍니다. Ultralytics HUB 데이터세트에 대해 자세히 알아보세요.
컴퓨터 비전용 Ultralytics YOLO 모델의 고유한 기능은 무엇인가요?
Ultralytics YOLO 모델은 컴퓨터 비전 작업을 위한 몇 가지 고유한 기능을 제공합니다:
- 실시간 성능: 시간에 민감한 애플리케이션을 위한 고속 추론 및 학습 기능.
- 다목적성: 통합 프레임워크에서 탐지, 세분화, 분류 및 포즈 추정 작업을 지원합니다.
- 사전 학습된 모델: 다양한 애플리케이션을 위한 고성능의 사전 학습된 모델에 액세스하여 학습 시간을 단축할 수 있습니다.
- 광범위한 커뮤니티 지원: 활발한 커뮤니티와 문제 해결 및 개발을 위한 포괄적인 문서가 제공됩니다.
- 간편한 통합: 기존 프로젝트 및 워크플로와 통합할 수 있는 간단한 API.
Ultralytics 모델 페이지에서 YOLO 모델에 대해 자세히 알아보세요.
Ultralytics 도구를 사용하여 데이터 집합을 최적화하고 압축하려면 어떻게 해야 하나요?
Ultralytics 도구를 사용하여 데이터 집합을 최적화하고 압축하려면 다음 예제 코드를 따르세요:
데이터 집합 최적화 및 압축
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
이 프로세스를 통해 데이터 세트 크기를 줄여 저장 공간을 효율적으로 활용하고 다운로드 속도를 높일 수 있습니다. 데이터 집합을 최적화하고 압축하는 방법에 대해 자세히 알아보세요.