데이터 세트 개요
Ultralytics 는 감지, 인스턴스 분할, 포즈 추정, 분류 및 다중 객체 추적과 같은 컴퓨터 비전 작업을 용이하게 하기 위해 다양한 데이터 세트를 지원합니다. 아래는 주요 Ultralytics 데이터 세트 목록과 각 컴퓨터 비전 작업 및 해당 데이터 세트에 대한 요약입니다.
Watch: Ultralytics 데이터 세트 개요
Ultralytics 탐색기
커뮤니티 노트 ⚠️
기준 ultralytics>=8.3.10
, Ultralytics 탐색기 지원은 더 이상 사용되지 않습니다. 하지만 걱정하지 마세요! 이제 다음을 통해 유사하거나 더욱 향상된 기능에 액세스할 수 있습니다. Ultralytics HUB는 워크플로우를 간소화하도록 설계된 직관적인 노코드 플랫폼입니다. Ultralytics HUB를 사용하면 코드 한 줄 작성하지 않고도 데이터를 손쉽게 탐색, 시각화, 관리할 수 있습니다. 꼭 확인하시고 강력한 기능을 활용해 보세요!
데이터 세트에 대한 임베딩을 만들고, 유사한 이미지를 검색하고, SQL 쿼리를 실행하고, 시맨틱 검색을 수행하고, 자연어를 사용해 검색할 수도 있습니다! 저희의 GUI 앱으로 시작하거나 API를 사용해 직접 구축할 수 있습니다. 여기에서 자세히 알아보세요.
물체 감지
경계 상자 객체 감지는 각 객체 주위에 경계 상자를 그려 이미지에서 객체를 감지하고 위치를 파악하는 컴퓨터 비전 기법입니다.
- Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- COCO: 컨텍스트 내 공통 개체(COCO)는 80개의 개체 범주로 구성된 대규모 개체 감지, 세분화 및 캡션 데이터 세트입니다.
- LVIS: 1203개의 객체 카테고리가 포함된 대규모 객체 감지, 세분화 및 캡션 데이터 세트입니다.
- COCO8: 빠른 테스트에 적합한 COCO train 및 COCO val의 처음 4개 이미지의 작은 하위 집합입니다.
- COCO128: 테스트에 적합한 COCO train 및 COCO val의 첫 128개 이미지의 작은 하위 집합입니다.
- 글로벌 밀 2020: 글로벌 밀 챌린지 2020의 밀 머리 이미지가 포함된 데이터 세트입니다.
- Objects365: 365개의 물체 카테고리와 60만 개 이상의 주석이 달린 이미지가 포함된 고품질의 대규모 물체 감지 데이터 세트입니다.
- OpenImagesV7: 170만 개의 열차 이미지와 4만 2천 개의 유효성 검사 이미지가 포함된 Google 의 포괄적인 데이터 세트입니다.
- SKU-110K: 11K 개 이상의 이미지와 170만 개의 경계 상자로 구성된 소매 환경에서의 고밀도 물체 감지 기능을 갖춘 데이터 세트입니다.
- VisDrone: 10K 이상의 이미지와 비디오 시퀀스가 포함된 드론으로 캡처한 이미지의 객체 감지 및 다중 객체 추적 데이터가 포함된 데이터 세트입니다.
- VOC: 20개의 객체 클래스와 11,000개 이상의 이미지가 포함된 객체 감지 및 분할을 위한 파스칼 시각 객체 클래스(VOC) 데이터 세트입니다.
- xView: 60개의 객체 카테고리와 100만 개 이상의 주석이 달린 오버헤드 이미지에서 객체를 감지하기 위한 데이터 세트입니다.
- RF100: 포괄적인 모델 평가를 위해 7개 이미지 영역에 걸친 100개의 데이터 세트로 구성된 다양한 물체 감지 벤치마크입니다.
- 뇌종양: 뇌종양을 감지하기 위한 데이터 세트에는 종양의 존재 여부, 위치 및 특성에 대한 세부 정보가 포함된 MRI 또는 CT 스캔 이미지가 포함됩니다.
- 아프리카 야생동물: 버팔로, 코끼리, 코뿔소, 얼룩말 등 아프리카 야생동물의 이미지가 포함된 데이터 세트입니다.
- 서명: 서명: 주석이 달린 서명이 있는 다양한 문서 이미지로 구성된 데이터 세트로, 문서 검증 및 사기 탐지 연구를 지원합니다.
- Medical-pills: A dataset containing labeled images of medical-pills, designed to aid in tasks like pharmaceutical quality control, sorting, and ensuring compliance with industry standards.
인스턴스 세분화
인스턴스 분할은 픽셀 수준에서 이미지의 객체를 식별하고 위치를 파악하는 컴퓨터 비전 기법입니다.
- COCO: 200만 개 이상의 레이블이 지정된 이미지가 포함된 객체 감지, 분할 및 캡션 작업을 위해 설계된 대규모 데이터 세트입니다.
- COCO8-seg: 세분화 주석이 있는 8개의 COCO 이미지 하위 집합을 포함하는 인스턴스 세분화 작업을 위한 더 작은 데이터 세트입니다.
- COCO128-seg: 세분화 주석이 있는 128개의 COCO 이미지 하위 집합을 포함하는 인스턴스 세분화 작업을 위한 더 작은 데이터 세트입니다.
- 균열 세그먼트: 도로와 벽의 균열을 감지하기 위해 특별히 제작된 데이터 세트로, 물체 감지 및 분할 작업에 모두 사용할 수 있습니다.
- 패키지 세그먼트: 창고 또는 산업 환경에서 패키지를 식별하기 위한 맞춤형 데이터 세트로, 물체 감지 및 세분화 애플리케이션에 모두 적합합니다.
- Carparts-seg: 차량 부품을 식별하기 위해 특별히 제작된 데이터 세트로, 설계, 제조 및 연구 요구 사항을 충족합니다. 객체 감지 및 세분화 작업에 모두 사용됩니다.
포즈 추정
포즈 추정은 카메라 또는 월드 좌표계를 기준으로 오브젝트의 포즈를 결정하는 데 사용되는 기술입니다.
- COCO: 포즈 추정 작업을 위해 설계된 사람 포즈 주석이 포함된 대규모 데이터 세트입니다.
- COCO8-pose: 포즈 추정 작업을 위한 더 작은 데이터 집합으로, 사람의 포즈 주석이 있는 8개의 COCO 이미지 하위 집합을 포함합니다.
- 호랑이 포즈: 호랑이에 초점을 맞춘 263개의 이미지로 구성된 컴팩트한 데이터 세트이며, 포즈 추정 작업을 위해 호랑이당 12개의 키포인트가 주석 처리되어 있습니다.
- 손 키포인트: 사람의 손을 중심으로 한 26,000개 이상의 이미지에 손당 21개의 키포인트로 주석을 단 간결한 데이터 세트로, 포즈 추정 작업을 위해 설계되었습니다.
- 개-포즈: 포즈 추정 작업에 맞게 개당 24개의 키포인트로 주석이 달린 개에 초점을 맞춘 약 6,000개의 이미지가 포함된 포괄적인 데이터 세트입니다.
분류
이미지 분류는 시각적 콘텐츠에 따라 이미지를 하나 이상의 사전 정의된 클래스 또는 카테고리로 분류하는 컴퓨터 비전 작업입니다.
- Caltech 101: 이미지 분류 작업을 위한 101개 객체 카테고리의 이미지가 포함된 데이터 세트입니다.
- Caltech 256: 256개의 개체 범주와 더 어려운 이미지가 포함된 Caltech 101의 확장 버전입니다.
- CIFAR-10: 10개의 클래스로 구성된 60K 32x32 컬러 이미지 데이터 세트(클래스당 6K 이미지)입니다.
- CIFAR-100: 100개의 객체 카테고리와 클래스당 600개의 이미지가 포함된 CIFAR-10의 확장 버전입니다.
- Fashion-MNIST: 이미지 분류 작업을 위한 10가지 패션 카테고리의 70,000개의 흑백 이미지로 구성된 데이터 세트입니다.
- ImageNet: 1,400만 개 이상의 이미지와 20,000개 이상의 카테고리가 포함된 물체 감지 및 이미지 분류를 위한 대규모 데이터 세트입니다.
- ImageNet-10: 더 빠른 실험과 테스트를 위해 10개의 카테고리로 구성된 ImageNet의 작은 하위 집합입니다.
- 이미지넷: 더 빠른 교육과 테스트를 위해 쉽게 구분할 수 있는 10개의 클래스를 포함하는 ImageNet의 작은 하위 집합입니다.
- 이미지 우프: 이미지 분류 작업을 위한 10가지 견종 카테고리를 포함하는 ImageNet의 더 까다로운 하위 집합입니다.
- MNIST: 이미지 분류 작업을 위한 70,000개의 손으로 쓴 숫자로 구성된 회색조 이미지 데이터 세트입니다.
- MNIST160: MNIST 데이터 세트에서 각 MNIST 카테고리의 첫 8개 이미지입니다. 데이터 세트에는 총 160개의 이미지가 포함되어 있습니다.
OBB(오리엔티드 바운딩 박스)
오리엔티드 바운딩 박스(OBB)는 회전된 바운딩 박스를 사용하여 이미지에서 각진 물체를 감지하는 컴퓨터 비전의 방법으로, 항공 및 위성 이미지에 주로 적용됩니다.
- DOTA-v2: 170만 개의 인스턴스와 11,268개의 이미지가 포함된 인기 있는 OBB 항공 이미지 데이터 세트입니다.
- DOTA8: DOTAv1 분할 세트의 처음 8개 이미지 중 더 작은 하위 집합으로, 4개는 훈련용, 4개는 유효성 검사용으로 빠른 테스트에 적합합니다.
다중 객체 추적
다중 객체 추적은 비디오 시퀀스에서 시간 경과에 따라 여러 객체를 감지하고 추적하는 컴퓨터 비전 기술입니다.
- Argoverse: 다중 객체 추적 작업을 위한 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- VisDrone: 10K 이상의 이미지와 비디오 시퀀스가 포함된 드론으로 캡처한 이미지의 객체 감지 및 다중 객체 추적 데이터가 포함된 데이터 세트입니다.
새 데이터 세트 기여
새 데이터 집합을 기여하려면 기존 인프라와 잘 맞도록 하기 위해 몇 가지 단계를 거쳐야 합니다. 다음은 필요한 단계입니다:
새 데이터 집합을 기여하는 단계
- 이미지 수집: 데이터 집합에 속한 이미지를 수집합니다. 공개 데이터베이스나 자체 컬렉션 등 다양한 소스에서 이미지를 수집할 수 있습니다.
- 이미지에 주석을 달기: 작업에 따라 경계 상자, 세그먼트 또는 키포인트로 이미지에 주석을 달 수 있습니다.
- 주석 내보내기: 이러한 주석을 YOLO
*.txt
파일 형식을 지원하는 Ultralytics . -
데이터 집합 구성: 데이터 집합을 올바른 폴더 구조로 정렬합니다. 다음이 있어야 합니다.
train/
그리고val/
최상위 디렉터리와 각 디렉터리 내에images/
그리고labels/
하위 디렉터리로 이동합니다. -
만들기
data.yaml
파일: 데이터 집합의 루트 디렉터리에data.yaml
데이터 세트, 클래스 및 기타 필요한 정보를 설명하는 파일입니다. - 이미지 최적화(선택 사항): 보다 효율적인 처리를 위해 데이터 세트의 크기를 줄이려면 아래 코드를 사용하여 이미지를 최적화할 수 있습니다. 필수는 아니지만 데이터 세트 크기를 줄이고 다운로드 속도를 높이려면 권장됩니다.
- 데이터 집합 압축: 전체 데이터 집합 폴더를 zip 파일로 압축합니다.
- 문서 및 홍보: 데이터 세트가 기존 프레임워크에 어떻게 들어맞는지 설명하는 문서 페이지를 만드세요. 그런 다음 풀 리퀘스트(PR)를 제출합니다. PR을 제출하는 방법에 대한 자세한 내용은 Ultralytics 기여 가이드라인을 참조하세요.
데이터 집합을 최적화하고 압축하는 코드 예제
데이터 집합 최적화 및 압축
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
다음 단계에 따라 Ultralytics' 기존 구조와 잘 통합되는 새 데이터 집합을 기여할 수 있습니다.
자주 묻는 질문
Ultralytics 에서 객체 감지를 위해 지원하는 데이터 세트는 무엇인가요?
Ultralytics 는 객체 감지를 위한 다양한 데이터 세트를 지원합니다:
- COCO: 80개의 객체 카테고리가 포함된 대규모 객체 감지, 세분화 및 캡션 데이터 세트입니다.
- LVIS: 1203개의 객체 카테고리가 포함된 광범위한 데이터 세트로, 보다 세분화된 객체 감지 및 세분화를 위해 설계되었습니다.
- Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
- VisDrone: 드론으로 촬영한 이미지에서 물체 감지 및 다중 물체 추적 데이터가 포함된 데이터 세트입니다.
- SKU-110K: 11K 이상의 이미지로 소매 환경에서 고밀도 물체 감지가 가능합니다.
이러한 데이터 세트는 다양한 물체 감지 애플리케이션을 위한 강력한 모델 학습을 용이하게 합니다.
Ultralytics 에 새 데이터 집합을 기여하려면 어떻게 해야 하나요?
새 데이터 집합을 기여하려면 몇 가지 단계를 거쳐야 합니다:
- 이미지 수집: 공개 데이터베이스 또는 개인 컬렉션에서 이미지를 수집합니다.
- 이미지에 주석을 달기: 작업에 따라 경계 상자, 세그먼트 또는 키포인트를 적용합니다.
- 주석 내보내기: 어노테이션을 YOLO
*.txt
형식입니다. - 데이터 집합 구성: 다음과 같은 폴더 구조 사용
train/
그리고val/
디렉토리에 각각images/
그리고labels/
하위 디렉터리로 이동합니다. - 만들기
data.yaml
파일: 데이터 세트 설명, 클래스 및 기타 관련 정보를 포함합니다. - 이미지 최적화(선택 사항): 효율성을 위해 데이터 세트 크기를 줄입니다.
- 데이터 집합 압축: 데이터 집합을 zip 파일로 압축합니다.
- 문서 및 홍보: 데이터 집합을 설명하고 Ultralytics 기여 가이드라인에 따라 풀 리퀘스트를 제출하세요.
종합 가이드를 보려면 새 데이터 세트 기여를 방문하세요.
데이터 집합에 Ultralytics Explorer를 사용해야 하는 이유는 무엇인가요?
Ultralytics Explorer는 데이터 집합 분석을 위한 다음과 같은 강력한 기능을 제공합니다:
- 임베딩 생성: 이미지에 대한 벡터 임베딩을 생성합니다.
- 시맨틱 검색: 임베딩 또는 AI를 사용하여 유사한 이미지를 검색합니다.
- SQL 쿼리: 자세한 데이터 분석을 위해 고급 SQL 쿼리를 실행합니다.
- 자연어 검색: 사용하기 쉽도록 일반 언어 쿼리를 사용하여 검색하세요.
자세한 내용은 Ultralytics 탐색기를 살펴보고 GUI 데모를 사용해 보세요.
컴퓨터 비전용 Ultralytics YOLO 모델의 고유한 기능은 무엇인가요?
Ultralytics YOLO 모델은 몇 가지 고유한 기능을 제공합니다:
- 실시간 성능: 고속 추론 및 훈련.
- 다목적성: 감지, 세분화, 분류, 포즈 추정 작업에 적합합니다.
- 사전 학습된 모델: 다양한 애플리케이션을 위한 고성능의 사전 학습된 모델에 액세스하세요.
- 광범위한 커뮤니티 지원: 활발한 커뮤니티와 문제 해결 및 개발을 위한 포괄적인 문서가 제공됩니다.
YOLO 에 대해 자세히 알아보세요. Ultralytics YOLO 페이지에서 확인하세요.
Ultralytics 도구를 사용하여 데이터 집합을 최적화하고 압축하려면 어떻게 해야 하나요?
Ultralytics 도구를 사용하여 데이터 집합을 최적화하고 압축하려면 다음 예제 코드를 따르세요:
데이터 집합 최적화 및 압축
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
데이터 집합을 최적화하고 압축하는 방법에 대해 자세히 알아보세요.