콘텐츠로 건너뛰기

데이터 세트 개요

Ultralytics는 감지, 인스턴스 분할, 자세 추정, 분류 및 다중 객체 추적과 같은 컴퓨터 비전 작업을 용이하게 하기 위해 다양한 데이터 세트에 대한 지원을 제공합니다. 다음은 주요 Ultralytics 데이터 세트 목록과 각 컴퓨터 비전 작업 및 해당 데이터 세트에 대한 요약입니다.



참고: Ultralytics 데이터 세트 개요

객체 감지

바운딩 박스 객체 감지는 각 객체 주위에 바운딩 박스를 그려 이미지에서 객체를 감지하고 지역화하는 컴퓨터 비전 기술입니다.

  • Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
  • COCO: COCO(Common Objects in Context)는 80개의 객체 범주가 있는 대규모 객체 감지, 분할 및 캡션 데이터 세트입니다.
  • LVIS: 1203개의 객체 범주를 포함하는 대규모 객체 감지, 분할 및 캡션 데이터 세트입니다.
  • COCO8: COCO train 및 COCO val의 처음 4개 이미지로 구성된 더 작은 하위 세트로, 빠른 테스트에 적합합니다.
  • COCO8-Grayscale: RGB를 흑백으로 변환하여 생성된 COCO8의 흑백 버전으로, 단일 채널 모델 평가에 유용합니다.
  • COCO8-Multispectral: RGB 파장을 보간하여 생성된 COCO8의 10채널 다중 스펙트럼 버전으로, 스펙트럼 인식 모델 평가에 유용합니다.
  • COCO128: COCO train 및 COCO val의 처음 128개 이미지로 구성된 더 작은 하위 세트로, 테스트에 적합합니다.
  • Global Wheat 2020: Global Wheat Challenge 2020을 위해 밀 이삭 이미지를 포함하는 데이터 세트입니다.
  • Objects365: 365개의 객체 범주와 60만 개 이상의 어노테이션이 달린 이미지를 포함하는 객체 감지를 위한 고품질의 대규모 데이터 세트입니다.
  • OpenImagesV7: Google에서 제공하는 170만 개의 훈련 이미지와 42,000개의 검증 이미지를 포함하는 포괄적인 데이터 세트입니다.
  • SKU-110K: 11,000개 이상의 이미지와 170만 개의 바운딩 박스를 포함하여 소매 환경에서 조밀한 객체 감지를 특징으로 하는 데이터 세트입니다.
  • HomeObjects-3K New 🚀: 스마트 홈 시스템, 로보틱스 및 증강 현실에서 컴퓨터 비전 모델을 개발하고 테스트하는 데 이상적인 12가지 일반적인 가정 용품이 포함된 주석이 달린 실내 장면 데이터 세트입니다.
  • VisDrone: 10,000개 이상의 이미지와 비디오 시퀀스를 포함하여 드론 캡처 이미지에서 객체 감지 및 다중 객체 추적 데이터를 포함하는 데이터 세트입니다.
  • VOC: 20개의 객체 클래스와 11,000개 이상의 이미지를 포함하는 객체 감지 및 분할을 위한 Pascal Visual Object Classes (VOC) 데이터 세트입니다.
  • xView: 60개의 객체 범주와 100만 개 이상의 어노테이션이 달린 객체를 포함하는 오버헤드 이미지의 객체 감지를 위한 데이터 세트입니다.
  • RF100: 포괄적인 모델 평가를 위해 7개의 이미지 도메인에 걸쳐 100개의 데이터 세트를 포함하는 다양한 객체 감지 벤치마크입니다.
  • Brain-tumor: 뇌종양 감지를 위한 데이터 세트로, 종양의 존재, 위치 및 특성에 대한 세부 정보가 포함된 MRI 또는 CT 스캔 이미지를 포함합니다.
  • African-wildlife: 버팔로, 코끼리, 코뿔소 및 얼룩말을 포함한 아프리카 야생 동물의 이미지를 특징으로 하는 데이터 세트입니다.
  • Signature: 문서 확인 및 사기 탐지 연구를 지원하는 어노테이션이 달린 서명이 있는 다양한 문서 이미지를 특징으로 하는 데이터 세트입니다.
  • Medical-pills: 제약 품질 관리, 분류, 산업 표준 준수 보장과 같은 작업을 지원하도록 설계된 의료용 알약의 레이블이 지정된 이미지가 포함된 데이터 세트입니다.

인스턴스 분할

인스턴스 분할은 픽셀 수준에서 이미지의 객체를 식별하고 로컬라이징하는 컴퓨터 비전 기술입니다. 각 픽셀을 분류하기만 하는 시맨틱 분할과 달리 인스턴스 분할은 동일한 클래스의 여러 인스턴스를 구별합니다.

  • COCO: 20만 개 이상의 레이블이 지정된 이미지를 포함하는 객체 감지, 분할 및 캡션 작업을 위해 설계된 대규모 데이터 세트입니다.
  • COCO8-seg: 분할 어노테이션이 있는 8개의 COCO 이미지 하위 세트를 포함하는 인스턴스 분할 작업을 위한 더 작은 데이터 세트입니다.
  • COCO128-seg: 분할 어노테이션이 있는 128개의 COCO 이미지 하위 세트를 포함하는 인스턴스 분할 작업을 위한 더 작은 데이터 세트입니다.
  • Crack-seg: 도로 및 벽의 균열을 감지하기 위해 특별히 제작된 데이터 세트로, 객체 감지 및 분할 작업 모두에 적용할 수 있습니다.
  • Package-seg: 창고 또는 산업 환경에서 패키지를 식별하기 위해 맞춤화된 데이터 세트로, 객체 감지 및 분할 애플리케이션 모두에 적합합니다.
  • Carparts-seg: 차량 부품을 식별하기 위해 특별히 제작된 데이터 세트로, 설계, 제조 및 연구 요구 사항을 충족합니다. 객체 감지 및 분할 작업 모두에 사용됩니다.

포즈 추정

포즈 추정은 카메라 또는 세계 좌표계를 기준으로 객체의 포즈를 결정하는 데 사용되는 기술입니다. 여기에는 객체, 특히 사람이나 동물의 주요 지점 또는 관절을 식별하는 작업이 포함됩니다.

  • COCO: 포즈 추정 작업을 위해 설계된 인간 포즈 어노테이션이 있는 대규모 데이터 세트입니다.
  • COCO8-pose: 인간 포즈 어노테이션이 있는 8개의 COCO 이미지 하위 세트를 포함하는 포즈 추정 작업을 위한 더 작은 데이터 세트입니다.
  • Tiger-pose: 호랑이에 초점을 맞춘 263개의 이미지로 구성된 소형 데이터 세트로, 포즈 추정 작업을 위해 호랑이당 12개의 키포인트로 어노테이션이 달려 있습니다.
  • Hand-Keypoints: 사람 손을 중심으로 26,000장 이상의 이미지를 담고 있으며, 포즈 추정 작업을 위해 손 하나당 21개의 키포인트로 어노테이션된 간결한 데이터 세트입니다.
  • Dog-pose: 약 6,000장의 개 이미지를 포함하고, 포즈 추정 작업을 위해 개 하나당 24개의 키포인트로 어노테이션된 포괄적인 데이터 세트입니다.

분류

이미지 분류는 이미지의 시각적 콘텐츠를 기반으로 이미지를 하나 이상의 미리 정의된 클래스 또는 범주로 분류하는 컴퓨터 비전 작업입니다.

  • Caltech 101: 이미지 분류 작업을 위해 101개의 객체 범주 이미지를 포함하는 데이터 세트입니다.
  • Caltech 256: 256개의 객체 범주와 더 어려운 이미지를 포함하는 Caltech 101의 확장 버전입니다.
  • CIFAR-10: 10개의 클래스로 구성된 60K 32x32 컬러 이미지 데이터 세트이며, 클래스당 6K 이미지가 있습니다.
  • CIFAR-100: 100개의 객체 범주와 클래스당 600개의 이미지를 포함하는 CIFAR-10의 확장 버전입니다.
  • Fashion-MNIST: 이미지 분류 작업을 위해 10개의 패션 범주로 구성된 70,000개의 흑백 이미지 데이터 세트입니다.
  • ImageNet: 1,400만 개 이상의 이미지와 20,000개의 범주를 포함하는 객체 감지 및 이미지 분류를 위한 대규모 데이터 세트입니다.
  • ImageNet-10: 더 빠른 실험 및 테스트를 위해 10개의 범주로 구성된 ImageNet의 더 작은 하위 세트입니다.
  • Imagenette: 더 빠른 학습 및 테스트를 위해 쉽게 구별할 수 있는 10개의 클래스를 포함하는 ImageNet의 더 작은 하위 세트입니다.
  • Imagewoof: 이미지 분류 작업을 위해 10개의 개 품종 범주를 포함하는 ImageNet의 더 어려운 하위 세트입니다.
  • MNIST: 이미지 분류 작업을 위해 손으로 쓴 숫자 70,000개의 흑백 이미지 데이터 세트입니다.
  • MNIST160: MNIST 데이터 세트의 각 MNIST 범주에서 처음 8개의 이미지입니다. 데이터 세트는 총 160개의 이미지를 포함합니다.

기울어진 경계 상자 (OBB)

OBB(Oriented Bounding Box)는 회전된 경계 상자를 사용하여 이미지에서 각진 객체를 감지하기 위한 컴퓨터 비전의 방법으로, 종종 항공 및 위성 이미지에 적용됩니다. 기존 경계 상자와 달리 OBB는 다양한 방향에서 객체에 더 잘 맞출 수 있습니다.

  • DOTA-v2: 170만 개의 인스턴스와 11,268개의 이미지를 포함하는 인기 있는 OBB 항공 이미지 데이터 세트입니다.
  • DOTA8: 빠른 테스트에 적합한 DOTAv1 분할 세트의 처음 8개 이미지(학습용 4개, 검증용 4개)의 더 작은 하위 세트입니다.

다중 객체 추적

다중 객체 추적은 비디오 시퀀스에서 시간이 지남에 따라 여러 객체를 감지하고 추적하는 컴퓨터 비전 기술입니다. 이 작업은 프레임 간에 객체의 일관된 ID를 유지하여 객체 감지를 확장합니다.

  • Argoverse: 다중 객체 추적 작업을 위해 풍부한 어노테이션이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터를 포함하는 데이터 세트입니다.
  • VisDrone: 10,000개 이상의 이미지와 비디오 시퀀스를 포함하여 드론 캡처 이미지에서 객체 감지 및 다중 객체 추적 데이터를 포함하는 데이터 세트입니다.

새 데이터 세트 기여

새로운 데이터 세트를 기여하려면 기존 인프라와 잘 맞도록 여러 단계를 거쳐야 합니다. 다음은 필요한 단계입니다.



참고: Ultralytics 데이터 세트에 기여하는 방법 🚀

새 데이터 세트 기여 단계

  1. 이미지 수집: 데이터 세트에 속하는 이미지를 수집합니다. 이러한 이미지는 공용 데이터베이스 또는 자체 컬렉션과 같은 다양한 소스에서 수집할 수 있습니다.
  2. 이미지 어노테이션: 작업에 따라 이러한 이미지에 경계 상자, 세그먼트 또는 키포인트를 사용하여 어노테이션을 추가합니다.
  3. 어노테이션 내보내기: 이러한 어노테이션을 YOLO *.txt Ultralytics에서 지원하는 파일 형식으로 변환합니다.
  4. 데이터 세트 구성: 데이터 세트를 올바른 폴더 구조로 정렬합니다. 다음과 같은 구조를 갖춰야 합니다. train/val/ 최상위 디렉터리와 각 디렉터리 내에 images/labels/ 하위 디렉터리가 있어야 합니다.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. 파일 만들기 data.yaml 파일: 데이터 세트의 루트 디렉터리에 데이터 세트, 클래스 및 기타 필요한 정보를 설명하는 data.yaml 파일을 만듭니다.

  6. 이미지 최적화 (선택 사항): 더 효율적인 처리를 위해 데이터 세트 크기를 줄이려면 아래 코드를 사용하여 이미지를 최적화할 수 있습니다. 필수는 아니지만 더 작은 데이터 세트 크기와 더 빠른 다운로드 속도를 위해 권장됩니다.
  7. 데이터 세트 압축: 전체 데이터 세트 폴더를 zip 파일로 압축합니다.
  8. 문서화 및 PR: 데이터 세트와 기존 프레임워크에 어떻게 적합한지 설명하는 문서 페이지를 만듭니다. 그런 다음 Pull Request (PR)를 제출합니다. PR 제출 방법에 대한 자세한 내용은 Ultralytics 기여 지침을 참조하십시오.

데이터 세트 최적화 및 압축 예제 코드

데이터 세트 최적화 및 압축

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

이러한 단계를 따르면 Ultralytics의 기존 구조와 잘 통합되는 새로운 데이터 세트를 기여할 수 있습니다.

FAQ

Ultralytics는 객체 감지를 위해 어떤 데이터 세트를 지원합니까?

Ultralytics는 다음을 포함하여 객체 감지를 위한 다양한 데이터 세트를 지원합니다.

  • COCO: 80개의 객체 범주가 있는 대규모 객체 감지, 분할 및 캡션 데이터 세트입니다.
  • LVIS: 1203개의 객체 범주가 있는 광범위한 데이터 세트로, 더 세분화된 객체 감지 및 분할을 위해 설계되었습니다.
  • Argoverse: 풍부한 주석이 포함된 도시 환경의 3D 추적 및 모션 예측 데이터가 포함된 데이터 세트입니다.
  • VisDrone: 드론 캡처 이미지의 객체 감지 및 다중 객체 추적 데이터가 있는 데이터 세트입니다.
  • SKU-110K: 11K개 이상의 이미지를 통해 소매 환경에서 조밀한 객체 감지를 제공합니다.

이러한 데이터 세트는 다양한 객체 감지 애플리케이션을 위한 강력한 Ultralytics YOLO 모델 학습을 용이하게 합니다.

Ultralytics에 새로운 데이터 세트를 어떻게 기여할 수 있습니까?

새로운 데이터 세트를 기여하는 데는 여러 단계가 포함됩니다.

  1. 이미지 수집: 공용 데이터베이스 또는 개인 컬렉션에서 이미지를 수집합니다.
  2. 이미지 주석 달기: 작업에 따라 경계 상자, 세그먼트 또는 키포인트를 적용합니다.
  3. 어노테이션 내보내기: 주석을 YOLO *.txt 형식으로 변환합니다.
  4. 데이터 세트 구성: 다음 폴더 구조를 사용하세요. train/val/ 각각 다음을 포함하는 디렉터리: images/labels/ 하위 디렉터리
  5. 파일 만들기 data.yaml 파일: 데이터 세트 설명, 클래스 및 기타 관련 정보를 포함합니다.
  6. 이미지 최적화 (선택 사항): 효율성을 위해 데이터 세트 크기를 줄입니다.
  7. 데이터 세트 압축: 데이터 세트를 zip 파일로 압축합니다.
  8. 문서화 및 PR: 데이터 세트를 설명하고 Ultralytics 기여 지침에 따라 Pull Request를 제출하세요.

자세한 내용은 새 데이터 세트 기여를 참조하세요.

데이터세트에 Ultralytics HUB를 사용해야 하는 이유는 무엇인가요?

Ultralytics HUB는 다음을 포함하여 데이터 세트 관리 및 분석을 위한 강력한 기능을 제공합니다.

  • 원활한 데이터 세트 관리: 데이터 세트를 한 곳에서 업로드, 구성 및 관리합니다.
  • 즉각적인 학습 통합: 추가 설정 없이 업로드된 데이터세트를 모델 학습에 직접 사용합니다.
  • 시각화 도구: 데이터 세트 이미지 및 주석을 탐색하고 시각화합니다.
  • 데이터세트 분석: 데이터세트 분포 및 특성에 대한 통찰력을 얻으십시오.

이 플랫폼은 데이터 세트 관리에서 모델 훈련으로의 전환을 간소화하여 전체 프로세스를 보다 효율적으로 만듭니다. Ultralytics HUB 데이터 세트에 대해 자세히 알아보십시오.

컴퓨터 비전을 위한 Ultralytics YOLO 모델의 고유한 기능은 무엇입니까?

Ultralytics YOLO 모델은 컴퓨터 비전 작업을 위한 몇 가지 고유한 기능을 제공합니다.

  • 실시간 성능: 시간에 민감한 애플리케이션을 위한 고속 추론 및 훈련 기능입니다.
  • 다재다능함: 통합 프레임워크에서 감지, 분할, 분류 및 자세 추정 작업을 지원합니다.
  • 사전 훈련된 모델: 다양한 애플리케이션을 위해 성능이 뛰어난 사전 훈련된 모델에 액세스하여 훈련 시간을 단축합니다.
  • 광범위한 커뮤니티 지원: 문제 해결 및 개발을 위한 활발한 커뮤니티와 포괄적인 문서가 제공됩니다.
  • 쉬운 통합: 기존 프로젝트 및 워크플로와 통합하기 위한 간단한 API를 제공합니다.

Ultralytics 모델 페이지에서 YOLO 모델에 대해 자세히 알아보세요.

Ultralytics 도구를 사용하여 데이터 세트를 최적화하고 압축하려면 어떻게 해야 합니까?

Ultralytics 도구를 사용하여 데이터 세트를 최적화하고 압축하려면 다음 예제 코드를 따르세요.

데이터 세트 최적화 및 압축

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

이 프로세스는 더욱 효율적인 저장과 빠른 다운로드 속도를 위해 데이터 세트 크기를 줄이는 데 도움이 됩니다. 데이터 세트 최적화 및 압축 방법에 대해 자세히 알아보세요.



📅 1년 전에 생성됨 ✏️ 3개월 전에 업데이트됨

댓글