콘텐츠로 건너뛰기

Ultralytics HUB 데이터 세트

Ultralytics HUB 데이터 세트는 사용자 지정 데이터 세트를 관리하고 활용하기 위한 실용적인 솔루션입니다.

업로드된 데이터 세트는 즉시 모델 학습에 활용할 수 있습니다. 이러한 통합 접근 방식은 데이터 세트 관리에서 모델 훈련으로 원활하게 전환할 수 있도록 지원하여 전체 프로세스를 크게 간소화합니다.


Watch: Ultralytics HUB에 데이터 세트 업로드하기 | 데이터 세트 업로드 기능 전체 살펴보기

데이터 세트 업로드

Ultralytics HUB 데이터셋은 YOLOv5 및 YOLOv8 🚀 데이터셋과 같습니다. 모든 것을 단순하게 유지하기 위해 동일한 구조와 동일한 레이블 형식을 사용합니다.

Ultralytics HUB에 데이터셋을 업로드하기 전에 아래 예시와 같이 데이터셋 루트 디렉토리에 데이터셋 YAML 파일을 배치하고 데이터셋 YAML, 디렉토리 및 ZIP의 이름이 같은지 확인한 다음 데이터셋 디렉토리를 압축합니다.

예를 들어, 데이터 세트의 이름이 "coco8"인 경우, 당사의 COCO8 예제 데이터 집합을 사용하려면 coco8.yaml 당신의 coco8/ 디렉토리를 생성하면 coco8.zip 압축된 경우:

zip -r coco8.zip coco8

COCO8 예제 데이터 집합을 다운로드하고 압축을 풀면 데이터 집합을 구성하는 방법을 정확하게 확인할 수 있습니다.

COCO8 데이터 세트 구조

데이터 세트 YAML은 YOLOv5 및 YOLOv8 YAML 형식과 동일한 표준입니다.

coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

데이터셋을 압축한 후에는 Ultralytics HUB에 업로드하기 전에 데이터셋의 유효성을 검사해야 합니다. Ultralytics HUB는 업로드 후 데이터 세트 유효성 검사를 수행하므로, 데이터 세트의 형식이 올바르고 오류가 없는지 미리 확인하면 데이터 세트 거부로 인한 차질을 방지할 수 있습니다.

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

데이터 세트 ZIP이 준비되면 사이드바에서 데이터 세트 버튼을 클릭하여 데이터 세트 페이지로 이동한 다음 페이지 오른쪽 상단의 데이터 세트 업로드 버튼을 클릭합니다.

Ultralytics 사이드바의 데이터 집합 버튼을 가리키는 화살표와 데이터 집합 업로드 버튼을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷입니다.

페이지에서 바로 데이터 집합을 업로드할 수 있습니다.

Ultralytics 데이터 세트 업로드 카드를 가리키는 화살표가 있는 홈 페이지의 HUB 스크린샷

이 작업을 수행하면 데이터 세트 업로드 대화 상자가 트리거됩니다.

데이터 세트의 데이터 세트 작업을 선택하고 데이터 세트 .zip 파일 필드에 업로드합니다.

Ultralytics 허브 데이터 집합의 사용자 지정 이름과 설명을 설정할 수 있는 추가 옵션이 있습니다.

데이터 세트 구성이 만족스러우면 업로드를 클릭합니다.

Ultralytics 데이터 집합 작업, 데이터 집합 파일 및 업로드 버튼을 가리키는 화살표가 있는 데이터 집합 업로드 대화 상자의 HUB 스크린샷

데이터 세트가 업로드되고 처리되면 데이터 세트 페이지에서 데이터 세트에 액세스할 수 있습니다.

Ultralytics 데이터 집합 중 하나를 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 세트의 이미지를 스플릿(학습, 검증, 테스트)별로 그룹화하여 볼 수 있습니다.

Ultralytics 이미지 탭을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

각 이미지를 확대하여 더 잘 볼 수 있습니다.

Ultralytics 확장 아이콘을 가리키는 화살표가 있는 데이터 집합 페이지 내 이미지 탭의 HUB 스크린샷

Ultralytics 이미지 중 하나가 확장된 데이터 집합 페이지 내 이미지 탭의 HUB 스크린샷

또한 개요 탭을 클릭하여 데이터 집합을 분석할 수도 있습니다.

Ultralytics 개요 탭을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

다음으로, 데이터 세트에 대한 모델을 학습시킵니다.

Ultralytics 모델 훈련 버튼을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 세트 다운로드

다운로드하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 다운로드 옵션을 클릭합니다. 이 작업을 클릭하면 데이터 세트 다운로드가 시작됩니다.

Ultralytics 다운로드 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 세트 페이지에서 직접 데이터 세트를 다운로드할 수 있습니다.

Ultralytics 데이터 집합 중 하나의 다운로드 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 집합 공유

정보

Ultralytics HUB의 공유 기능은 다른 사람들과 데이터 세트를 편리하게 공유할 수 있는 방법을 제공합니다. 이 기능은 기존 Ultralytics HUB 사용자와 아직 계정을 만들지 않은 사용자 모두를 수용할 수 있도록 설계되었습니다.

참고

데이터 세트의 일반 액세스를 제어할 수 있습니다.

일반 액세스를 "비공개"로 설정할 수 있으며, 이 경우 본인만 액세스할 수 있습니다. 또는 일반 액세스를 "비공개"로 설정하여 Ultralytics HUB 계정이 있는지 여부에 관계없이 데이터 집합에 대한 직접 링크가 있는 모든 사람에게 보기 액세스 권한을 부여할 수 있습니다.

공유하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 공유 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합 공유 대화 상자가 트리거됩니다.

Ultralytics 공유 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 세트 페이지에서 바로 데이터 세트를 공유할 수 있습니다.

Ultralytics 데이터 집합 중 하나의 공유 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

일반 액세스 권한을 '비공개'로 설정하고 저장을 클릭합니다.

Ultralytics 드롭다운을 가리키는 화살표와 저장 버튼을 가리키는 화살표가 있는 데이터 집합 공유 대화 상자의 HUB 스크린샷입니다.

이제 데이터 집합에 대한 직접 링크가 있는 사람은 누구나 데이터 집합을 볼 수 있습니다.

데이터 집합 공유 대화 상자에 표시된 데이터 집합의 링크를 클릭하여 쉽게 복사할 수 있습니다.

Ultralytics 데이터 집합의 링크를 가리키는 화살표가 있는 데이터 집합 공유 대화 상자의 HUB 스크린샷

데이터 집합 편집

편집하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 편집 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합 업데이트 대화 상자가 트리거됩니다.

Ultralytics 편집 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 세트 페이지에서 직접 데이터 세트를 편집할 수 있습니다.

Ultralytics 데이터 집합 중 하나의 편집 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 집합에 원하는 수정 사항을 적용한 다음 저장을 클릭하여 변경 사항을 확인합니다.

Ultralytics 저장 버튼을 가리키는 화살표가 있는 데이터 집합 업데이트 대화 상자의 HUB 스크린샷

데이터 집합 삭제

삭제하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 삭제 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합이 삭제됩니다.

Ultralytics 삭제 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

데이터 집합 페이지에서 바로 데이터 집합을 삭제할 수 있습니다.

Ultralytics 데이터 집합 중 하나의 삭제 옵션을 가리키는 화살표가 있는 데이터 집합 페이지의 HUB 스크린샷

참고

마음이 바뀌면 휴지통 페이지에서 데이터 집합을 복원할 수 있습니다.

Ultralytics 사이드바의 휴지통 버튼을 가리키는 화살표와 데이터 집합 중 하나의 복원 옵션을 가리키는 화살표가 있는 휴지통 페이지의 HUB 스크린샷입니다.

📅1 년 전 생성됨 ✏️ 업데이트됨 8 일 전

댓글