콘텐츠로 건너뛰기

Ultralytics HUB 데이터세트

Ultralytics HUB 데이터 세트는 사용자 정의 데이터 세트를 관리하고 활용하기 위한 실용적인 솔루션입니다.

업로드된 데이터 세트는 즉시 모델 학습에 활용할 수 있습니다. 이 통합된 접근 방식은 데이터 세트 관리에서 모델 학습으로의 원활한 전환을 촉진하여 전체 프로세스를 크게 단순화합니다.


참고: Ultralytics HUB에 데이터세트 업로드 | 데이터세트 업로드 기능 완벽 안내

데이터세트 업로드

Ultralytics HUB 데이터 세트는 YOLOv5 및 YOLOv8 🚀 데이터 세트와 같습니다. 모든 것을 간단하게 유지하기 위해 동일한 구조와 동일한 레이블 형식을 사용합니다.

Ultralytics HUB에 데이터 세트를 업로드하기 전에 데이터 세트 YAML 파일을 데이터 세트 루트 디렉터리 안에 넣고 데이터 세트 YAML, 디렉터리 및 ZIP의 이름이 동일한지 확인하십시오. 아래 예와 같이 데이터 세트 디렉터리를 압축하십시오.

예를 들어, 데이터 세트 이름이 "coco8"인 경우, COCO8 예제 데이터 세트가 있다면 다음을 수행해야 합니다. coco8.yaml 자신의 내부 coco8/ 디렉터리를 입력하면 coco8.zip 압축된 경우:

zip -r coco8.zip coco8

COCO8 예제 데이터 세트를 다운로드하고 압축을 풀어 데이터 세트를 구성하는 방법을 정확히 확인할 수 있습니다.

COCO8 데이터 세트 구조

데이터 세트 YAML은 동일한 표준 YOLOv5 및 YOLOv8 YAML 형식입니다.

coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

데이터 세트를 압축한 후 Ultralytics HUB에 업로드하기 전에 유효성을 검사해야 합니다. Ultralytics HUB는 업로드 후 데이터 세트 유효성 검사를 수행하므로 데이터 세트가 올바르게 포맷되고 오류가 없는지 미리 확인하면 데이터 세트 거부로 인한 차질을 예방할 수 있습니다.

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

데이터 세트 ZIP 파일이 준비되면 사이드바에서 데이터 세트 버튼을 클릭하여 데이터 세트 페이지로 이동한 다음 페이지 오른쪽 상단의 데이터 세트 업로드 버튼을 클릭합니다.

사이드바의 데이터세트 버튼과 데이터세트 업로드 버튼을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

페이지에서 직접 데이터 세트를 업로드할 수 있습니다.

데이터세트 업로드 카드를 가리키는 화살표가 있는 Ultralytics HUB 홈 페이지 스크린샷

이 작업은 데이터 세트 업로드 대화 상자를 트리거합니다.

데이터 세트의 작업 유형을 선택하고 데이터 세트 .zip 파일 필드에 업로드합니다.

Ultralytics HUB 데이터 세트에 대한 사용자 지정 이름과 설명을 설정할 수 있는 추가 옵션이 있습니다.

데이터 세트 구성에 만족하면 업로드를 클릭합니다.

데이터세트 작업, 데이터세트 파일 및 업로드 버튼을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 업로드 대화 상자 스크린샷

데이터 세트가 업로드되고 처리되면 데이터 세트 페이지에서 액세스할 수 있습니다.

데이터세트 중 하나를 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터 세트의 이미지를 분할(학습, 유효성 검사, 테스트)별로 그룹화하여 볼 수 있습니다.

이미지 탭을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

각 이미지는 더 나은 시각화를 위해 확대할 수 있습니다.

확장 아이콘을 가리키는 화살표가 있는 데이터세트 페이지 내부의 이미지 탭의 Ultralytics HUB 스크린샷

이미지 중 하나가 확장된 데이터세트 페이지 내부의 이미지 탭의 Ultralytics HUB 스크린샷

또한 개요 탭을 클릭하여 데이터 세트를 분석할 수 있습니다.

개요 탭을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

다음으로, 데이터 세트에서 모델을 훈련합니다.

모델 훈련 버튼을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터 세트 다운로드

다운로드할 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 Download 옵션을 클릭합니다. 이 작업은 데이터 세트 다운로드를 시작합니다.

다운로드 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

Datasets 페이지에서 직접 데이터 세트를 다운로드할 수 있습니다.

데이터세트 중 하나의 다운로드 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터 세트 공유

정보

Ultralytics HUB의 공유 기능은 다른 사람과 데이터 세트를 공유하는 편리한 방법을 제공합니다. 이 기능은 기존 Ultralytics HUB 사용자와 아직 계정을 만들지 않은 사용자 모두를 수용하도록 설계되었습니다.

참고

데이터 세트에 대한 일반 액세스를 제어할 수 있습니다.

일반 액세스를 "Private"으로 설정할 수 있습니다. 이 경우 본인만 액세스할 수 있습니다. 또는 일반 액세스를 "Unlisted"로 설정하여 Ultralytics HUB 계정 유무에 관계없이 데이터 세트에 대한 직접 링크가 있는 모든 사람이 보기 권한을 갖도록 할 수 있습니다.

공유하려는 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 공유 옵션을 클릭합니다. 이 작업은 데이터 세트 공유 대화 상자를 트리거합니다.

공유 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터세트 페이지에서 직접 데이터세트를 공유할 수 있습니다.

데이터세트 중 하나의 공유 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

일반 액세스를 "Unlisted(미등록)"로 설정하고 Save(저장)를 클릭합니다.

Ultralytics HUB 데이터세트 공유 대화 상자 스크린샷. 화살표는 드롭다운과 저장 버튼을 가리킵니다.

이제 데이터 세트에 대한 직접 링크가 있는 사람은 누구나 데이터 세트를 볼 수 있습니다.

데이터 세트 공유 대화 상자에 표시된 데이터 세트 링크를 클릭하여 쉽게 복사할 수 있습니다.

Ultralytics HUB 데이터세트 공유 대화 상자 스크린샷. 화살표는 데이터세트 링크를 가리킵니다.

데이터세트 편집

편집하려는 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 편집 옵션을 클릭합니다. 이 작업은 데이터 세트 업데이트 대화 상자를 트리거합니다.

편집 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터 세트 페이지에서 직접 데이터 세트를 편집할 수 있습니다.

데이터세트 중 하나의 편집 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

데이터 세트에 원하는 수정 사항을 적용한 다음 저장을 클릭하여 변경 사항을 확인합니다.

저장 버튼을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 업데이트 대화 상자 스크린샷

데이터세트 삭제

삭제할 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 Delete 옵션을 클릭합니다. 이 작업은 데이터 세트를 삭제합니다.

삭제 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

Datasets 페이지에서 직접 데이터 세트를 삭제할 수 있습니다.

데이터세트 중 하나의 삭제 옵션을 가리키는 화살표가 있는 Ultralytics HUB 데이터세트 페이지 스크린샷

참고

마음이 바뀌면 휴지통 페이지에서 데이터 세트를 복원할 수 있습니다.

사이드바의 휴지통 버튼과 데이터세트 중 하나의 복원 옵션을 가리키는 화살표가 있는 Ultralytics HUB 휴지통 페이지 스크린샷



📅 1년 전에 생성됨 ✏️ 5개월 전에 업데이트됨

댓글