Ultralytics HUB 데이터 세트
Ultralytics HUB 데이터 세트는 사용자 지정 데이터 세트를 관리하고 활용하기 위한 실용적인 솔루션입니다.
업로드된 데이터 세트는 즉시 모델 학습에 활용할 수 있습니다. 이러한 통합 접근 방식은 데이터 세트 관리에서 모델 훈련으로 원활하게 전환할 수 있도록 지원하여 전체 프로세스를 크게 간소화합니다.
Watch: Ultralytics HUB에 데이터 세트 업로드하기 | 데이터 세트 업로드 기능 전체 살펴보기
데이터 세트 업로드
Ultralytics HUB 데이터셋은 YOLOv5 및 YOLOv8 🚀 데이터셋과 같습니다. 모든 것을 단순하게 유지하기 위해 동일한 구조와 동일한 레이블 형식을 사용합니다.
Ultralytics HUB에 데이터셋을 업로드하기 전에 아래 예시와 같이 데이터셋 루트 디렉토리에 데이터셋 YAML 파일을 배치하고 데이터셋 YAML, 디렉토리 및 ZIP의 이름이 같은지 확인한 다음 데이터셋 디렉토리를 압축합니다.
예를 들어, 데이터 세트의 이름이 "coco8"인 경우, 당사의 COCO8 예제 데이터 집합을 사용하려면 coco8.yaml
당신의 coco8/
디렉토리를 생성하면 coco8.zip
압축된 경우:
COCO8 예제 데이터 집합을 다운로드하고 압축을 풀면 데이터 집합을 구성하는 방법을 정확하게 확인할 수 있습니다.
데이터 세트 YAML은 YOLOv5 및 YOLOv8 YAML 형식과 동일한 표준입니다.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
데이터셋을 압축한 후에는 Ultralytics HUB에 업로드하기 전에 데이터셋의 유효성을 검사해야 합니다. Ultralytics HUB는 업로드 후 데이터 세트 유효성 검사를 수행하므로, 데이터 세트의 형식이 올바르고 오류가 없는지 미리 확인하면 데이터 세트 거부로 인한 차질을 방지할 수 있습니다.
데이터 세트 ZIP이 준비되면 사이드바에서 데이터 세트 버튼을 클릭하여 데이터 세트 페이지로 이동한 다음 페이지 오른쪽 상단의 데이터 세트 업로드 버튼을 클릭합니다.
이 작업을 수행하면 데이터 세트 업로드 대화 상자가 트리거됩니다.
데이터 세트의 데이터 세트 작업을 선택하고 데이터 세트 .zip 파일 필드에 업로드합니다.
Ultralytics 허브 데이터 집합의 사용자 지정 이름과 설명을 설정할 수 있는 추가 옵션이 있습니다.
데이터 세트 구성이 만족스러우면 업로드를 클릭합니다.
데이터 세트가 업로드되고 처리되면 데이터 세트 페이지에서 데이터 세트에 액세스할 수 있습니다.
데이터 세트의 이미지를 스플릿(학습, 검증, 테스트)별로 그룹화하여 볼 수 있습니다.
팁
각 이미지를 확대하여 더 잘 볼 수 있습니다.
또한 개요 탭을 클릭하여 데이터 집합을 분석할 수도 있습니다.
다음으로, 데이터 세트에 대한 모델을 학습시킵니다.
데이터 세트 다운로드
다운로드하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 다운로드 옵션을 클릭합니다. 이 작업을 클릭하면 데이터 세트 다운로드가 시작됩니다.
데이터 집합 공유
정보
Ultralytics HUB의 공유 기능은 다른 사람들과 데이터 세트를 편리하게 공유할 수 있는 방법을 제공합니다. 이 기능은 기존 Ultralytics HUB 사용자와 아직 계정을 만들지 않은 사용자 모두를 수용할 수 있도록 설계되었습니다.
참고
데이터 세트의 일반 액세스를 제어할 수 있습니다.
일반 액세스를 "비공개"로 설정할 수 있으며, 이 경우 본인만 액세스할 수 있습니다. 또는 일반 액세스를 "비공개"로 설정하여 Ultralytics HUB 계정이 있는지 여부에 관계없이 데이터 집합에 대한 직접 링크가 있는 모든 사람에게 보기 액세스 권한을 부여할 수 있습니다.
공유하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 공유 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합 공유 대화 상자가 트리거됩니다.
일반 액세스 권한을 '비공개'로 설정하고 저장을 클릭합니다.
이제 데이터 집합에 대한 직접 링크가 있는 사람은 누구나 데이터 집합을 볼 수 있습니다.
팁
데이터 집합 공유 대화 상자에 표시된 데이터 집합의 링크를 클릭하여 쉽게 복사할 수 있습니다.
데이터 집합 편집
편집하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 편집 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합 업데이트 대화 상자가 트리거됩니다.
데이터 집합에 원하는 수정 사항을 적용한 다음 저장을 클릭하여 변경 사항을 확인합니다.
데이터 집합 삭제
삭제하려는 데이터 집합의 데이터 집합 페이지로 이동하여 데이터 집합 작업 드롭다운을 열고 삭제 옵션을 클릭합니다. 이 작업을 수행하면 데이터 집합이 삭제됩니다.