Ultralytics HUB 데이터세트
Ultralytics HUB 데이터 세트는 사용자 정의 데이터 세트를 관리하고 활용하기 위한 실용적인 솔루션입니다.
업로드된 데이터 세트는 즉시 모델 학습에 활용할 수 있습니다. 이 통합된 접근 방식은 데이터 세트 관리에서 모델 학습으로의 원활한 전환을 촉진하여 전체 프로세스를 크게 단순화합니다.
참고: Ultralytics HUB에 데이터세트 업로드 | 데이터세트 업로드 기능 완벽 안내
데이터세트 업로드
Ultralytics HUB 데이터 세트는 YOLOv5 및 YOLOv8 🚀 데이터 세트와 같습니다. 모든 것을 간단하게 유지하기 위해 동일한 구조와 동일한 레이블 형식을 사용합니다.
Ultralytics HUB에 데이터 세트를 업로드하기 전에 데이터 세트 YAML 파일을 데이터 세트 루트 디렉터리 안에 넣고 데이터 세트 YAML, 디렉터리 및 ZIP의 이름이 동일한지 확인하십시오. 아래 예와 같이 데이터 세트 디렉터리를 압축하십시오.
예를 들어, 데이터 세트 이름이 "coco8"인 경우, COCO8 예제 데이터 세트가 있다면 다음을 수행해야 합니다. coco8.yaml
자신의 내부 coco8/
디렉터리를 입력하면 coco8.zip
압축된 경우:
zip -r coco8.zip coco8
COCO8 예제 데이터 세트를 다운로드하고 압축을 풀어 데이터 세트를 구성하는 방법을 정확히 확인할 수 있습니다.
데이터 세트 YAML은 동일한 표준 YOLOv5 및 YOLOv8 YAML 형식입니다.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
데이터 세트를 압축한 후 Ultralytics HUB에 업로드하기 전에 유효성을 검사해야 합니다. Ultralytics HUB는 업로드 후 데이터 세트 유효성 검사를 수행하므로 데이터 세트가 올바르게 포맷되고 오류가 없는지 미리 확인하면 데이터 세트 거부로 인한 차질을 예방할 수 있습니다.
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
데이터 세트 ZIP 파일이 준비되면 사이드바에서 데이터 세트 버튼을 클릭하여 데이터 세트 페이지로 이동한 다음 페이지 오른쪽 상단의 데이터 세트 업로드 버튼을 클릭합니다.
이 작업은 데이터 세트 업로드 대화 상자를 트리거합니다.
데이터 세트의 작업 유형을 선택하고 데이터 세트 .zip 파일 필드에 업로드합니다.
Ultralytics HUB 데이터 세트에 대한 사용자 지정 이름과 설명을 설정할 수 있는 추가 옵션이 있습니다.
데이터 세트 구성에 만족하면 업로드를 클릭합니다.
데이터 세트가 업로드되고 처리되면 데이터 세트 페이지에서 액세스할 수 있습니다.
데이터 세트의 이미지를 분할(학습, 유효성 검사, 테스트)별로 그룹화하여 볼 수 있습니다.
팁
각 이미지는 더 나은 시각화를 위해 확대할 수 있습니다.
또한 개요 탭을 클릭하여 데이터 세트를 분석할 수 있습니다.
다음으로, 데이터 세트에서 모델을 훈련합니다.
데이터 세트 다운로드
다운로드할 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 Download 옵션을 클릭합니다. 이 작업은 데이터 세트 다운로드를 시작합니다.
데이터 세트 공유
정보
Ultralytics HUB의 공유 기능은 다른 사람과 데이터 세트를 공유하는 편리한 방법을 제공합니다. 이 기능은 기존 Ultralytics HUB 사용자와 아직 계정을 만들지 않은 사용자 모두를 수용하도록 설계되었습니다.
참고
데이터 세트에 대한 일반 액세스를 제어할 수 있습니다.
일반 액세스를 "Private"으로 설정할 수 있습니다. 이 경우 본인만 액세스할 수 있습니다. 또는 일반 액세스를 "Unlisted"로 설정하여 Ultralytics HUB 계정 유무에 관계없이 데이터 세트에 대한 직접 링크가 있는 모든 사람이 보기 권한을 갖도록 할 수 있습니다.
공유하려는 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 공유 옵션을 클릭합니다. 이 작업은 데이터 세트 공유 대화 상자를 트리거합니다.
일반 액세스를 "Unlisted(미등록)"로 설정하고 Save(저장)를 클릭합니다.
이제 데이터 세트에 대한 직접 링크가 있는 사람은 누구나 데이터 세트를 볼 수 있습니다.
팁
데이터 세트 공유 대화 상자에 표시된 데이터 세트 링크를 클릭하여 쉽게 복사할 수 있습니다.
데이터세트 편집
편집하려는 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 편집 옵션을 클릭합니다. 이 작업은 데이터 세트 업데이트 대화 상자를 트리거합니다.
데이터 세트에 원하는 수정 사항을 적용한 다음 저장을 클릭하여 변경 사항을 확인합니다.
데이터세트 삭제
삭제할 데이터 세트의 데이터 세트 페이지로 이동하여 데이터 세트 작업 드롭다운을 열고 Delete 옵션을 클릭합니다. 이 작업은 데이터 세트를 삭제합니다.