μ½˜ν…μΈ λ‘œ κ±΄λ„ˆλ›°κΈ°

HUB 데이터 μ„ΈνŠΈ

Ultralytics HUB 데이터 μ„ΈνŠΈλŠ” μ‚¬μš©μž 지정 데이터 μ„ΈνŠΈλ₯Ό κ΄€λ¦¬ν•˜κ³  ν™œμš©ν•˜κΈ° μœ„ν•œ μ‹€μš©μ μΈ μ†”λ£¨μ…˜μž…λ‹ˆλ‹€.

μ—…λ‘œλ“œλœ 데이터 μ„ΈνŠΈλŠ” μ¦‰μ‹œ λͺ¨λΈ ν•™μŠ΅μ— ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ 톡합 μ ‘κ·Ό 방식은 데이터 μ„ΈνŠΈ κ΄€λ¦¬μ—μ„œ λͺ¨λΈ ν›ˆλ ¨μœΌλ‘œ μ›ν™œν•˜κ²Œ μ „ν™˜ν•  수 μžˆλ„λ‘ μ§€μ›ν•˜μ—¬ 전체 ν”„λ‘œμ„ΈμŠ€λ₯Ό 크게 κ°„μ†Œν™”ν•©λ‹ˆλ‹€.



Watch: μ‹œμ²­ν•˜κΈ°: 보기: Ultralytics HUB에 데이터 μ„ΈνŠΈ μ—…λ‘œλ“œν•˜κΈ° | 데이터 μ„ΈνŠΈ μ—…λ‘œλ“œ κΈ°λŠ₯ 전체 μ‚΄νŽ΄λ³΄κΈ°

데이터 μ„ΈνŠΈ μ—…λ‘œλ“œ

Ultralytics HUB 데이터셋은 YOLOv5 및 YOLOv8 πŸš€ 데이터셋과 κ°™μŠ΅λ‹ˆλ‹€. λͺ¨λ“  것을 λ‹¨μˆœν•˜κ²Œ μœ μ§€ν•˜κΈ° μœ„ν•΄ λ™μΌν•œ ꡬ쑰와 λ™μΌν•œ λ ˆμ΄λΈ” ν˜•μ‹μ„ μ‚¬μš©ν•©λ‹ˆλ‹€.

Ultralytics HUB에 데이터셋을 μ—…λ‘œλ“œν•˜κΈ° 전에 μ•„λž˜ μ˜ˆμ‹œμ™€ 같이 데이터셋 루트 디렉토리에 데이터셋 YAML νŒŒμΌμ„ λ°°μΉ˜ν•˜κ³  데이터셋 YAML, 디렉토리 및 ZIP의 이름이 같은지 ν™•μΈν•œ λ‹€μŒ 데이터셋 디렉토리λ₯Ό μ••μΆ•ν•©λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄, 데이터 μ„ΈνŠΈμ˜ 이름이 "coco8"인 경우, λ‹Ήμ‚¬μ˜ COCO8 예제 데이터 집합을 μ‚¬μš©ν•˜λ €λ©΄ coco8.yaml λ‹Ήμ‹ μ˜ coco8/ 디렉토리λ₯Ό μƒμ„±ν•˜λ©΄ coco8.zip μ••μΆ•λœ 경우:

zip -r coco8.zip coco8

COCO8 예제 데이터 집합을 λ‹€μš΄λ‘œλ“œν•˜κ³  압좕을 ν’€λ©΄ 데이터 집합을 κ΅¬μ„±ν•˜λŠ” 방법을 μ •ν™•ν•˜κ²Œ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

COCO8 데이터 μ„ΈνŠΈ ꡬ쑰

데이터 μ„ΈνŠΈ YAML은 YOLOv5 및 YOLOv8 YAML ν˜•μ‹κ³Ό λ™μΌν•œ ν‘œμ€€μž…λ‹ˆλ‹€.

coco8.yaml

# Ultralytics YOLO πŸš€, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# β”œβ”€β”€ ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip

데이터셋을 μ••μΆ•ν•œ ν›„μ—λŠ” Ultralytics HUB에 μ—…λ‘œλ“œν•˜κΈ° 전에 λ°μ΄ν„°μ…‹μ˜ μœ νš¨μ„±μ„ 검사해야 ν•©λ‹ˆλ‹€. Ultralytics HUBλŠ” μ—…λ‘œλ“œ ν›„ 데이터 μ„ΈνŠΈ μœ νš¨μ„± 검사λ₯Ό μˆ˜ν–‰ν•˜λ―€λ‘œ, 데이터 μ„ΈνŠΈμ˜ ν˜•μ‹μ΄ μ˜¬λ°”λ₯΄κ³  였λ₯˜κ°€ μ—†λŠ”μ§€ 미리 ν™•μΈν•˜λ©΄ 데이터 μ„ΈνŠΈ κ±°λΆ€λ‘œ μΈν•œ μ°¨μ§ˆμ„ 방지할 수 μžˆμŠ΅λ‹ˆλ‹€.

from ultralytics.hub import check_dataset

check_dataset('path/to/coco8.zip')

데이터 집합 ZIP이 μ€€λΉ„λ˜λ©΄ μ‚¬μ΄λ“œλ°”μ—μ„œ 데이터 집합 λ²„νŠΌμ„ ν΄λ¦­ν•˜μ—¬ 데이터 집합 νŽ˜μ΄μ§€λ‘œ μ΄λ™ν•©λ‹ˆλ‹€.

Ultralytics μ‚¬μ΄λ“œλ°”μ˜ 데이터 μ„ΈνŠΈ λ²„νŠΌμ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” ν™ˆ νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

νŽ˜μ΄μ§€ 였λ₯Έμͺ½ μƒλ‹¨μ˜ 데이터 μ„ΈνŠΈ μ—…λ‘œλ“œ λ²„νŠΌμ„ ν΄λ¦­ν•©λ‹ˆλ‹€. 이 μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ©΄ 데이터 μ„ΈνŠΈ μ—…λ‘œλ“œ λŒ€ν™” μƒμžκ°€ νŠΈλ¦¬κ±°λ©λ‹ˆλ‹€.

Ultralytics 데이터 집합 μ—…λ‘œλ“œ λ²„νŠΌμ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터셋 .zip 파일 ν•„λ“œμ— 데이터셋을 μ—…λ‘œλ“œν•©λ‹ˆλ‹€.

Ultralytics ν—ˆλΈŒ 데이터 μ§‘ν•©μ˜ μ‚¬μš©μž 지정 이름과 μ„€λͺ…을 μ„€μ •ν•  수 μžˆλŠ” μΆ”κ°€ μ˜΅μ…˜μ΄ μžˆμŠ΅λ‹ˆλ‹€.

데이터 μ„ΈνŠΈ ꡬ성이 만쑱슀러우면 μ—…λ‘œλ“œλ₯Ό ν΄λ¦­ν•©λ‹ˆλ‹€.

Ultralytics μ—…λ‘œλ“œ λ²„νŠΌμ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 μ—…λ‘œλ“œ λŒ€ν™” μƒμžμ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터 μ„ΈνŠΈκ°€ μ—…λ‘œλ“œλ˜κ³  처리되면 데이터 μ„ΈνŠΈ νŽ˜μ΄μ§€μ—μ„œ 데이터 μ„ΈνŠΈμ— μ•‘μ„ΈμŠ€ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics 데이터 집합 쀑 ν•˜λ‚˜λ₯Ό κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터 μ„ΈνŠΈμ˜ 이미지λ₯Ό μŠ€ν”Œλ¦Ώ(ν•™μŠ΅, 검증, ν…ŒμŠ€νŠΈ)λ³„λ‘œ κ·Έλ£Ήν™”ν•˜μ—¬ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics 이미지 탭을 κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

팁

각 이미지λ₯Ό ν™•λŒ€ν•˜μ—¬ 더 잘 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics ν™•μž₯ μ•„μ΄μ½˜μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€ λ‚΄ 이미지 νƒ­μ˜ HUB μŠ€ν¬λ¦°μƒ·

Ultralytics 이미지 쀑 ν•˜λ‚˜κ°€ ν™•μž₯된 데이터 집합 νŽ˜μ΄μ§€ λ‚΄ 이미지 νƒ­μ˜ HUB μŠ€ν¬λ¦°μƒ·

λ˜ν•œ κ°œμš” 탭을 ν΄λ¦­ν•˜μ—¬ 데이터 집합을 뢄석할 μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics κ°œμš” 탭을 κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

λ‹€μŒμœΌλ‘œ, 데이터 μ„ΈνŠΈμ— λŒ€ν•œ λͺ¨λΈμ„ ν•™μŠ΅μ‹œν‚΅λ‹ˆλ‹€.

Ultralytics λͺ¨λΈ ν›ˆλ ¨ λ²„νŠΌμ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터 집합 곡유

정보

Ultralytics HUB의 곡유 κΈ°λŠ₯은 λ‹€λ₯Έ μ‚¬λžŒλ“€κ³Ό 데이터 μ„ΈνŠΈλ₯Ό νŽΈλ¦¬ν•˜κ²Œ κ³΅μœ ν•  수 μžˆλŠ” 방법을 μ œκ³΅ν•©λ‹ˆλ‹€. 이 κΈ°λŠ₯은 κΈ°μ‘΄ Ultralytics HUB μ‚¬μš©μžμ™€ 아직 계정을 λ§Œλ“€μ§€ μ•Šμ€ μ‚¬μš©μž λͺ¨λ‘λ₯Ό μˆ˜μš©ν•  수 μžˆλ„λ‘ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

μ°Έκ³ 

데이터 μ„ΈνŠΈμ˜ 일반 μ•‘μ„ΈμŠ€λ₯Ό μ œμ–΄ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

일반 μ•‘μ„ΈμŠ€λ₯Ό "λΉ„κ³΅κ°œ"둜 μ„€μ •ν•  수 있으며, 이 경우 본인만 μ•‘μ„ΈμŠ€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ˜λŠ” 일반 μ•‘μ„ΈμŠ€λ₯Ό "λΉ„κ³΅κ°œ"둜 μ„€μ •ν•˜μ—¬ Ultralytics HUB 계정이 μžˆλŠ”μ§€ 여뢀에 관계없이 데이터 집합에 λŒ€ν•œ 직접 링크λ₯Ό 가진 λͺ¨λ“  μ‚¬λžŒμ—κ²Œ 보기 μ•‘μ„ΈμŠ€ κΆŒν•œμ„ λΆ€μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

κ³΅μœ ν•˜λ €λŠ” 데이터 μ§‘ν•©μ˜ 데이터 집합 νŽ˜μ΄μ§€λ‘œ μ΄λ™ν•˜μ—¬ 데이터 집합 μž‘μ—… λ“œλ‘­λ‹€μš΄μ„ μ—΄κ³  곡유 μ˜΅μ…˜μ„ ν΄λ¦­ν•©λ‹ˆλ‹€. 이 μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ©΄ 데이터 집합 곡유 λŒ€ν™” μƒμžκ°€ νŠΈλ¦¬κ±°λ©λ‹ˆλ‹€.

Ultralytics 곡유 μ˜΅μ…˜μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

팁

데이터 μ„ΈνŠΈ νŽ˜μ΄μ§€μ—μ„œ 직접 데이터 μ„ΈνŠΈλ₯Ό κ³΅μœ ν•  μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics 데이터 집합 쀑 ν•˜λ‚˜μ˜ 곡유 μ˜΅μ…˜μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

일반 μ•‘μ„ΈμŠ€ κΆŒν•œμ„ 'λΉ„κ³΅κ°œ'둜 μ„€μ •ν•˜κ³  μ €μž₯을 ν΄λ¦­ν•©λ‹ˆλ‹€.

Ultralytics λ“œλ‘­λ‹€μš΄μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œμ™€ μ €μž₯ λ²„νŠΌμ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 곡유 λŒ€ν™” μƒμžμ˜ HUB μŠ€ν¬λ¦°μƒ·μž…λ‹ˆλ‹€.

이제 데이터 집합에 λŒ€ν•œ 직접 링크가 μžˆλŠ” μ‚¬λžŒμ€ λˆ„κ΅¬λ‚˜ 데이터 집합을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

팁

데이터 집합 곡유 λŒ€ν™” μƒμžμ— ν‘œμ‹œλœ 데이터 μ§‘ν•©μ˜ 링크λ₯Ό ν΄λ¦­ν•˜μ—¬ μ‰½κ²Œ 볡사할 수 μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics 데이터 μ§‘ν•©μ˜ 링크λ₯Ό κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 곡유 λŒ€ν™” μƒμžμ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터 μ„ΈνŠΈ νŽΈμ§‘/μ‚­μ œ

νŽΈμ§‘ν•˜λ €λŠ” 데이터 μ§‘ν•©μ˜ 데이터 집합 νŽ˜μ΄μ§€λ‘œ μ΄λ™ν•˜μ—¬ 데이터 집합 μž‘μ—… λ“œλ‘­λ‹€μš΄μ„ μ—΄κ³  νŽΈμ§‘ μ˜΅μ…˜μ„ ν΄λ¦­ν•©λ‹ˆλ‹€. 이 μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ©΄ 데이터 집합 μ—…λ°μ΄νŠΈ λŒ€ν™” μƒμžκ°€ νŠΈλ¦¬κ±°λ©λ‹ˆλ‹€.

Ultralytics νŽΈμ§‘ 및 μ‚­μ œ μ˜΅μ…˜μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” 데이터 집합 νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·

데이터 집합에 μ›ν•˜λŠ” μˆ˜μ • 사항을 μ μš©ν•œ λ‹€μŒ μ €μž₯을 ν΄λ¦­ν•˜μ—¬ λ³€κ²½ 사항을 ν™•μΈν•©λ‹ˆλ‹€.

μ‚­μ œν•˜λ €λŠ” 데이터 μ§‘ν•©μ˜ 데이터 집합 νŽ˜μ΄μ§€λ‘œ μ΄λ™ν•˜μ—¬ 데이터 집합 μž‘μ—… λ“œλ‘­λ‹€μš΄μ„ μ—΄κ³  μ‚­μ œ μ˜΅μ…˜μ„ ν΄λ¦­ν•©λ‹ˆλ‹€. 이 μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ©΄ 데이터 집합이 μ‚­μ œλ©λ‹ˆλ‹€.

μ°Έκ³ 

마음이 λ°”λ€Œλ©΄ νœ΄μ§€ν†΅ νŽ˜μ΄μ§€μ—μ„œ 데이터 집합을 볡원할 수 μžˆμŠ΅λ‹ˆλ‹€.

Ultralytics 데이터 집합 쀑 ν•˜λ‚˜μ˜ 볡원 μ˜΅μ…˜μ„ κ°€λ¦¬ν‚€λŠ” ν™”μ‚΄ν‘œκ°€ μžˆλŠ” νœ΄μ§€ν†΅ νŽ˜μ΄μ§€μ˜ HUB μŠ€ν¬λ¦°μƒ·



생성 2023-11-12, μ—…λ°μ΄νŠΈ 2024-02-13
μž‘μ„±μž: glenn-jocher (4), priytosh-tripathi (1), RizwanMunawar (1), sergiuwaxmann (1), Laughing-q (1)

λŒ“κΈ€