데이터셋
Ultralytics Platform 데이터셋은 학습 데이터를 효율적으로 관리하기 위한 최적화된 솔루션을 제공합니다. 업로드 후 플랫폼은 이미지, 라벨, 통계를 자동으로 처리합니다. 처리가 완료되고 train 분할에 최소 한 개의 이미지, val 또는 test 분할에 최소 한 개의 이미지, 최소 한 개의 라벨링된 이미지, 그리고 총 최소 두 개의 이미지가 포함되면 데이터셋을 학습에 사용할 수 있습니다.
데이터셋 업로드
Ultralytics Platform은 유연성을 위해 다양한 업로드 형식을 지원합니다.
지원되는 형식
| 형식 | 확장자 | 참고 사항 | 최대 크기 |
|---|---|---|---|
| JPEG | .jpg, .jpeg | 가장 일반적이며 권장되는 형식 | 50 MB |
| PNG | .png | 투명도 지원 | 50 MB |
| WebP | .webp | 최신형식, 우수한 압축률 | 50 MB |
| BMP | .bmp | 비압축 | 50 MB |
| TIFF | .tiff, .tif | 고품질 | 50 MB |
| HEIC | .heic | iPhone 사진 | 50 MB |
| AVIF | .avif | 차세대 형식 | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Raw 카메라 | 50 MB |
| MPO | .mpo | Multi-picture object | 50 MB |
데이터셋 준비하기
플랫폼은 Ultralytics YOLO, COCO, Ultralytics NDJSON 및 Raw(라벨링되지 않은) 업로드를 지원합니다:
data.yaml 파일과 함께 표준 YOLO 디렉토리 구조를 사용하십시오:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlYAML 파일은 데이터셋 구성을 정의합니다:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogRaw: 라벨링되지 않은 이미지(라벨 없음)를 업로드합니다. 어노테이션 에디터를 사용하여 플랫폼에서 직접 라벨링을 수행하려는 경우 유용합니다.
명시적인 분할 폴더 없이 이미지를 업로드할 수도 있습니다. 플랫폼은 업로드 중 활성 분할 대상을 준수하며, 분류 데이터셋이 아닌 경우 분할 정보가 제공되지 않으면 학습 세트의 일부에서 자동으로 검증 분할을 생성할 수 있습니다. 나중에 대량 이동 또는 분할 재배포 기능을 통해 언제든지 이미지를 다시 할당할 수 있습니다.
The format is detected automatically: datasets with a data.yaml containing names, train, or val keys are treated as YOLO. Datasets with COCO JSON files (containing images, annotations, and categories arrays) are treated as COCO. .ndjson exports are imported as Ultralytics NDJSON. Datasets with only images and no annotations are treated as raw.
작업별 형식 세부 정보는 지원되는 작업 및 데이터셋 개요를 참조하십시오.
업로드 과정
- 사이드바에서
Datasets로 이동 New Dataset을 클릭하거나 업로드 영역으로 파일 드래그- 작업 유형 선택(지원되는 작업 참조)
- 이름과 선택적 설명 추가
- 가시성(공개 또는 비공개) 및 선택적 라이선스 설정(사용 가능한 라이선스 참조)
Create클릭

업로드 후 플랫폼은 다단계 파이프라인을 통해 데이터를 처리합니다:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- 검증(Validation): 형식 및 크기 확인
- 정규화(Normalization): 대형 이미지 크기 조정(최대 4096px, 최소 치수 28px)
- 썸네일(Thumbnails): 256px WebP 미리보기 생성
- 라벨 파싱(Label Parsing): YOLO 및 COCO 형식 라벨 추출
- 통계(Statistics): 클래스 분포 및 이미지 치수 계산

업로드 전 검증
업로드하기 전에 로컬에서 데이터셋을 검증할 수 있습니다:
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")이미지는 가장 짧은 쪽이 최소 28px 이상이어야 합니다. 이보다 작은 이미지는 처리 중에 거부됩니다. 가장 긴 쪽이 4096px보다 큰 이미지는 가로세로 비율을 유지하면서 자동으로 크기가 조정됩니다.
이미지 탐색
다양한 레이아웃으로 데이터셋 이미지를 확인하십시오.
갤러리 툴바에서 클러스터링(Clustering) 패널을 열어 대화형 2D 산점도로 데이터셋을 탐색하십시오.
| 보기 | 설명 |
|---|---|
| 그리드(Grid) | 어노테이션 오버레이가 포함된 썸네일 그리드(기본값) |
| 컴팩트(Compact) | 빠른 스캔을 위한 더 작은 썸네일 |
| 테이블(Table) | 썸네일, 파일명, 치수, 크기, 분할, 클래스 및 라벨 개수가 포함된 목록 |

정렬 및 필터링
이미지를 정렬하고 필터링하여 효율적으로 탐색할 수 있습니다:
| 정렬 | 설명 |
|---|---|
| 최신순 / 오래된순 | 업로드 / 생성 순서 |
| 이름 A-Z / Z-A | 파일명 알파벳순 |
| 높이 ↑/↓ | 이미지 높이 (픽셀 단위) |
| 너비 ↑/↓ | 이미지 너비 (픽셀 단위) |
| 크기 ↑/↓ | 디스크상의 파일 크기 |
| 주석 ↑/↓ | 이미지당 주석 개수 |
100,000개 이상의 이미지를 포함하는 데이터셋의 경우, 갤러리 응답 속도를 유지하기 위해 이름, 크기, 너비, 높이별 정렬 기능이 비활성화됩니다. 최신순, 오래된순, 주석 개수순 정렬은 계속 사용할 수 있습니다.
라벨 필터를 Unlabeled로 설정하여 아직 주석이 필요한 이미지를 빠르게 찾을 수 있습니다. 이는 라벨링 진행 상황을 추적하려는 대규모 데이터셋에서 특히 유용합니다.
전체 화면 뷰어
이미지를 클릭하면 다음 기능을 포함한 전체 화면 뷰어가 열립니다:
- 탐색: 화살표 키 또는 썸네일 미리보기를 사용하여 탐색
- 메타데이터: 파일 이름, 크기, 분할 배지, 주석 개수
- 주석: 주석 오버레이 표시 여부 전환
- 클래스 분석: 색상 표시기가 있는 클래스별 라벨 개수
- 편집: 주석 모드로 진입하여 라벨 추가 또는 수정
- 다운로드: 원본 이미지 파일 다운로드
- 삭제: 데이터셋에서 이미지 삭제
- 줌:
Cmd/Ctrl+Scroll,Cmd/Ctrl++또는Cmd/Ctrl+=로 확대,Cmd/Ctrl+-로 축소 - 보기 초기화:
Cmd/Ctrl + 0또는 초기화 버튼을 눌러 이미지를 뷰어에 맞춤 - 팬(이동):
Space키를 누른 상태에서 드래그하여 확대된 캔버스 이동 - 픽셀 보기: 근접 검사를 위해 픽셀화된 렌더링 전환

분할별 필터링
데이터셋 분할별로 이미지 필터링:
| Split | 목적 |
|---|---|
| 학습(Train) | 모델 학습에 사용 |
| Val | 학습 중 검증에 사용 |
| Test | 최종 평가에 사용 |
클러스터링
Clustering 패널은 데이터셋을 대화형 2D 산점도로 투영하여 시각적으로 유사한 이미지를 가까이 배치합니다. 이를 사용하여 갤러리를 벗어나지 않고도 클러스터를 발견하고, 중복 및 이상치를 식별하며, 데이터 전반에 걸쳐 분할 또는 클래스가 어떻게 분포되어 있는지 확인할 수 있습니다. 데이터셋 페이지의 갤러리 툴바에 있는 산점도 아이콘에서 열 수 있습니다.

분석 실행
분석 시작:
- 데이터셋을 열고 갤러리 툴바의 산점도 아이콘을 클릭합니다
Analyze Dataset을 클릭합니다- 진행률 표시줄이 완료될 때까지 기다리면 결과가 동일한 패널에 나타납니다
분석은 백그라운드에서 실행되며 데이터셋 크기에 따라 몇 분 정도 걸릴 수 있습니다. 패널을 닫거나 페이지를 떠났다가 나중에 돌아와도 됩니다.
시각화
분석이 완료되면 패널에 분석된 모든 이미지의 2D 산점도가 표시됩니다. 갤러리 필터(분할, 클래스, 라벨링 완료/미완료)를 사용하면 필터링되지 않은 점들이 흐려져 관심 있는 하위 집합에 집중할 수 있습니다.

색상 기준(Color By)
패널 툴바의 Color by 드롭다운을 사용하여 데이터 포인트의 음영 처리 방식을 변경하십시오. 언제든지 보기 모드를 전환하면 플롯이 즉시 다시 색칠되어 분할, 클래스 또는 이미지 속성이 클러스터 전반에 어떻게 분포되어 있는지 확인할 수 있습니다:
| 옵션 | 음영 |
|---|---|
| Splits | Train / Val / Test |
| 클래스 | 각 이미지의 첫 번째 주석 클래스 |
| Width | 이미지 너비 |
| Height | 이미지 높이 |
| Size | 파일 크기 |
| 주석 | 이미지당 주석 개수 |

올가미(Lasso) 선택
영역 주위에 자유로운 형태의 선택을 그려 플롯상의 점들을 강조합니다. 갤러리는 일치하는 이미지로 필터링되므로, 일반적인 이미지 작업을 사용하여 이미지를 검사, 재라벨링, 이동 또는 삭제할 수 있습니다.
차트 위의 칩에 선택된 점의 개수가 표시됩니다. ×를 클릭하여 올가미를 해제하고 전체 갤러리 보기로 돌아갑니다.
팬 및 줌
마우스와 키보드를 사용하여 대규모 산점도를 직접 탐색하십시오:
| 입력 | 작업 |
|---|---|
| 스크롤 | 플롯을 2D로 이동(팬) |
| Cmd/Ctrl+스크롤 | 커서를 기준으로 확대 또는 축소 |
| Space 키 누름 | 드래그하여 이동 모드로 전환 |
재분석
분석 후 데이터셋이 변경되면 소유자와 편집자에게 패널 상단에 Re-analyze 버튼이 나타납니다.
Re-analyze를 클릭하여 임베딩과 2D 투영을 처음부터 다시 계산하십시오.
데이터셋 탭
각 데이터셋 페이지는 데이터셋 상태 및 권한에 따라 최대 6개의 탭을 표시할 수 있습니다:
이미지 탭
주석 오버레이가 포함된 이미지 갤러리를 보여주는 기본 보기입니다. 그리드, 콤팩트 및 테이블 보기 모드를 지원합니다. 여기에 파일을 드래그 앤 드롭하여 이미지를 추가할 수 있습니다.
클래스 탭
이 탭은 데이터셋에 이미지가 있을 때 나타납니다.
데이터셋의 주석 클래스 관리:
- 클래스 히스토그램: 선형/로그 스케일 전환 기능이 있는 클래스별 주석 개수 막대 차트
- 클래스 테이블: 클래스 이름, 라벨 개수, 이미지 개수로 정렬 및 검색 가능한 테이블
- 클래스 이름 편집: 클래스 이름을 클릭하여 인라인으로 이름 변경
- 클래스 색상 편집: 색상 견본을 클릭하여 클래스 색상 변경
- 새 클래스 추가: 하단의 입력을 사용하여 클래스 추가

데이터셋에 클래스 불균형이 있는 경우(예: "person" 주석은 10,000개인데 "bicycle"은 50개뿐인 경우), 클래스 히스토그램의 Log Scale 토글을 사용하여 모든 클래스를 명확하게 시각화하십시오.
차트 탭
이 탭은 데이터셋에 이미지가 있을 때 나타납니다.
데이터셋에서 자동으로 계산된 통계 정보:
| 차트 | 설명 |
|---|---|
| 데이터셋 분할(Split) 분포 | 학습/검증/테스트 이미지 수 및 라벨링된 퍼센트를 보여주는 도넛 차트 |
| 상위 클래스 | 가장 빈도가 높은 10개 어노테이션 클래스를 보여주는 도넛 차트 |
| 이미지 너비 | 평균값을 포함한 이미지 너비 분포 히스토그램 |
| 이미지 높이 | 평균값을 포함한 이미지 높이 분포 히스토그램 |
| 인스턴스당 포인트 | 어노테이션당 폴리곤 정점 또는 키포인트 개수(세그먼트/포즈) |
| 어노테이션 위치 | BBox 중심 위치를 나타내는 2D 히트맵 |
| 이미지 규격 | 종횡비 가이드라인이 포함된 너비 대 높이 2D 히트맵 |

통계 정보는 5분 동안 캐시됩니다. 어노테이션 변경 사항은 캐시가 만료된 후 반영됩니다.
히트맵의 확장 버튼을 클릭하면 전체 화면 모드로 볼 수 있습니다. 더 크고 상세한 뷰를 제공하므로 대규모 데이터셋의 공간 패턴을 파악하는 데 유용합니다.
모델 탭
해당 데이터셋으로 학습된 모든 모델을 검색 가능한 표로 확인합니다:
| 열 | 설명 |
|---|---|
| 이름 | 링크가 포함된 모델 이름 |
| 프로젝트 | 아이콘이 포함된 상위 프로젝트 |
| 상태 | 학습 상태 배지 |
| 태스크 | YOLO 작업 유형 |
| 에포크(Epochs) | 최고 에포크 / 전체 에포크 |
| mAP50-95 | 평균 정밀도(Mean Average Precision) |
| mAP50 | IoU 0.50에서의 mAP |
| 생성일 | 생성 날짜 |

오류 탭
이 탭은 하나 이상의 파일 처리 과정에서 오류가 발생했을 때만 나타납니다.
처리되지 못한 이미지가 다음 정보와 함께 나열됩니다:
- 오류 배너: 실패한 이미지의 총 개수 및 안내
- 오류 테이블: 파일명, 사용자 친화적인 오류 설명, 수정 힌트 및 미리보기 썸네일
- 일반적인 오류로는 손상된 파일, 지원되지 않는 형식, 너무 작은 이미지(최소 28px), 지원되지 않는 색상 모드 등이 있습니다.

일반적인 처리 오류
| 오류 | 원인 | 수정 방법 |
|---|---|---|
| 이미지 파일을 읽을 수 없음 | 손상되었거나 지원되지 않는 형식 | 이미지 편집기에서 다시 내보내기 |
| 불완전하거나 손상됨 | 전송 중 파일이 잘림 | 원본 파일을 다시 다운로드 |
| 이미지가 너무 작음 | 최소 규격이 28px 미만 | 더 높은 해상도의 원본 이미지 사용 |
| 지원되지 않는 색상 모드 | CMYK 또는 인덱스 색상 모드 | RGB 모드로 변환 |
버전 탭
재현 가능한 학습을 위해 데이터셋의 불변 NDJSON 스냅샷을 생성합니다. 각 버전은 생성 시점의 이미지 개수, 클래스 개수, 어노테이션 개수 및 파일 크기를 캡처합니다.
| 열 | 설명 |
|---|---|
| 버전 | 버전 번호 (v1, v2, ...) |
| 설명 | 사용자가 제공한 설명 (수정 가능) |
| 이미지 | 스냅샷 생성 당시의 이미지 개수 |
| 클래스 | 스냅샷 생성 당시의 클래스 개수 |
| 어노테이션 | 스냅샷 생성 당시의 어노테이션 개수 |
| 크기 | NDJSON 내보내기 파일 크기 |
| 생성일 | 버전 생성 시점 |
버전을 생성하려면:
- 버전(Versions) 탭을 엽니다
- 선택적으로 설명을 입력합니다 (예: "학습 이미지 500장 추가" 또는 "잘못 라벨링된 클래스 수정")
- + New Version 버튼을 클릭합니다
- 새 버전이 테이블에 나타납니다
- 필요 시 테이블에서 해당 버전을 개별적으로 다운로드합니다
각 버전은 순차적으로 번호가 지정되며(v1, v2, v3...) 영구적으로 저장됩니다. 언제든지 버전 테이블에서 이전 버전을 다운로드할 수 있습니다.
버전 생성은 데이터셋이 ready 상태에 도달한 후 가능합니다.
데이터셋에 큰 변화(이미지 추가, 어노테이션 수정, 분할 재조정 등)가 있기 전후에 버전을 생성하십시오. 이를 통해 데이터셋 상태 변화에 따른 모델 성능을 비교할 수 있습니다.
표시된 크기는 이미지 URL과 어노테이션을 포함한 NDJSON 내보내기 파일 크기이며, 실제 이미지 데이터는 포함되지 않습니다. 실제 이미지 데이터는 별도로 저장되며 서명된 URL을 통해 액세스됩니다.
데이터셋 내보내기
데이터셋 헤더나 버전 탭에서 NDJSON 파일을 다운로드하여 오프라인에서 사용할 데이터셋을 내보냅니다.
내보내는 방법:
- 데이터셋 헤더의 Export 버튼을 클릭합니다
- 현재 NDJSON 스냅샷을 즉시 다운로드합니다
- 나중에 다시 다운로드할 수 있는 불변의 번호가 매겨진 스냅샷이 필요한 경우 버전(Versions) 탭을 사용하십시오

NDJSON 형식은 한 줄에 하나의 JSON 객체를 저장합니다. 첫 번째 줄에는 데이터셋 메타데이터가 포함되며, 이후 각 줄마다 이미지 정보가 포함됩니다.
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}내보낸 NDJSON의 이미지 URL은 서명되어 있으며 7일 동안 유효합니다. 최신 URL이 필요한 경우 데이터셋을 다시 내보내거나 새 버전을 생성하십시오.
전체 사양은 Ultralytics NDJSON 형식 문서를 참조하십시오.
이미지 작업
빠른 작업
그리드(Grid) 또는 컴팩트(Compact) 뷰에서 이미지에 마우스 오른쪽 버튼을 클릭하여 빠른 작업에 액세스합니다:
| 작업 | 설명 |
|---|---|
| 분할로 이동(Move to Split) | 이미지를 Train, Val, 또는 Test 분할로 재할당합니다 |
| 다운로드 | 원본 이미지 파일을 다운로드합니다 |
| 삭제 | 데이터셋에서 이미지를 삭제합니다 |

이미지 컨텍스트 메뉴는 단일 이미지에 작동합니다. 여러 이미지에 대한 일괄 작업을 수행하려면 체크박스를 선택하여 Table 뷰를 사용하십시오.
분할로 일괄 이동
선택한 이미지를 동일한 데이터셋 내의 다른 분할로 재할당합니다:
- Table 뷰로 전환하십시오
- 체크박스를 사용하여 이미지를 선택하십시오
- 마우스 오른쪽 버튼을 클릭하여 컨텍스트 메뉴를 엽니다
Move to split> Train, Validation, 또는 Test를 선택하십시오
그리드 뷰에서 이미지를 드래그하여 분할 필터 탭으로 놓을 수도 있습니다.
모든 이미지를 하나의 데이터셋에 업로드한 다음, 일괄 분할 이동을 사용하여 하위 세트를 train, validation, test 분할로 구성하십시오.
분할 재배포
사용자 지정 비율을 사용하여 모든 이미지를 train, validation, test 분할에 걸쳐 재배포하십시오:
- 데이터셋 툴바에서 **분할 막대(split bar)**를 클릭하여 Redistribute Splits 대화 상자를 엽니다
- 아래 방법 중 하나를 사용하여 분할 백분율을 조정하십시오
- 실시간 이미지 수 미리보기를 검토하여 배포를 확인하십시오
- Apply를 클릭하여 백분율에 따라 모든 이미지를 무작위로 재할당합니다

대화 상자에서는 대상 분할 비율을 설정하는 세 가지 방법을 제공합니다:
| 메서드 | 설명 |
|---|---|
| 드래그 | 색상이 지정된 세그먼트 사이의 핸들을 드래그하여 분할 경계를 시각적으로 조정합니다 |
| 입력 | 모든 분할의 백분율 입력을 편집합니다(나머지 두 분할은 비례하여 자동 재조정됩니다) |
| 자동 | 한 번의 클릭으로 80/20 train/validation 분할을 즉시 설정하며 test 분할은 0%로 설정됩니다 |
적용하기 전에 실시간 미리보기를 통해 각 분할에 정확히 몇 개의 이미지가 포함되는지 확인할 수 있습니다.
Auto 버튼을 클릭하여 권장되는 80/20 train/validation 분할을 즉시 설정하십시오. 이는 학습에 가장 일반적으로 사용되는 비율입니다.
일괄 삭제
여러 이미지를 한 번에 삭제합니다:
- 테이블 뷰에서 이미지를 선택하십시오
- 마우스 오른쪽 버튼을 클릭하고
Delete를 선택하십시오 - 삭제를 확인하십시오
데이터셋 URI
ul:// URI 형식을 사용하여 Platform 데이터셋을 참조하십시오 (Using Platform Datasets 참조):
ul://username/datasets/dataset-slug
이 URI를 사용하여 어디서나 모델을 학습시키십시오:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100ul:// URI는 모든 환경에서 작동합니다:
- 로컬 머신: 내 하드웨어에서 학습, 데이터는 자동으로 다운로드됩니다
- Google Colab: 노트북에서 Platform 데이터셋에 액세스하십시오
- 원격 서버: 데이터셋에 완전히 액세스하여 클라우드 VM에서 학습하십시오
사용 가능한 라이선스
Platform은 데이터셋에 대해 다음 라이선스를 지원합니다:
| 라이선스 | 유형(Type) |
|---|---|
| 없음 | 선택된 라이선스 없음 |
| CC0-1.0 | 퍼블릭 도메인 |
| CC-BY-2.5 | 허용적 |
| CC-BY-4.0 | 허용적 |
| CC-BY-SA-4.0 | 카피레프트 |
| CC-BY-NC-4.0 | 비상업적 |
| CC-BY-NC-SA-4.0 | 카피레프트 |
| CC-BY-ND-4.0 | 파생물 금지 |
| CC-BY-NC-ND-4.0 | 비상업적 |
| Apache-2.0 | 허용적 |
| MIT | 허용적 |
| AGPL-3.0 | 카피레프트 |
| GPL-3.0 | 카피레프트 |
| 연구 전용 | 제한됨 |
| 기타 | 사용자 정의 모델(Custom) |
카피레프트 라이선스(AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0)가 있는 데이터셋을 복제할 때, 복제본은 라이선스를 상속하며 라이선스 선택기가 잠깁니다.
가시성 설정
데이터셋을 볼 수 있는 사람을 제어하십시오:
| 설정 | 설명 |
|---|---|
| 비공개(Private) | 본인만 액세스 가능 |
| 공개(Public) | 누구나 Explore 페이지에서 조회 가능 |
가시성은 New Dataset 대화 상자에서 토글 스위치를 사용하여 데이터셋을 생성할 때 설정됩니다. 공개 데이터셋은 Explore 페이지에서 볼 수 있습니다.
데이터셋 편집
데이터셋 메타데이터는 데이터셋 페이지에서 직접 인라인으로 편집되며, 대화 상자가 필요하지 않습니다:
- 이름: 데이터셋 이름을 클릭하여 편집하십시오. 변경 사항은 포커스가 벗어나거나
Enter를 누르면 자동으로 저장됩니다. - 설명: 설명을 클릭하거나 "Add a description..." 플레이스홀더를 클릭하여 편집하십시오. 변경 사항은 자동으로 저장됩니다.
- 태스크 유형: 태스크 배지를 클릭하여 다른 태스크 유형을 선택하십시오.
- 라이선스: 라이선스 선택기를 클릭하여 데이터셋 라이선스를 변경하십시오.
각 이미지는 모든 태스크 유형에 대한 주석을 함께 저장합니다. 데이터셋 태스크 유형을 변경하면 편집기에서 어떤 주석이 보이고 내보내기 및 학습에 포함되는지 제어할 수 있습니다. 다른 태스크 유형에 대한 주석은 데이터베이스에 보존되며 다시 전환하면 다시 나타납니다.
데이터셋 복제
본인이 소유하지 않은 공개 데이터셋을 볼 때 Clone Dataset을 클릭하여 워크스페이스에 복사본을 만드십시오. 복제본에는 모든 이미지, 주석 및 클래스 정의가 포함됩니다. 원본 데이터셋에 카피레프트 라이선스가 있는 경우 복제본도 이를 상속하며 라이선스 선택기가 잠깁니다.
별표 및 공유
- 별표(Star): 별표 버튼을 클릭하여 데이터셋을 즐겨찾기에 추가하십시오. 별표 수는 모든 사용자에게 보입니다.
- 공유: 공개 데이터셋의 경우 공유 버튼을 클릭하여 링크를 복사하거나 소셜 플랫폼에 공유하십시오.
데이터셋 삭제
더 이상 필요하지 않은 데이터셋을 삭제하십시오:
- 데이터셋 작업 메뉴 열기
Delete클릭- 대화 상자에서 확인: "This will move [name] to trash. You can restore it within 30 days."
삭제된 데이터셋은 휴지통으로 이동하며 영구적으로 삭제되지 않습니다. Settings > Trash에서 30일 이내에 복구할 수 있습니다.
데이터셋으로 학습하기
데이터셋에서 직접 학습을 시작하십시오:
- 데이터셋 페이지에서
New Model을 클릭합니다 - 프로젝트를 선택하거나 새로 만듭니다
- 학습 파라미터를 구성합니다
- 학습 시작
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fff자세한 내용은 Cloud Training을 참조하십시오.
FAQ
업로드 후 내 데이터는 어떻게 됩니까?
데이터는 선택한 리전(US, EU 또는 AP)에서 처리 및 저장됩니다. 이미지는 다음과 같이 처리됩니다:
- 형식 및 크기 검증
- 최소 치수가 28px 미만인 경우 거부
- 4096px보다 큰 경우 정규화(가로세로 비율 유지, 최적화된 저장을 위해 인코딩됨)
- XXH3-128 해싱을 사용하여 내용 기반 저장소(CAS)에 저장
- 빠른 탐색을 위해 256px WebP 썸네일 생성
스토리지 작동 방식은 어떻게 됩니까?
Ultralytics Platform은 효율적인 저장을 위해 **Content-Addressable Storage (CAS)**를 사용합니다:
- 중복 제거: 서로 다른 사용자가 업로드한 동일한 이미지는 한 번만 저장됩니다
- 무결성: XXH3-128 해싱으로 데이터 무결성을 보장합니다
- 효율성: 스토리지 비용을 절감하고 처리 속도를 높입니다
- 지역성: 데이터는 선택한 리전(US, EU 또는 AP)에 유지됩니다
기존 데이터셋에 이미지를 추가할 수 있습니까?
예, 파일을 데이터셋 페이지로 드래그 앤 드롭하거나 업로드 버튼을 사용하여 추가 이미지를 추가할 수 있습니다. 새로운 통계가 자동으로 계산됩니다.
이미지를 분할(split) 간에 이동하려면 어떻게 합니까?
일괄 분할 이동(bulk move-to-split) 기능을 사용하십시오:
- 테이블 뷰에서 이미지를 선택하십시오
- 마우스 오른쪽 버튼을 클릭하고
Move to split을 선택합니다 - 대상 분할(Train, Validation 또는 Test)을 선택합니다
어떤 레이블 형식이 지원됩니까?
Ultralytics Platform은 YOLO 레이블, COCO JSON, Ultralytics NDJSON 및 원시 이미지 업로드를 지원합니다:
이미지당 하나의 .txt 파일, 정규화된 좌표(0-1 범위) 사용:
| 태스크 | 형식 | 예시 |
|---|---|---|
| 탐지(Detect) | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| 세그먼트(Segment) | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| 포즈(Pose) | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| 분류(Classify) | 디렉토리 구조 | train/cats/, train/dogs/ |
포즈 가시성 플래그: 0=레이블 없음, 1=레이블 있음(가려짐), 2=레이블 있음(보임).
동일한 데이터셋에 여러 작업 유형에 대해 주석을 달 수 있습니까?
네. 각 이미지는 5가지 모든 작업 유형(detect, segment, pose, OBB, classify)에 대한 주석을 함께 저장합니다. 기존 주석을 잃지 않고 언제든지 데이터셋의 활성 작업 유형을 전환할 수 있습니다. 활성 작업 유형과 일치하는 주석만 편집기에 표시되며 내보내기 및 학습에 포함됩니다. 다른 작업에 대한 주석은 보존되며 다시 전환하면 다시 나타납니다.