Link to this section데이터셋#
Ultralytics Platform 데이터셋은 학습 데이터를 관리하기 위한 효율적인 솔루션을 제공합니다. 업로드 후, 플랫폼은 이미지, 라벨, 통계를 자동으로 처리합니다. 데이터셋은 처리가 완료되고 train 분할에 최소 이미지 1개, val 또는 test 분할에 최소 이미지 1개, 라벨이 지정된 이미지 최소 1개, 총 이미지 최소 2개 이상이 포함되면 학습 준비가 완료됩니다.
Link to this section데이터셋 업로드#
Ultralytics Platform은 유연성을 위해 다양한 업로드 형식을 허용합니다.
이미 Ultralytics HUB 또는 Roboflow에 데이터셋이 있는 경우, 통합(Integrations)을 사용하여 직접 가져올 수 있습니다. 수동으로 내보내거나 다시 업로드할 필요가 없습니다.
Link to this section지원되는 형식#
| 형식 | 확장자 | 참고 | 최대 크기 |
|---|---|---|---|
| JPEG | .jpg, .jpeg | 가장 일반적이며 권장됨 | 50 MB |
| PNG | .png | 투명도 지원 | 50 MB |
| WebP | .webp | 최신, 우수한 압축률 | 50 MB |
| BMP | .bmp | 비압축 | 50 MB |
| TIFF | .tiff, .tif | 고품질 | 50 MB |
| HEIC | .heic | iPhone 사진 | 50 MB |
| AVIF | .avif | 차세대 형식 | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Raw 카메라 | 50 MB |
| MPO | .mpo | Multi-picture object | 50 MB |
Link to this section데이터셋 준비하기#
플랫폼은 Ultralytics YOLO, COCO, Ultralytics NDJSON 및 raw(주석 없는) 업로드를 지원합니다:
표준 YOLO 디렉토리 구조와 data.yaml 파일을 사용하십시오:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlYAML 파일은 데이터셋 구성을 정의합니다:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogRaw: 주석이 지정되지 않은 이미지를 업로드합니다(라벨 없음). 주석 편집기(annotation editor)를 사용하여 플랫폼에서 직접 주석을 달 계획일 때 유용합니다.
명시적인 분할 폴더 없이 이미지를 업로드할 수도 있습니다. 플랫폼은 업로드 중 활성 분할 대상을 준수하며, 분류 데이터셋이 아닌 경우 분할 정보가 제공되지 않으면 학습 세트의 일부에서 검증 분할을 자동으로 생성할 수 있습니다. 나중에 대량 분할 이동 또는 분할 재배치를 통해 언제든지 이미지를 다시 할당할 수 있습니다.
The format is detected automatically: datasets with a data.yaml containing names, train, or val keys are treated as YOLO. Datasets with COCO JSON files (containing images, annotations, and categories arrays) are treated as COCO. .ndjson exports are imported as Ultralytics NDJSON. Datasets with only images and no annotations are treated as raw.
작업별 형식에 대한 자세한 내용은 지원되는 작업 및 데이터셋 개요를 참조하십시오.
Link to this section업로드 프로세스#
- 사이드바에서
Datasets로 이동합니다. New Dataset을 클릭하거나 파일을 업로드 영역으로 드래그합니다.- 작업 유형을 선택합니다(지원되는 작업 참조).
- 이름과 선택적인 설명을 추가합니다.
- 공개 여부(공개 또는 비공개)와 선택적인 라이선스를 설정합니다(사용 가능한 라이선스 참조).
Create & Upload를 클릭합니다(빈 데이터셋을 생성하는 경우Create Dataset클릭).

업로드 후, 플랫폼은 다단계 파이프라인을 통해 데이터를 처리합니다:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- Validation: 형식 및 크기 확인
- Normalization: 큰 이미지 크기 조정(최대 4096px, 최소 치수 28px)
- Thumbnails: 256px WebP 미리보기 생성
- Label Parsing: YOLO 및 COCO 형식 라벨 추출
- Statistics: 클래스 분포 및 이미지 치수 계산

업로드 전 유효성 검사
업로드하기 전에 로컬에서 데이터셋을 검증할 수 있습니다:
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")이미지의 가장 짧은 쪽은 최소 28px 이상이어야 합니다. 이보다 작은 이미지는 처리 중에 거부됩니다. 가장 긴 쪽이 4096px보다 큰 이미지는 가로세로 비율이 유지되면서 자동으로 크기가 조정됩니다.
Link to this section이미지 탐색#
다양한 레이아웃으로 데이터셋 이미지를 봅니다.
갤러리 툴바에서 클러스터링(Clustering) 패널을 열어 대화형 2D 산점도로 데이터셋을 탐색합니다.
| 보기 | 설명 |
|---|---|
| Grid | 주석 오버레이가 있는 썸네일 그리드(기본값) |
| 컴팩트 | 빠른 스캔을 위한 더 작은 썸네일 |
| 테이블 | 썸네일, 파일 이름, 치수, 크기, 분할, 클래스 및 라벨 개수가 포함된 목록 |

Link to this section정렬 및 필터링#
이미지를 정렬하고 필터링하여 효율적으로 탐색할 수 있습니다:
| 정렬 | 설명 |
|---|---|
| 최신순 / 오래된순 | 업로드 / 생성 순서 |
| 이름 A-Z / Z-A | 파일 이름 알파벳순 |
| 높이 ↑/↓ | 이미지 높이 (픽셀 단위) |
| 너비 ↑/↓ | 이미지 너비 (픽셀 단위) |
| 크기 ↑/↓ | 디스크상 파일 크기 |
| 주석 ↑/↓ | 이미지당 주석 수 |
100,000개가 넘는 이미지로 구성된 데이터셋의 경우, 갤러리의 반응성을 유지하기 위해 이름 / 크기 / 너비 / 높이 정렬 기능이 비활성화됩니다. 최신순, 오래된순, 주석 개수순 정렬은 계속 사용할 수 있습니다.
Annotations 필터를 Unannotated로 설정하여 주석 작업이 필요한 이미지를 빠르게 찾으십시오. 이는 라벨링 진행 상황을 추적해야 하는 대규모 데이터셋에서 특히 유용합니다.
Link to this section전체 화면 뷰어#
이미지를 클릭하면 다음 기능을 포함한 전체 화면 뷰어가 열립니다:
- 탐색: 화살표 키 또는 썸네일 미리보기를 사용하여 탐색
- 메타데이터: 파일 이름, 규격, Split 배지, 주석 수
- 주석: 주석 오버레이 표시 여부 전환
- 클래스 분석: 색상 표시기가 포함된 클래스별 라벨 개수
- 편집: 주석 모드로 진입하여 라벨 추가 또는 수정
- 다운로드: 원본 이미지 파일 다운로드
- 삭제: 데이터셋에서 이미지 삭제
- 줌:
Cmd/Ctrl+Scroll,Cmd/Ctrl++, 또는Cmd/Ctrl+=를 사용하여 확대하고,Cmd/Ctrl+-를 사용하여 축소합니다. - 뷰 초기화:
Cmd/Ctrl + 0또는 초기화 버튼을 눌러 이미지를 뷰어에 맞게 조정합니다. - 팬(이동):
Space키를 누른 채 드래그하여 확대된 캔버스를 이동합니다. - 픽셀 뷰: 상세 확인을 위해 픽셀화된 렌더링을 전환합니다.

Link to this sectionSplit별 필터링#
데이터셋 Split별로 이미지 필터링:
| Split | 목적 |
|---|---|
| 학습 | 모델 학습용 |
| Val | 학습 중 검증용 |
| Test | 최종 평가용 |
Link to this section클러스터링#
Clustering 패널은 데이터셋을 대화형 2D 산점도로 투영하여 시각적으로 유사한 이미지들을 가깝게 배치합니다. 이를 통해 갤러리를 떠나지 않고도 클러스터를 표면화하고, 중복 항목 및 이상치를 발견하며, Split 또는 클래스가 데이터 전반에 어떻게 분포되어 있는지 확인할 수 있습니다. 데이터셋 페이지의 갤러리 툴바에 있는 산점도 아이콘에서 열 수 있습니다.

Link to this section분석 실행#
분석 시작:
- 데이터셋을 열고 갤러리 툴바의 산점도 아이콘 클릭
Analyze Dataset클릭- 진행률 표시줄이 완료될 때까지 대기 — 결과가 같은 패널에 표시됩니다.
분석은 백그라운드에서 실행되며 데이터셋 크기에 따라 몇 분 정도 소요될 수 있습니다. 패널을 닫거나 페이지를 떠났다가 나중에 다시 돌아와도 됩니다.
Link to this section시각화#
분석이 완료되면 패널에 모든 분석된 이미지의 2D 산점도가 표시됩니다. 갤러리 필터(Split, 클래스, 라벨링 여부)는 필터 범위 밖의 포인트를 흐리게 처리하여 관심 있는 하위 집합에 집중할 수 있도록 합니다.

Link to this section색상 기준#
패널 툴바의 Color by 드롭다운을 사용하여 데이터 포인트의 음영 처리 방식을 변경하십시오. 언제든지 보기 모드를 전환할 수 있으며, 산점도의 색상이 즉시 변경되어 Split, 클래스 또는 이미지 속성이 클러스터 전반에 어떻게 분포되어 있는지 확인할 수 있습니다:
| 옵션 | 음영 |
|---|---|
| Splits | Train / Val / Test |
| Classes | 각 이미지의 첫 번째 주석 클래스 |
| Width | 이미지 너비 |
| Height | 이미지 높이 |
| Size | 파일 크기 |
| 주석(Annotations) | 이미지당 주석 개수 |

Link to this section라소 선택#
영역 주위에 자유로운 형태의 선택 도구를 그려 산점도상의 포인트를 강조하십시오. 갤러리가 일치하는 이미지들로 필터링되어, 일반적인 이미지 작업을 사용하여 해당 이미지들을 확인, 재라벨링, 이동 또는 삭제할 수 있습니다.
차트 위의 칩은 선택된 포인트의 개수를 보여줍니다. ×를 클릭하여 라소를 지우고 전체 갤러리 보기로 돌아갑니다.
Link to this section이동 및 확대/축소#
마우스와 키보드를 사용하여 대규모 산점도를 탐색하십시오:
| 입력 | 작업 |
|---|---|
| 스크롤 | 산점도를 2D로 이동 |
| Cmd/Ctrl+스크롤 | 커서 위치를 기준으로 확대 또는 축소 |
| Space 키 누르기 | 드래그하여 이동하는 모드로 전환 |
Link to this section재분석#
분석 후 데이터셋이 변경되면, 소유자와 편집자에게 패널 상단에 Re-analyze 버튼이 표시됩니다.
Re-analyze를 클릭하여 임베딩과 2D 투영을 처음부터 다시 계산합니다.
Link to this section데이터셋 탭#
각 데이터셋 페이지는 데이터셋 상태 및 권한에 따라 최대 6개의 탭을 표시할 수 있습니다:
Link to this section이미지 탭#
주석 오버레이가 포함된 이미지 갤러리를 보여주는 기본 보기입니다. 그리드, 컴팩트, 테이블 보기 모드를 지원합니다. 파일을 여기에 드래그 앤 드롭하여 이미지를 추가할 수 있습니다.
Link to this section클래스 탭#
이 탭은 데이터셋에 이미지가 있을 때 표시됩니다.
데이터셋의 주석 클래스 관리:
- 클래스 히스토그램: 선형/로그 스케일 전환이 가능한 클래스별 주석 개수 막대 차트
- 클래스 테이블: 클래스 이름, 라벨 수, 이미지 수로 정렬 및 검색이 가능한 테이블
- 클래스 이름 편집: 클래스 이름을 클릭하여 인라인으로 이름을 변경합니다
- 클래스 색상 편집: 색상 견본을 클릭하여 클래스 색상을 변경합니다
- 새 클래스 추가: 하단의 입력을 사용하여 클래스를 추가합니다

데이터셋에 클래스 불균형이 있는 경우(예: 'person' 어노테이션은 10,000개인데 'bicycle'은 50개뿐인 경우), 클래스 히스토그램에서 Log Scale 토글을 사용하여 모든 클래스를 명확하게 시각화하십시오.
Link to this section차트 탭#
이 탭은 데이터셋에 이미지가 있을 때 표시됩니다.
데이터셋에서 계산된 자동 통계:
| 차트 | 설명 |
|---|---|
| 분할 분포 | 학습/검증/테스트 이미지 수 및 라벨링된 백분율의 도넛 차트 |
| 상위 클래스 | 가장 빈번한 10개 어노테이션 클래스의 도넛 차트 |
| 이미지 크기 | 평균값이 포함된 이미지 너비 및 높이 분포 히스토그램(오버레이) |
| 인스턴스당 포인트 | 어노테이션당 폴리곤 정점 또는 키포인트 수(세그먼트/포즈) |
| 어노테이션 위치 | BBox 중심 위치의 2D 히트맵 |
| 이미지 파일 크기 | 이미지 파일 크기 분포 히스토그램 |
| 이미지 형식 | 원본 이미지 형식(JPG, PNG 등)의 분포 |
| BBox 크기 | BBox 너비 및 높이 히스토그램(오버레이) |
| 이미지당 객체 수 | 이미지당 어노테이션 개수 히스토그램 |
| 이미지 크기 2D | 가로세로 비율 가이드 라인이 포함된 2D 너비 대 높이 히트맵 |

통계는 5분 동안 캐시됩니다. 어노테이션 변경 사항은 캐시가 만료된 후에 반영됩니다.
히트맵의 확장 버튼을 클릭하여 전체 화면 모드로 봅니다. 이는 더 크고 상세한 보기를 제공하며, 대규모 데이터셋의 공간 패턴을 이해하는 데 유용합니다.
Link to this section모델 탭#
이 데이터셋에서 학습된 모든 모델을 검색 가능한 테이블에서 확인합니다:
| 열 | 설명 |
|---|---|
| 이름 | 링크가 포함된 모델 이름 |
| 프로젝트 | 아이콘이 포함된 상위 프로젝트 |
| 상태 | 학습 상태 배지 |
| 작업 | YOLO 작업 유형 |
| 에포크 | 최적 에포크 / 총 에포크 |
| mAP50-95 | 평균 정밀도(Mean average precision) |
| mAP50 | IoU 0.50에서의 mAP |
| 생성됨 | 생성 날짜 |

Link to this section오류 탭#
이 탭은 하나 이상의 파일 처리 실패 시에만 나타납니다.
처리에 실패한 이미지는 다음 정보와 함께 나열됩니다:
- 오류 배너: 실패한 이미지의 총 개수 및 안내
- 오류 테이블: 파일명, 사용자 친화적인 오류 설명, 수정 힌트 및 미리보기 썸네일
- 일반적인 오류로는 파일 손상, 지원되지 않는 형식, 너무 작은 이미지(최소 28px), 지원되지 않는 색상 모드 등이 있습니다

일반적인 처리 오류
| 오류 | 원인 | 수정 방법 |
|---|---|---|
| 이미지 파일을 읽을 수 없음 | 손상되었거나 지원되지 않는 형식 | 이미지 편집기에서 다시 내보내기 |
| 불완전하거나 손상됨 | 전송 중 파일이 잘림 | 원본 파일을 다시 다운로드 |
| 이미지가 너무 작음 | 최소 크기가 28px 미만 | 더 높은 해상도의 원본 이미지 사용 |
| 지원되지 않는 색상 모드 | CMYK 또는 인덱스 색상 모드 | RGB 모드로 변환 |
Link to this section버전 탭#
재현 가능한 학습을 위해 데이터셋의 불변 NDJSON 스냅샷을 생성합니다. 각 버전은 생성 시점의 이미지 수, 클래스 수, 어노테이션 수 및 파일 크기를 캡처합니다.
| 열 | 설명 |
|---|---|
| 버전 | 버전 번호(v1, v2, ...) |
| 설명 | 사용자가 제공한 설명(편집 가능) |
| 이미지 | 스냅샷 생성 시점의 이미지 수 |
| 클래스 | 스냅샷 생성 시점의 클래스 수 |
| 어노테이션 | 스냅샷 생성 시점의 어노테이션 수 |
| 크기 | NDJSON 내보내기 파일 크기 |
| 생성됨 | 버전 생성 시점 |
버전을 생성하려면:
- 버전 탭 열기
- 선택적으로 설명 입력(예: "500개의 학습 이미지 추가" 또는 "잘못 라벨링된 클래스 수정")
- + 새 버전 클릭
- 새 버전이 테이블에 나타납니다
- 필요할 때 테이블에서 버전을 별도로 다운로드하십시오
각 버전은 순차적으로 번호가 지정되며(v1, v2, v3...) 영구적으로 저장됩니다. 언제든지 버전 테이블에서 이전 버전을 다운로드할 수 있습니다.
버전 생성은 데이터셋이 ready 상태에 도달한 후 가능합니다.
데이터셋에 큰 변화(이미지 추가, 어노테이션 수정, 분할 재조정 등)를 주기 전후에 버전을 생성하십시오. 이를 통해 서로 다른 데이터셋 상태에 따른 모델 성능을 비교할 수 있습니다.
표시된 크기는 이미지 자체가 아닌 이미지 URL과 어노테이션을 포함하는 NDJSON 내보내기 파일 크기입니다. 실제 이미지 데이터는 별도로 저장되며 서명된 URL을 통해 액세스됩니다.
Link to this section데이터셋 내보내기#
데이터셋 헤더나 버전 탭에서 NDJSON을 다운로드하여 오프라인용으로 데이터셋을 내보내십시오.
내보내려면:
- 데이터셋 헤더의 다운로드 버튼(다운로드 아이콘)을 클릭하십시오
- 현재 NDJSON 스냅샷을 직접 다운로드합니다.
- 나중에 다시 다운로드할 수 있는 변경 불가능한 번호가 지정된 스냅샷이 필요한 경우 Versions 탭을 사용하십시오.

NDJSON 형식은 라인당 하나의 JSON 객체를 저장합니다. 첫 번째 라인에는 데이터셋 메타데이터가 포함되며, 그 뒤로 이미지당 한 라인씩 이어집니다:
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "bytes": 12345678, "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}내보낸 NDJSON의 이미지 URL은 서명되어 있으며 7일 동안 유효합니다. 최신 URL이 필요한 경우 데이터셋을 다시 내보내거나 새 버전을 만드십시오.
전체 사양은 Ultralytics NDJSON format documentation을 참조하십시오.
Link to this section이미지 작업#
Link to this section빠른 작업#
Grid 또는 Compact 뷰에서 이미지를 마우스 오른쪽 버튼으로 클릭하여 빠른 작업에 액세스하십시오:
| 작업 | 설명 |
|---|---|
| Move to Split | 이미지를 Train, Val 또는 Test 분할로 재할당합니다. |
| 다운로드 | 원본 이미지 파일 다운로드 |
| Delete | 데이터셋에서 이미지 삭제 |

이미지 컨텍스트 메뉴는 단일 이미지에서 작동합니다. 여러 이미지에 대한 일괄 작업을 수행하려면 체크박스 선택 기능이 있는 Table 뷰를 사용하십시오.
Link to this section일괄 분할 이동#
선택한 이미지를 동일한 데이터셋 내의 다른 분할로 재할당합니다:
- Table 뷰로 전환
- 체크박스를 사용하여 이미지 선택
- 마우스 오른쪽 버튼을 클릭하여 컨텍스트 메뉴 열기
Move to split> Train, Validation 또는 Test 선택
그리드 뷰에서 분할 필터 탭으로 이미지를 드래그 앤 드롭할 수도 있습니다.
모든 이미지를 하나의 데이터셋에 업로드한 다음, 일괄 분할 이동을 사용하여 하위 집합을 train, validation 및 test 분할로 구성하십시오.
Link to this section분할 재배포#
사용자 지정 비율을 사용하여 train, validation 및 test 분할에 걸쳐 모든 이미지를 재배포합니다:
- 데이터셋 툴바의 split bar를 클릭하여 Redistribute Splits 대화 상자를 엽니다.
- 아래 방법 중 하나를 사용하여 분할 백분율을 조정합니다.
- 실시간 이미지 수 미리보기를 검토하여 배포를 확인합니다.
- Apply를 클릭하여 백분율에 따라 모든 이미지를 무작위로 재할당합니다.

이 대화 상자는 대상 분할 비율을 설정하는 세 가지 방법을 제공합니다:
| 메서드 | 설명 |
|---|---|
| Drag | 색상 세그먼트 사이의 핸들을 드래그하여 분할 경계를 시각적으로 조정합니다. |
| Type | 모든 분할의 백분율 입력을 편집합니다(다른 두 분할은 비례적으로 자동 재조정됩니다). |
| Auto | 한 번의 클릭으로 80/20 train/validation 분할을 즉시 설정하고 test 분할을 0%로 설정합니다. |
실시간 미리보기를 통해 적용하기 전에 각 분할에 몇 개의 이미지가 포함될지 정확하게 확인할 수 있습니다.
Auto 버튼을 클릭하여 권장되는 80/20 train/validation 분할을 즉시 설정하십시오. 이는 학습에 가장 일반적인 비율입니다.
Link to this section일괄 삭제#
여러 이미지를 한 번에 삭제합니다:
- 테이블 뷰에서 이미지 선택
- 마우스 오른쪽 버튼을 클릭하고
Delete선택 - 삭제 확인
Link to this section데이터셋 URI#
ul:// URI 형식을 사용하여 Platform 데이터셋을 참조하십시오(Using Platform Datasets 참조):
ul://username/datasets/dataset-slug
이 URI를 사용하여 어디서나 모델을 학습시키십시오:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100ul:// URI는 모든 환경에서 작동합니다:
- 로컬 머신: 하드웨어에서 학습, 데이터 자동 다운로드
- Google Colab: 노트북에서 Platform 데이터셋에 액세스
- 원격 서버: 전체 데이터셋 액세스 권한을 가지고 클라우드 VM에서 학습
Link to this section사용 가능한 라이선스#
Platform은 다음 데이터셋 라이선스를 지원합니다:
| 라이선스 | 유형 |
|---|---|
| 없음 | 라이선스 선택 안 됨 |
| CC0-1.0 | 퍼블릭 도메인 |
| CC-BY-2.5 | 허용적 |
| CC-BY-4.0 | 허용적 |
| CC-BY-SA-4.0 | 카피레프트 |
| CC-BY-NC-4.0 | 비상업적 |
| CC-BY-NC-SA-4.0 | 카피레프트 |
| CC-BY-ND-4.0 | 파생물 없음 |
| CC-BY-NC-ND-4.0 | 비상업적 |
| Apache-2.0 | 허용적 |
| MIT | 허용적 |
| AGPL-3.0 | 카피레프트 |
| GPL-3.0 | 카피레프트 |
| 연구 전용 | 제한됨 |
| 기타 | 사용자 지정 |
카피레프트 라이선스(AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0)가 있는 데이터셋을 복제할 때, 복제본은 라이선스를 상속하며 라이선스 선택기가 잠깁니다.
Link to this section가시성 설정#
데이터셋을 볼 수 있는 사람을 제어하십시오:
| 설정 | 설명 |
|---|---|
| Private | 본인만 액세스 가능 |
| Public | Explore 페이지에서 누구나 조회 가능 |
가시성은 New Dataset 대화 상자에서 토글 스위치를 사용하여 데이터셋을 생성할 때 설정됩니다. 공개 데이터셋은 Explore 페이지에서 볼 수 있습니다.
Link to this section데이터셋 편집#
데이터셋 메타데이터는 데이터셋 페이지에서 직접 인라인으로 편집할 수 있으며 대화 상자가 필요하지 않습니다:
- 이름: 데이터셋 이름을 클릭하여 편집합니다. 변경 사항은 포커스가 해제되거나
Enter를 누르면 자동 저장됩니다. - 설명: 설명을 클릭하거나 "Add a description..." 자리 표시자를 클릭하여 편집합니다. 변경 사항은 자동 저장됩니다.
- 작업 유형: 작업 배지를 클릭하여 다른 작업 유형을 선택합니다.
- 라이선스: 라이선스 선택기를 클릭하여 데이터셋 라이선스를 변경합니다.
각 이미지는 모든 작업 유형에 대한 주석을 함께 저장합니다. 데이터셋 작업 유형을 변경하면 편집기에 표시되는 주석과 내보내기 및 학습에 포함되는 주석이 제어됩니다. 다른 작업 유형에 대한 주석은 데이터베이스에 보존되며 다시 전환하면 다시 나타납니다.
Link to this section데이터셋 복제#
본인이 소유하지 않은 공개 데이터셋을 볼 때는 Clone Dataset을 클릭하여 워크스페이스에 복사본을 생성할 수 있습니다. 복사본에는 모든 이미지, 주석 및 클래스 정의가 포함됩니다. 원본 데이터셋에 카피레프트 라이선스가 있는 경우, 복사본도 이를 상속받으며 라이선스 선택기가 잠깁니다.
Link to this sectionStar 및 공유#
- Star: 별표 버튼을 클릭하여 데이터셋을 북마크합니다. 별표 수는 모든 사용자에게 표시됩니다.
- 공유: 공개 데이터셋의 경우 공유 버튼을 클릭하여 링크를 복사하거나 소셜 플랫폼에 공유할 수 있습니다.
Link to this section데이터셋 삭제#
더 이상 필요하지 않은 데이터셋 삭제:
- 데이터셋 작업 메뉴 열기
Delete클릭- 대화 상자에서 확인: "이 작업은 [name]을(를) 휴지통으로 이동합니다. 30일 이내에 복원할 수 있습니다."
삭제된 데이터셋은 휴지통으로 이동하며 영구적으로 삭제되지 않습니다. Settings > Trash에서 30일 이내에 복원할 수 있습니다.
Link to this section데이터셋으로 학습#
데이터셋에서 직접 학습 시작:
- 데이터셋 페이지에서
New Model클릭 - 프로젝트 선택 또는 새로 만들기
- 학습 파라미터 구성
- 학습 시작
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fff자세한 내용은 Cloud Training을 참조하십시오.
Link to this sectionFAQ#
Link to this section업로드 후 데이터는 어떻게 처리됩니까?#
데이터는 선택한 리전(US, EU 또는 AP)에서 처리 및 저장됩니다. 이미지는 다음과 같이 처리됩니다:
- 형식 및 크기 검증
- 최소 치수가 28px 미만인 경우 거부됨
- 4096px보다 큰 경우 정규화(가로세로 비율 유지; 최적화된 저장소를 위해 인코딩)
- XXH3-128 해싱을 사용하는 콘텐츠 주소 지정 가능 저장소(CAS)에 저장
- 빠른 탐색을 위해 256px WebP 형식의 썸네일 생성
Link to this section저장소는 어떻게 작동합니까?#
Ultralytics Platform은 효율적인 저장을 위해 **콘텐츠 주소 지정 가능 저장소(CAS)**를 사용합니다:
- 중복 제거: 서로 다른 사용자가 업로드한 동일한 이미지는 한 번만 저장됨
- 무결성: XXH3-128 해싱을 통해 데이터 무결성 보장
- 효율성: 저장 비용 절감 및 처리 속도 향상
- 리전: 데이터는 선택한 리전(US, EU 또는 AP) 내에 보관됨
Link to this section기존 데이터셋에 이미지를 추가할 수 있습니까?#
네, 데이터셋 페이지로 파일을 드래그 앤 드롭하거나 업로드 버튼을 사용하여 추가 이미지를 더할 수 있습니다. 새로운 통계가 자동으로 계산됩니다.
Link to this section이미지를 분할(split) 간에 어떻게 이동합니까?#
일괄 분할 이동 기능을 사용하십시오:
- 테이블 뷰에서 이미지 선택
- 마우스 오른쪽 버튼을 클릭하고
Move to split선택 - 대상 분할(Train, Validation 또는 Test) 선택
Link to this section어떤 라벨 형식이 지원됩니까?#
Ultralytics Platform은 YOLO 라벨, COCO JSON, Ultralytics NDJSON 및 원시 이미지 업로드를 지원합니다:
이미지당 하나의 .txt 파일(정규화된 좌표, 0-1 범위):
| 작업 | 형식 | 예시 |
|---|---|---|
| 탐지(Detect) | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| 세그멘테이션(Segment) | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| 포즈(Pose) | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB(방향성 경계 상자) | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| 분류(Classify) | 디렉터리 구조 | train/cats/, train/dogs/ |
포즈 가시성 플래그: 0=라벨 없음, 1=라벨링되었으나 가려짐, 2=라벨링되었고 보임.
Link to this section동일한 데이터셋에 여러 작업 유형을 주석 달 수 있습니까?#
네. 각 이미지는 6가지 작업 유형(detect, segment, semantic, pose, OBB, classify)에 대한 주석을 모두 함께 저장합니다. 기존 주석을 잃지 않고 언제든지 데이터셋의 활성 작업 유형을 전환할 수 있습니다. 활성 작업 유형과 일치하는 주석만 에디터에 표시되며 내보내기 및 학습에 포함됩니다. 다른 작업에 대한 주석은 보존되며 다시 전환하면 나타납니다.