데이터 준비
데이터 준비는 성공적인 컴퓨터 비전 모델의 기반입니다. Ultralytics Platform은 업로드부터 어노테이션, 분석에 이르기까지 학습 데이터를 관리하기 위한 포괄적인 도구를 제공합니다.
참고: Ultralytics 시작하기 - 데이터
개요
Ultralytics Platform의 데이터 섹션은 다음을 지원합니다:
- 업로드 이미지, 동영상 및 데이터셋 파일(ZIP, TAR 등 포함)
.tar.gz/.tgz, NDJSON) - 주석 달기: 수동 그리기 도구 및 SAM 기반 스마트 라벨링 사용 — SAM 2.1 또는 새로운 SAM 3 중에서 선택하세요.
- 분석: 통계 및 시각화를 통해 데이터 분석
- 내보내기: 로컬 학습을 위해 NDJSON 형식으로 내보냅니다.

워크플로우
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 단계 | 설명 |
|---|---|
| 업로드 | 이미지, 동영상 또는 아카이브를 자동 처리와 함께 가져오기 |
| 어노테이션 | 5가지 작업 유형 모두에 대해 수동 도구를 사용하여 레이블 데이터를 생성하거나, detect, segment 및 OBB 작업에는 SAM 사용하십시오. |
| 분석 | 클래스 분포, 공간 히트맵 및 차원 통계 확인 |
| 내보내기 | 오프라인 사용을 위해 NDJSON 형식으로 다운로드 |
지원되는 작업
Ultralytics 플랫폼은 5가지 YOLO 작업 유형을 모두 지원합니다:
| 작업 | 설명 | 어노테이션 도구 |
|---|---|---|
| Detect | 바운딩 박스를 이용한 객체 detect | 사각형 도구 |
| Segment | 픽셀 마스크를 이용한 인스턴스 segment | 폴리곤 도구 |
| 포즈 | 내장 및 사용자 정의 스켈레톤 템플릿을 활용한 키포인트 추정 | 키포인트 도구 |
| OBB | 회전된 객체를 위한 지향성 바운딩 박스 | 지향성 박스 도구 |
| Classify | 이미지 레벨 분류 | 클래스 선택기 |
작업 유형 선택
작업 유형은 데이터셋 생성 시 설정되며, 사용 가능한 주석 도구를 결정합니다. 데이터셋 설정에서 나중에 변경할 수 있지만, 호환되지 않는 주석은 전환 후 표시되지 않습니다.
주요 기능
스마트 스토리지
Ultralytics 효율적인 데이터 관리를 위해 콘텐츠 주소 지정 저장소(CAS)를 사용합니다:
- 중복 제거: XXH3-128 해싱을 통해 동일한 이미지는 한 번만 저장됩니다.
- 무결성: 해시 기반 주소 지정은 데이터 무결성을 보장합니다.
- 효율성: 최적화된 저장 공간 및 빠른 처리
데이터셋 URI
다음과 같은 참조 데이터셋 ul:// URI 형식 (참조 플랫폼 데이터셋 사용):
yolo train data=ul://username/datasets/my-dataset
API 키가 구성된 모든 기기에서 플랫폼의 데이터셋을 활용하여 훈련할 수 있습니다.
Python에서 플랫폼 데이터 사용하기
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
데이터셋 버전 관리
재현 가능한 학습을 위해 데이터셋의 불변 NDJSON 스냅샷을 생성합니다. 각 버전은 생성 시점의 이미지 수, 클래스 수 및 주석 수를 캡처합니다. 자세한 내용은 버전 탭을 참조하십시오.
데이터셋 탭
모든 데이터셋 페이지에는 여섯 개의 탭이 제공됩니다:
| 탭 | 설명 |
|---|---|
| 이미지 | 주석 오버레이와 함께 그리드, 압축 또는 테이블 보기로 이미지 탐색 |
| 클래스 | 클래스별 클래스 이름, 색상 및 레이블 수를 확인하고 편집합니다 |
| 차트 | 자동 통계: 분할 분포, 클래스 개수, 히트맵 |
| 모델 | 모델: 이 데이터셋으로 학습된 모델과 지표 및 상태 |
| 버전 | 재현 가능한 훈련을 위해 변경 불가능한 NDJSON 스냅샷을 생성하고 다운로드합니다. |
| 오류 | 처리 실패한 이미지와 오류 세부 정보 및 수정 안내 |
통계 및 시각화
에 지정되어 있습니다. Charts 탭은 다음과 같은 자동 분석을 제공합니다:
- 분할 분포: 학습/검증/테스트 이미지 수의 도넛 차트
- 상위 클래스: 가장 빈번한 주석 클래스의 도넛 차트
- 이미지 너비: 이미지 너비 분포 히스토그램
- 이미지 높이: 이미지 높이 분포 히스토그램
- 인스턴스당 포인트: 다각형 정점 또는 키포인트 개수 분포 (segment/pose 데이터셋)
- 주석 위치: 바운딩 박스 중심 위치의 2D 히트맵
- 이미지 크기: 가로세로 비율 가이드 라인이 있는 너비 대 높이의 2D 히트맵
빠른 링크
- 데이터셋: 학습 데이터 업로드, 관리 및 내보내기
- 어노테이션: 수동 및 AI 지원 도구를 사용한 레이블 데이터
- 클라우드 학습: 주석이 달린 데이터셋으로 모델 학습
- 데이터셋 URI: 사용
ul://어디서나 학습할 수 있는 URI
FAQ
업로드에 지원되는 파일 형식은 무엇인가요?
Ultralytics Platform은 다음을 지원합니다:
이미지: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (각 최대 50MB)
동영상: MP4, WebM, MOV, AVI, MKV, M4V (최대 1GB, 초당 1프레임 추출, 최대 100프레임)
데이터셋 파일: 다음이 포함된 ZIP 또는 TAR 아카이브 .tar.gz 및 .tgz (무료 플랜 10GB, Pro 플랜 20GB, Enterprise 플랜 50GB 제한) 이미지를 포함하며, 선택적으로 YOLO 레이블, NDJSON 내보내기 포함
최대 데이터셋 크기는 얼마인가요?
저장 공간 제한은 플랜에 따라 다릅니다:
| 플랜 | 저장 공간 제한 |
|---|---|
| 무료 | 100 GB |
| Pro | 500 GB |
| 엔터프라이즈 | 무제한 |
파일당 용량 제한: 이미지 50MB, 동영상 1GB, 데이터 세트 무료 버전 10GB / 프로 버전 20GB / 엔터프라이즈 버전 50GB
내 플랫폼 데이터셋을 로컬 학습에 사용할 수 있습니까?
예! 로컬에서 학습하려면 데이터셋 URI 형식을 사용하십시오:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
또는 완전히 오프라인 상태에서 훈련할 수 있도록 데이터셋을 NDJSON 형식으로 내보내세요.