데이터 준비
데이터 준비는 성공적인 컴퓨터 비전 모델의 기반입니다. Ultralytics Platform은 업로드부터 어노테이션, 분석에 이르기까지 학습 데이터를 관리하기 위한 포괄적인 도구를 제공합니다.
개요
Ultralytics Platform의 데이터 섹션은 다음을 지원합니다:
- 이미지, 동영상 및 압축 파일(ZIP, TAR, GZ) 업로드
- 수동 그리기 도구 및 SAM 스마트 라벨링으로 주석 추가
- 분석: 통계 및 시각화를 통해 데이터 분석
- NDJSON 형식으로 내보내기 (로컬 훈련용)

워크플로우
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 단계 | 설명 |
|---|---|
| 업로드 | 이미지, 동영상 또는 아카이브를 자동 처리와 함께 가져오기 |
| 어노테이션 | 바운딩 박스, 폴리곤, 키포인트 또는 분류로 데이터 라벨링 |
| 분석 | 클래스 분포, 공간 히트맵 및 차원 통계 확인 |
| 내보내기 | 오프라인 사용을 위해 NDJSON 형식으로 다운로드 |
지원되는 작업
Ultralytics 플랫폼은 5가지 YOLO 작업 유형을 모두 지원합니다:
| 작업 | 설명 | 어노테이션 도구 |
|---|---|---|
| Detect | 바운딩 박스를 이용한 객체 detect | 사각형 도구 |
| Segment | 픽셀 마스크를 이용한 인스턴스 segment | 폴리곤 도구 |
| 포즈 | 키포인트 추정 (17포인트 COCO 형식) | 키포인트 도구 |
| OBB | 회전된 객체를 위한 지향성 바운딩 박스 | 지향성 박스 도구 |
| Classify | 이미지 레벨 분류 | 클래스 선택기 |
작업 유형 선택
작업 유형은 데이터셋 생성 시 설정되며, 사용 가능한 주석 도구를 결정합니다. 데이터셋 설정에서 나중에 변경할 수 있지만, 호환되지 않는 주석은 전환 후 표시되지 않습니다.
주요 기능
스마트 스토리지
Ultralytics 효율적인 데이터 관리를 위해 콘텐츠 주소 지정 저장소(CAS)를 사용합니다:
- 중복 제거: XXH3-128 해싱을 통해 동일한 이미지는 한 번만 저장
- 무결성: 해시 기반 주소 지정은 데이터 무결성을 보장합니다
- 효율성: 최적화된 저장 공간 및 빠른 처리
데이터셋 URI
다음과 같은 참조 데이터셋 ul:// URI 형식 (참조 플랫폼 데이터셋 사용):
yolo train data=ul://username/datasets/my-dataset
API 키가 구성된 모든 기기에서 플랫폼의 데이터셋을 활용하여 훈련할 수 있습니다.
Python에서 플랫폼 데이터 사용하기
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
데이터셋 탭
모든 데이터셋 페이지에는 다섯 개의 탭이 제공됩니다:
| 탭 | 설명 |
|---|---|
| 이미지 | 이미지를 그리드, 컴팩트 또는 테이블 뷰로 탐색하고 주석 오버레이를 적용하세요 |
| 수업 | 클래스별 클래스 이름, 색상 및 레이블 수를 확인하고 편집합니다 |
| 차트 | 자동 통계: 분할 분포, 클래스 개수, 히트맵 |
| 모델 | 이 데이터셋으로 훈련된 모델의 지표 및 상태 |
| 오류 | 처리 실패한 이미지와 오류 세부 정보 및 수정 안내 |
통계 및 시각화
에 지정되어 있습니다. Charts 탭은 다음과 같은 자동 분석을 제공합니다:
- 분할 분포: 훈련/검증/테스트 이미지 개수 도넛 차트
- 상위 클래스: 가장 빈번한 어노테이션 클래스의 도넛 차트
- 이미지 너비: 이미지 너비 분포 히스토그램
- 이미지 높이: 이미지 높이 분포 히스토그램
- 인스턴스당 포인트: 다각형 정점 또는 키포인트 수 분포 (segment 데이터셋)
- 주석 위치: 바운딩 박스 중심 위치의 2D 히트맵
- 이미지 크기: 가로 대 세로 비율의 2D 히트맵과 종횡비 가이드라인
빠른 링크
FAQ
업로드에 지원되는 파일 형식은 무엇인가요?
Ultralytics Platform은 다음을 지원합니다:
이미지: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (각 파일 최대 50MB)
동영상: MP4, WebM, MOV, AVI, MKV, M4V (최대 1GB, 초당 1프레임 추출, 최대 100프레임)
아카이브: ZIP, TAR, TAR.GZ, TGZ, GZ (최대 10GB) 이미지 포함 (선택 사항: YOLO 라벨 포함)
최대 데이터셋 크기는 얼마인가요?
저장 공간 제한은 플랜에 따라 다릅니다:
| 플랜 | 저장 공간 제한 |
|---|---|
| 무료 | 100 GB |
| Pro | 500 GB |
| 엔터프라이즈 | 사용자 정의 |
개별 파일 제한: 이미지 50MB, 동영상 1GB, 압축 파일 10GB
내 플랫폼 데이터셋을 로컬 학습에 사용할 수 있습니까?
예! 로컬에서 학습하려면 데이터셋 URI 형식을 사용하십시오:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
또는 완전히 오프라인 상태에서 훈련할 수 있도록 데이터셋을 NDJSON 형식으로 내보내세요.