콘텐츠로 건너뛰기

데이터 준비

데이터 준비는 성공적인 컴퓨터 비전 모델의 기반입니다. Ultralytics Platform은 업로드부터 어노테이션, 분석에 이르기까지 학습 데이터를 관리하기 위한 포괄적인 도구를 제공합니다.

개요

Ultralytics Platform의 데이터 섹션은 다음을 지원합니다:

  • 이미지, 동영상 및 압축 파일(ZIP, TAR, GZ) 업로드
  • 수동 그리기 도구 및 SAM 스마트 라벨링으로 주석 추가
  • 분석: 통계 및 시각화를 통해 데이터 분석
  • NDJSON 형식으로 내보내기 (로컬 훈련용)

Ultralytics 데이터 개요 사이드바 데이터셋

워크플로우

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
단계설명
업로드이미지, 동영상 또는 아카이브를 자동 처리와 함께 가져오기
어노테이션바운딩 박스, 폴리곤, 키포인트 또는 분류로 데이터 라벨링
분석클래스 분포, 공간 히트맵 및 차원 통계 확인
내보내기오프라인 사용을 위해 NDJSON 형식으로 다운로드

지원되는 작업

Ultralytics 플랫폼은 5가지 YOLO 작업 유형을 모두 지원합니다:

작업설명어노테이션 도구
Detect바운딩 박스를 이용한 객체 detect사각형 도구
Segment픽셀 마스크를 이용한 인스턴스 segment폴리곤 도구
포즈키포인트 추정 (17포인트 COCO 형식)키포인트 도구
OBB회전된 객체를 위한 지향성 바운딩 박스지향성 박스 도구
Classify이미지 레벨 분류클래스 선택기

작업 유형 선택

작업 유형은 데이터셋 생성 시 설정되며, 사용 가능한 주석 도구를 결정합니다. 데이터셋 설정에서 나중에 변경할 수 있지만, 호환되지 않는 주석은 전환 후 표시되지 않습니다.

주요 기능

스마트 스토리지

Ultralytics 효율적인 데이터 관리를 위해 콘텐츠 주소 지정 저장소(CAS)를 사용합니다:

  • 중복 제거: XXH3-128 해싱을 통해 동일한 이미지는 한 번만 저장
  • 무결성: 해시 기반 주소 지정은 데이터 무결성을 보장합니다
  • 효율성: 최적화된 저장 공간 및 빠른 처리

데이터셋 URI

다음과 같은 참조 데이터셋 ul:// URI 형식 (참조 플랫폼 데이터셋 사용):

yolo train data=ul://username/datasets/my-dataset

API 키가 구성된 모든 기기에서 플랫폼의 데이터셋을 활용하여 훈련할 수 있습니다.

Python에서 플랫폼 데이터 사용하기

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

데이터셋 탭

모든 데이터셋 페이지에는 다섯 개의 탭이 제공됩니다:

설명
이미지이미지를 그리드, 컴팩트 또는 테이블 뷰로 탐색하고 주석 오버레이를 적용하세요
수업클래스별 클래스 이름, 색상 및 레이블 수를 확인하고 편집합니다
차트자동 통계: 분할 분포, 클래스 개수, 히트맵
모델이 데이터셋으로 훈련된 모델의 지표 및 상태
오류처리 실패한 이미지와 오류 세부 정보 및 수정 안내

통계 및 시각화

에 지정되어 있습니다. Charts 탭은 다음과 같은 자동 분석을 제공합니다:

  • 분할 분포: 훈련/검증/테스트 이미지 개수 도넛 차트
  • 상위 클래스: 가장 빈번한 어노테이션 클래스의 도넛 차트
  • 이미지 너비: 이미지 너비 분포 히스토그램
  • 이미지 높이: 이미지 높이 분포 히스토그램
  • 인스턴스당 포인트: 다각형 정점 또는 키포인트 수 분포 (segment 데이터셋)
  • 주석 위치: 바운딩 박스 중심 위치의 2D 히트맵
  • 이미지 크기: 가로 대 세로 비율의 2D 히트맵과 종횡비 가이드라인
  • 데이터셋: 훈련 데이터를 업로드하고 관리합니다.
  • 어노테이션: 수동 및 AI 지원 도구를 사용한 레이블 데이터

FAQ

업로드에 지원되는 파일 형식은 무엇인가요?

Ultralytics Platform은 다음을 지원합니다:

이미지: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (각 파일 최대 50MB)

동영상: MP4, WebM, MOV, AVI, MKV, M4V (최대 1GB, 초당 1프레임 추출, 최대 100프레임)

아카이브: ZIP, TAR, TAR.GZ, TGZ, GZ (최대 10GB) 이미지 포함 (선택 사항: YOLO 라벨 포함)

최대 데이터셋 크기는 얼마인가요?

저장 공간 제한은 플랜에 따라 다릅니다:

플랜저장 공간 제한
무료100 GB
Pro500 GB
엔터프라이즈사용자 정의

개별 파일 제한: 이미지 50MB, 동영상 1GB, 압축 파일 10GB

내 플랫폼 데이터셋을 로컬 학습에 사용할 수 있습니까?

예! 로컬에서 학습하려면 데이터셋 URI 형식을 사용하십시오:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

또는 완전히 오프라인 상태에서 훈련할 수 있도록 데이터셋을 NDJSON 형식으로 내보내세요.



5; 1 전에 생성됨 ✏️ 4 전에 업데이트됨
glenn-jochersergiuwaxmann

댓글