클라우드 학습

Ultralytics Platform 클라우드 학습은 클라우드 GPU에서 클릭 한 번으로 학습을 시작할 수 있게 하여 복잡한 설정 없이도 모델 학습을 가능하게 합니다. 실시간 메트릭 스트리밍과 자동 체크포인트 저장 기능을 사용하여 YOLO 모델을 학습하십시오.

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

학습 대화 상자

플랫폼 UI의 모든 프로젝트 페이지에서 **새 모델(New Model)**을 클릭(또는 데이터셋 페이지에서 학습(Train) 클릭)하여 학습을 시작하십시오. 학습 대화 상자에는 **클라우드 학습(Cloud Training)**과 **로컬 학습(Local Training)**이라는 두 개의 탭이 있습니다.

Ultralytics Platform Training Dialog Cloud Tab

1단계: 기본 모델 선택

공식 YOLO26 모델 또는 직접 학습한 모델 중에서 선택하십시오:

카테고리설명
공식(Official)총 25개의 YOLO26 모델 (5가지 크기 x 5가지 작업)
내 모델(Your Models)파인튜닝을 위해 완료된 모델

공식 모델은 작업 유형(Detect, Segment, Pose, OBB, Classify)별로 정리되어 있으며, nano부터 xlarge까지 다양한 크기로 제공됩니다.

2단계: 데이터셋 선택

학습할 데이터셋을 선택하십시오 (데이터셋 참조):

옵션설명
공식(Official)Ultralytics에서 큐레이팅한 데이터셋
내 데이터셋(Your Datasets)업로드한 데이터셋
데이터셋 요구 사항

데이터셋은 ready 상태여야 하며, 학습 분할(train split)에 최소 1개, 검증(validation) 또는 테스트 분할(test split)에 최소 1개의 이미지가 포함되어야 하고, 최소 1개의 라벨링된 이미지가 있어야 합니다.

작업 불일치

모델 작업(예: detect)과 데이터셋 작업(예: segment)이 일치하지 않으면 작업 불일치 경고가 표시됩니다. 작업을 일치시키지 않고 진행하면 학습이 실패합니다. 작업 가이드에 설명된 대로 모델과 데이터셋이 동일한 작업 유형을 사용하도록 하십시오.

3단계: 매개변수 구성

주요 학습 매개변수를 설정하십시오:

매개변수설명기본값
Epochs학습 반복 횟수100
Batch Size반복당 샘플 수-1 (자동)
이미지 크기입력 해상도 (320/416/512/640/1280 드롭다운, YAML 편집기에서는 32-4096 사이의 32 배수 입력 가능)640
Run Name학습 실행을 위한 선택적 이름auto

4단계: 고급 설정 (선택 사항)

**고급 설정(Advanced Settings)**을 확장하여 그룹별로 정리된 40개 이상의 학습 매개변수를 포함하는 전체 YAML 기반 매개변수 편집기에 액세스하십시오 (구성 참조 참조):

그룹매개변수
학습률 (Learning Rate)lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
옵티마이저auto (기본값), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
손실 가중치box, cls, dfl, pose, kobj, label_smoothing
색상 증강hsv_h, hsv_s, hsv_v
기하학적 증강degrees, translate, scale, shear, perspective
뒤집기 및 혼합 증강flipud, fliplr, mosaic, mixup, copy_paste
학습 제어patience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
데이터셋fraction, freeze, single_cls, rect, multi_scale, resume

매개변수는 작업 인식형입니다 (예: copy_paste는 세그먼트 작업에서만, pose/kobj는 포즈 작업에서만 표시됨). 기본값과 다른 경우 수정됨(Modified) 배지가 나타나며, 재설정 버튼을 사용하여 모두 기본값으로 되돌릴 수 있습니다.

예시: 소규모 데이터셋을 위한 증강 튜닝

소규모 데이터셋(<1000 이미지)의 경우, 과적합을 줄이기 위해 증강을 늘리십시오:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

5단계: GPU 선택 (클라우드 탭)

Ultralytics 클라우드에서 GPU를 선택하십시오:

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPU세대VRAM시간당 비용최적 대상
RTX 2000 AdaAda16 GB$0.24소규모 데이터셋, 테스트
RTX A4500Ampere20 GB$0.25중소규모 데이터셋
RTX 4000 AdaAda20 GB$0.26중규모 데이터셋
RTX A5000Ampere24 GB$0.27중규모 데이터셋
L4Ada24 GB$0.39추론 최적화
A40Ampere48 GB$0.44더 큰 배치 크기
RTX 3090Ampere24 GB$0.46일반 학습
RTX A6000Ampere48 GB$0.49대형 모델
RTX PRO 4500Blackwell32 GB$0.64우수한 가격 대비 성능
RTX 4090Ada24 GB$0.69최고의 가격 대비 성능
RTX 6000 AdaAda48 GB$0.77대규모 배치 학습
L40SAda48 GB$0.86대규모 배치 학습
RTX 5090Blackwell32 GB$0.99최신 소비자용 세대
L40Ada48 GB$0.99대형 모델
A100 PCIeAmpere80 GB$1.39프로덕션 학습
A100 SXMAmpere80 GB$1.49프로덕션 학습
RTX PRO 6000Blackwell96 GB$1.89권장 기본 설정
H100 PCIeHopper80 GB$2.39고성능 학습
H100 SXMHopper80 GB$2.99가장 빠른 학습
H100 NVLHopper94 GB$3.07최대 성능
H200 NVLHopper143 GB$3.39최대 메모리
H200 SXMHopper141 GB$3.99최대 성능
B200Blackwell180 GB$5.49대규모 모델 (Pro+)
B300Blackwell288 GB$7.39최대 규모 모델 (Pro+)
GPU 선택
  • RTX PRO 6000: 96 GB Blackwell, 대부분의 작업에 권장되는 기본값
  • A100 SXM: 80 GB HBM2e — 대규모 배치 크기나 더 큰 모델에 적합
  • H100 PCIe / H100 SXM / H100 NVL: 시간 제약이 있는 학습을 위한 80–94 GB Hopper (모든 플랜에서 사용 가능)
  • H200 NVL / H200 SXM: 고메모리 워크로드를 위한 141–143 GB Hopper (모든 플랜에서 사용 가능)
  • B200 / B300: 최첨단 워크로드를 위한 180–288 GB NVIDIA Blackwell — Pro 또는 Enterprise가 필요함

대화 상자에는 현재 잔액충전(Top Up) 버튼이 표시됩니다. 구성(모델 크기, 데이터셋 이미지, 에포크, GPU 속도)을 기반으로 예상 비용과 소요 시간이 계산됩니다.

6단계: 학습 시작

**학습 시작(Start Training)**을 클릭하여 작업을 시작하십시오. 플랫폼은 다음을 수행합니다:

  1. GPU 인스턴스 프로비저닝
  2. 데이터셋 다운로드
  3. 학습 시작
  4. 실시간 메트릭 스트리밍

학습 작업 수명 주기

학습 작업은 다음 상태를 거칩니다:

상태설명
대기 중(Pending)작업이 제출되었으며 GPU 할당 대기 중
시작 중(Starting)GPU가 프로비저닝되었으며 데이터셋 및 모델 다운로드 중
실행 중(Running)학습 진행 중이며 실시간으로 메트릭 스트리밍 중
완료됨(Completed)학습이 성공적으로 완료됨
실패함(Failed)학습 실패 (자세한 내용은 콘솔 로그 참조)
취소됨(Cancelled)사용자에 의해 학습이 취소됨
무료 크레딧

새 계정은 가입 시 크레딧을 받습니다. 개인 이메일은 $5, 회사 이메일은 $25가 제공됩니다. 설정 > 결제(Billing)에서 잔액을 확인하십시오.

Ultralytics Platform Training Progress With Charts

학습 모니터링

모델 페이지의 학습(Train) 탭에서 실시간 학습 진행 상황을 확인하십시오:

차트 하위 탭

Ultralytics Platform Model Training Live Charts

메트릭설명
손실(Loss)학습 및 검증 손실
mAP평균 정밀도 (Mean Average Precision)
정밀도(Precision)올바른 양성 예측
재현율(Recall)감지된 정답(ground truths)

콘솔 하위 탭

ANSI 색상 지원, 진행률 표시줄 및 오류 감지 기능이 포함된 실시간 콘솔 출력.

시스템 하위 탭

실시간 GPU 사용률, 메모리, 온도, CPU 및 디스크 사용량.

체크포인트

학습이 완료되면 최고 성능 모델(best.pt, mAP가 가장 높은 체크포인트)이 플랫폼에 업로드되어 다운로드, 내보내기 및 배포에 사용할 수 있게 됩니다.

학습 취소

실행 중인 작업을 중지하려면 모델 페이지에서 **학습 취소(Cancel Training)**를 클릭하십시오:

  • 컴퓨팅 인스턴스가 종료됩니다.
  • 크레딧 청구가 중단됩니다.
  • 취소 전에 최고 체크포인트에 도달했다면 해당 파일은 그대로 유지됩니다.

원격 학습

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

자체 하드웨어에서 학습을 진행하면서 메트릭을 플랫폼으로 스트리밍합니다.

패키지 버전 요구 사항

플랫폼 통합을 위해서는 ultralytics>=8.4.35가 필요합니다. 하위 버전은 플랫폼과 작동하지 않습니다.

pip install -U ultralytics

API 키 설정

  1. Settings > API Keys로 이동합니다.
  2. 새 키를 생성하십시오(또는 로컬 학습 탭을 열면 플랫폼이 자동으로 키를 생성합니다).
  3. 환경 변수를 설정하십시오:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

스트리밍을 통한 학습

메트릭을 스트리밍하려면 projectname 파라미터를 사용하십시오:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

학습 대화 상자의 로컬 학습(Local Training) 탭에는 API 키, 선택한 파라미터 및 고급 인수가 포함된 사전 구성된 명령어가 표시됩니다.

플랫폼 데이터셋 사용

ul:// URI 형식을 사용하여 플랫폼에 저장된 데이터셋으로 학습합니다:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

ul:// URI 형식은 데이터셋을 자동으로 다운로드하고 구성합니다. 모델은 플랫폼상의 데이터셋과 자동으로 연결됩니다(참조: 플랫폼 데이터셋 사용).

결제

학습 비용은 GPU 사용량을 기준으로 책정됩니다:

비용 추정

학습 시작 전, 플랫폼은 다음과 같이 총 비용을 추정합니다:

  1. 데이터셋 크기, 모델 복잡도, 이미지 크기, 배치 크기 및 GPU 속도를 기반으로 에포크당 초(seconds per epoch) 추정
  2. 에포크당 초를 에포크 수에 곱한 뒤 시작 오버헤드를 더하여 총 학습 시간 계산
  3. 총 학습 시간에 GPU 시간당 요금을 곱하여 예상 비용 산출

비용에 영향을 미치는 요소:

요소영향
데이터셋 크기이미지가 많을수록 학습 시간이 길어집니다(기준: RTX 4090에서 1000개 이미지당 약 2.8초 컴퓨팅).
모델 크기더 큰 모델(m, l, x)은 (n, s)보다 느리게 학습됩니다.
에포크 수학습 시간에 직접적인 승수 역할을 합니다.
이미지 크기더 큰 imgsz는 계산량을 증가시킵니다: 320px=0.25배, 640px=1.0배(기준), 1280px=4.0배
Batch Size배치가 클수록 더 효율적입니다(배치 32 = 약 0.85배 시간, 배치 8 = 배치 16 기준 대비 약 1.2배 시간)
GPU 속도더 빠른 GPU는 학습 시간을 단축합니다(예: H100 SXM = RTX 4090 대비 약 3.4배 빠름)
시작 오버헤드인스턴스 초기화, 데이터 다운로드 및 웜업에 최대 5분 소요(데이터셋 크기에 따라 다름)

비용 예시

추정치

비용 추정치는 대략적인 값이며 여러 요인에 따라 달라집니다. 학습 대화 상자에서 학습 시작 전 실시간 추정치를 확인할 수 있습니다.

시나리오GPU예상 비용
이미지 500개, YOLO26n, 50 에포크RTX 4090~$0.50
이미지 1000개, YOLO26n, 100 에포크RTX PRO 6000~$5
이미지 5000개, YOLO26s, 100 에포크H100 SXM~$23

결제 흐름

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

클라우드 학습 결제 흐름:

  1. 추정: 학습 시작 전 비용 계산
  2. 잔액 확인: 실행 전 사용 가능한 크레딧 확인
  3. 학습: 선택한 컴퓨팅 환경에서 작업 실행
  4. 청구: 실제 실행 시간을 기준으로 최종 비용 청구
소비자 보호

결제 시스템은 취소된 부분 실행을 포함하여 실제 컴퓨팅 사용량을 추적합니다. 실패한 학습 작업에 대해서는 비용이 청구되지 않습니다.

작업 상태별 결제

상태청구 여부
완료됨(Completed)예 — 실제 사용된 GPU 시간
취소됨(Cancelled)예 — 시작부터 취소 시점까지의 GPU 시간
실패함(Failed)아니요 — 실패한 작업은 청구되지 않음
Stuck(작업 멈춤)부분 청구 — 실제 학습 시간만 청구됨
오류에 대한 비용 청구 없음

구성 오류, 메모리 부족 문제 또는 기타 장애로 인해 학습이 실패할 경우 비용은 청구되지 않습니다. 성공적인 컴퓨팅 시간에 대해서만 청구됩니다. 중단된 작업(4시간 이상 활동 없음)은 자동으로 종료되며, 유휴 시간이 아닌 GPU가 실제로 학습 중이었던 시간에 대해서만 비용이 청구됩니다.

결제 수단

방법설명
계정 잔액사전 충전된 크레딧
작업별 결제(Pay Per Job)작업 완료 시 결제
최소 잔액

학습을 시작하려면 잔액이 양수여야 하며, 예상 작업 비용을 충당할 만큼의 크레딧이 있어야 합니다.

학습 비용 확인

학습 후 Billing(결제) 탭에서 상세 비용을 확인하십시오:

  • 에포크당 비용 분석
  • 총 GPU 시간
  • 비용 보고서 다운로드

Ultralytics Platform Training Billing Details

학습 팁

적절한 모델 크기 선택

모델매개변수최적 대상
YOLO26n2.4M실시간, 엣지 장치
YOLO26s9.5M속도/정확도 균형
YOLO26m20.4M더 높은 정확도
YOLO26l24.8M프로덕션 정확도
YOLO26x55.7M최대 정확도

학습 시간 최적화

비용 절감 전략
  1. 작게 시작: 예산 GPU에서 10~20 에포크로 테스트하여 데이터셋과 구성이 제대로 작동하는지 확인하십시오.
  2. 적절한 GPU 사용: RTX PRO 6000은 대부분의 워크로드를 잘 처리합니다.
  3. 데이터셋 검증: 학습에 비용을 쓰기 전에 라벨링 문제를 수정하십시오.
  4. 초기 모니터링: 손실(loss)이 정체되면 학습을 취소하십시오. 사용된 컴퓨팅 시간에 대해서만 비용이 발생합니다.

문제 해결

문제해결책
학습이 0%에서 멈춤데이터셋 형식을 확인하고 재시도하십시오.
메모리 부족(Out of memory)배치 크기를 줄이거나 더 큰 GPU를 사용하십시오.
정확도 저하에폭(epochs)을 늘리고 데이터 품질을 확인하십시오.
학습이 느림더 빠른 GPU 사용을 고려하십시오.
태스크 불일치 오류모델과 데이터셋의 태스크가 일치하는지 확인하십시오.

FAQ

학습에 얼마나 걸립니까?

학습 시간은 다음에 따라 달라집니다:

  • 데이터셋 크기
  • 모델 크기
  • 에포크 수
  • 선택된 GPU

일반적인 소요 시간 (1000개 이미지, 100 에폭):

모델RTX PRO 6000A100 SXM
YOLO26n~20분~15분
YOLO26m~40분~30분
YOLO26x~80분~60분
대략적인 소요 시간

학습 시간은 대략적인 수치이며 데이터셋 복잡도, 증강 설정, 배치 크기에 따라 달라집니다. 더 정확한 예측을 위해서는 학습 대화 상자의 비용 추정치를 사용하십시오.

야간에 학습을 진행할 수 있습니까?

네, 학습은 완료될 때까지 계속 진행됩니다. 학습이 종료되면 알림을 받게 됩니다. 에폭 기반 학습을 위해 계정에 충분한 잔액이 있는지 확인하십시오.

크레딧이 부족하면 어떻게 됩니까?

학습 실행 중 크레딧 잔액이 0이 되면 학습은 완료될 때까지 계속되며 잔액은 마이너스가 됩니다. 이는 학습 작업이 중간에 중단되지 않도록 하기 위함입니다.

학습이 완료된 후, 새로운 학습 작업을 시작하기 전에 잔액을 다시 플러스로 만들기 위해 크레딧을 추가해야 합니다. 완료된 모델, 체크포인트 및 모든 학습 아티팩트는 잔액과 관계없이 완전히 보존됩니다.

마이너스 잔액

마이너스 잔액은 새로운 학습 작업 시작만 방지합니다. 기존 배포 및 기타 플랫폼 기능은 정상적으로 작동합니다. 중단을 방지하려면 Settings > Billing을 통해 크레딧을 추가하거나 자동 충전 기능을 활성화하십시오.

학습 비용이 추정치보다 많이 나오면 어떻게 됩니까?

비용 추정치는 대략적인 것이며, 실제 학습 시간은 데이터 로딩 속도, GPU 웜업, 모델 수렴 동작 등의 요인으로 인해 달라질 수 있습니다. 실제 비용이 추정치를 초과하면 잔액이 마이너스가 될 수 있습니다(위 참조). 플랫폼은 추정치를 기준으로 학습을 중단하지 않습니다.

비용 관리 방법:

  • 학습 진행 상황을 실시간으로 모니터링하고 필요 시 조기에 취소하십시오.
  • 자동 충전을 활성화하여 크레딧을 자동으로 보충하십시오.
  • 예상치를 조정하기 위해 짧은 실행(더 적은 에폭)으로 시작하십시오.

사용자 지정 학습 인자를 사용할 수 있습니까?

네, 학습 대화 상자에서 고급 설정(Advanced Settings) 섹션을 확장하면 40개 이상의 구성 가능한 매개변수가 있는 YAML 편집기에 액세스할 수 있습니다. 기본값이 아닌 값은 클라우드 및 로컬 학습 명령어 모두에 포함됩니다.

YAML 편집기는 이전 학습 실행에서 구성을 가져오는 것도 지원합니다:

  • 기존 모델에서 복사: 완료된 모델 페이지의 학습 구성 카드에는 JSON으로 복사(Copy as JSON) 버튼이 있습니다. JSON을 복사하여 YAML 편집기에 직접 붙여넣으면 JSON 형식을 자동 감지하고 모든 매개변수를 가져옵니다.
  • YAML 또는 JSON 붙여넣기: 유효한 YAML 또는 JSON 학습 구성을 편집기에 붙여넣으십시오. 매개변수는 자동으로 검증되며, 범위를 벗어난 값은 클램핑되고 경고가 표시됩니다.
  • 파일 드래그 앤 드롭: .yaml 또는 .json 파일을 편집기로 직접 드래그하여 매개변수를 가져올 수 있습니다.

Ultralytics Platform Training Dialog Copy Training Config JSON

이를 통해 매개변수를 수동으로 다시 입력하지 않고도 이전 학습 구성을 쉽게 재현하거나 반복할 수 있습니다.

데이터셋 페이지에서 학습할 수 있습니까?

네, 데이터셋 페이지의 학습(Train) 버튼을 누르면 데이터셋이 미리 선택되고 고정된 상태로 학습 대화 상자가 열립니다. 그 후 프로젝트와 모델을 선택하여 학습을 시작할 수 있습니다.

학습 매개변수 참조

매개변수유형기본값범위설명
epochsint1001-10000학습 에폭 수
batchint-1 (자동)-1 ~ 512배치 크기 (-1 = 사용 가능한 VRAM에 자동 맞춤)
imgszint64032-4096입력 이미지 크기
patienceint1001-1000조기 종료 허용 오차
seedint00-2147483647재현성을 위한 난수 시드
deterministicboolTrue-결정론적 학습 모드
ampboolTrue-자동 혼합 정밀도(Automatic mixed precision)
close_mosaicint100-50마지막 N 에폭에서 모자이크 비활성화
save_periodint-1-1-100N 에폭마다 체크포인트 저장
workersint80-64데이터 로더 워커
cacheselectfalseram/disk/false이미지 캐시
작업별 매개변수

일부 매개변수는 특정 작업에만 적용됩니다:

  • 탐지 작업 전용 (detect, segment, pose, OBB — 분류 제외): box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • 세그먼트 전용: copy_paste
  • 포즈 전용: pose (손실 가중치), kobj (키포인트 객체성)

댓글