Meet YOLO26: next-gen vision AI.

Link to this section추론#

Ultralytics Platform은 학습된 모델을 테스트하기 위한 추론 API를 제공합니다. 브라우저 기반의 Predict 탭을 사용하여 빠르게 검증하거나 REST API를 통해 프로그래밍 방식으로 접근할 수 있습니다.

Ultralytics Platform Model Predict Tab With Detections Overlay

Link to this section예측 탭#

모든 모델에는 브라우저 기반 추론을 위한 Predict 탭이 포함되어 있습니다:

  1. 모델로 이동합니다
  2. Predict 탭을 클릭합니다
  3. 이미지를 업로드하거나, 예제를 사용하거나, 웹캠을 엽니다
  4. 바운딩 박스 오버레이가 포함된 예측 결과를 즉시 확인합니다

Ultralytics Platform Predict Tab Image Upload Dropzone

Link to this section입력 방식#

Predict 패널은 여러 입력 방식을 지원합니다:

메서드설명
이미지 업로드이미지를 드래그 앤 드롭하거나 클릭하여 업로드합니다
예제 이미지내장된 예제(데이터셋 이미지 또는 기본값)를 클릭합니다
웹캠 캡처단일 프레임 캡처 기능이 있는 실시간 카메라 피드입니다
graph LR
    A[Upload Image] --> D[Auto-Inference]
    B[Example Image] --> D
    C[Webcam Capture] --> D
    D --> E[Results + Overlays]

    style D fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Link to this section이미지 업로드#

드래그 앤 드롭하거나 클릭하여 업로드하세요:

  • 지원되는 형식: JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP, DNG, MPO
  • 최대 크기: 10MB
  • 자동 추론: 업로드 후 결과가 자동으로 표시됩니다
자동 추론

Predict 패널은 이미지 업로드, 예제 선택 또는 웹캠 프레임 캡처 시 자동으로 추론을 실행합니다. 별도의 버튼 클릭은 필요하지 않습니다.

Link to this section예제 이미지#

Predict 패널은 모델에 연결된 데이터셋의 예제 이미지를 보여줍니다. 연결된 데이터셋이 없는 경우 기본 예제가 사용됩니다:

이미지콘텐츠
bus.jpg차량이 있는 거리 풍경
zidane.jpg사람들이 있는 스포츠 경기 장면

OBB 모델의 경우, 대신 보트와 공항의 항공 사진이 표시됩니다.

사전 로드된 이미지

페이지 로드 시 예제 이미지가 사전 로드되므로, 예제를 클릭하면 다운로드 대기 시간 없이 거의 즉시 추론이 시작됩니다.

Link to this section웹캠#

웹캠 카드를 클릭하여 실시간 카메라 피드를 시작합니다:

  1. 메시지가 표시되면 카메라 권한을 허용합니다
  2. 비디오 미리보기를 클릭하여 프레임을 캡처합니다
  3. 캡처된 프레임에서 자동으로 추론이 실행됩니다
  4. 다시 클릭하면 웹캠이 재시작됩니다

Link to this section결과 확인#

추론 결과 표시 항목:

  • 바운딩 박스: 클래스 레이블이 포함된 SVG 오버레이
  • 신뢰도 점수: 각 탐지 결과에 대한 수치
  • 클래스 색상: 데이터셋의 색상 팔레트(또는 Ultralytics 기본 팔레트)에서 지정
  • 속도 분석: 전처리, 추론, 후처리 및 네트워크 시간

Ultralytics Platform Predict Tab Results With Detections And Speed Stats

결과 패널 표시 내용:

필드설명
탐지 목록클래스 이름과 신뢰도가 포함된 각 탐지 결과
속도 통계전처리, 추론, 후처리, 네트워크(ms 단위)
JSON 응답코드 블록 내 원시 API 응답

Link to this section추론 파라미터#

접기 가능한 파라미터 섹션에서 탐지 동작을 조정할 수 있습니다:

Ultralytics Platform Predict Tab Parameters Sliders

파라미터범위기본값설명
신뢰도(Confidence)0.01 – 1.00.25최소 신뢰도 임계값
IoU0.0 – 0.950.7NMS IoU 임계값
이미지 크기(Image Size)320, 640, 1280 (UI 토글)640입력 크기 조정 치수 (API는 32 – 1280 사이의 모든 값 허용)
자동 재실행

파라미터를 변경하면 500ms 디바운싱(debounce) 후 현재 이미지에 대해 추론이 자동으로 재실행됩니다. 다시 업로드할 필요가 없습니다.

Link to this section신뢰도 임계값#

신뢰도별로 예측 필터링:

  • 높음 (0.5+): 더 적지만 확실한 예측
  • 낮음 (0.1-0.25): 더 많은 예측, 일부 노이즈 포함
  • 기본값 (0.25): 대부분의 사용 사례에 최적화된 균형

Link to this sectionIoU 임계값#

NMS(비최대 억제) 제어:

  • 높음 (0.7+): 겹치는 박스 허용
  • 낮음 (0.3-0.5): 인접한 탐지 결과를 더 적극적으로 병합
  • 기본값 (0.7): 대부분의 사용 사례에 최적화된 균형 잡힌 NMS 동작

Link to this section배포 모델 예측#

실행 중인 각 전용 엔드포인트는 배포 카드에 Predict 탭을 포함합니다. 이는 공유 예측 서비스가 아닌 배포 자체의 추론 서비스를 사용하므로 브라우저에서 배포된 엔드포인트를 직접 테스트할 수 있습니다.

Link to this sectionREST API#

프로그래밍 방식으로 추론에 접근:

Link to this section인증#

요청에 API 키를 포함하세요:

Authorization: Bearer YOUR_API_KEY
API 키 필요

자신의 스크립트, 노트북 또는 앱에서 추론을 실행하려면 API 키를 포함해야 합니다. Settings > API Keys에서 키를 생성하십시오.

Link to this section엔드포인트#

POST https://platform.ultralytics.com/api/models/{modelId}/predict

Link to this section요청#

import requests

url = "https://platform.ultralytics.com/api/models/MODEL_ID/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())

Ultralytics Platform Predict Tab Code Examples Python Tab

Link to this section요청 파라미터#

파라미터유형기본값범위설명
file파일--이미지 또는 비디오 파일 (source가 설정되지 않은 경우 필수)
conf부동 소수점(float)0.250.01 – 1.0최소 신뢰도 임계값
iou부동 소수점(float)0.70.0 – 0.95NMS IoU 임계값
imgsz정수(int)64032 – 1280입력 이미지 크기 (픽셀 단위)
normalizeboolfalse-바운딩 박스 좌표를 0 – 1 범위로 반환
decimals정수(int)50 – 10좌표 값에 대한 소수점 정밀도
source문자열(string)--이미지 URL 또는 base64 문자열 (file의 대안)

Link to this section응답#

{
    "images": [
        {
            "shape": [1080, 1920],
            "results": [
                {
                    "class": 0,
                    "name": "person",
                    "confidence": 0.92,
                    "box": { "x1": 100, "y1": 50, "x2": 300, "y2": 400 }
                },
                {
                    "class": 2,
                    "name": "car",
                    "confidence": 0.87,
                    "box": { "x1": 400, "y1": 200, "x2": 600, "y2": 350 }
                }
            ],
            "speed": {
                "preprocess": 1.2,
                "inference": 12.5,
                "postprocess": 2.3
            }
        }
    ],
    "metadata": {
        "imageCount": 1,
        "functionTimeCall": 0.018,
        "model": "model.pt",
        "version": {
            "ultralytics": "8.x.x",
            "torch": "2.6.0",
            "torchvision": "0.21.0",
            "python": "3.13.0"
        }
    }
}

Ultralytics Platform Predict Tab Json Response View

Link to this section응답 필드#

필드유형설명
imagesarray처리된 이미지 목록
images[].shapearray이미지 크기 [높이, 너비]
images[].resultsarray탐지 목록
images[].results[].class정수(int)클래스 인덱스 (정수 ID)
images[].results[].name문자열(string)클래스 이름
images[].results[].confidence부동 소수점(float)탐지 신뢰도 (0-1)
images[].results[].box객체바운딩 박스 좌표
images[].speed객체밀리초 단위 처리 시간
metadata객체요청 메타데이터 및 버전 정보

Link to this section작업별 응답#

응답 형식은 작업에 따라 다릅니다:

{
  "class": 0,
  "name": "person",
  "confidence": 0.92,
  "box": {"x1": 100, "y1": 50, "x2": 300, "y2": 400}
}

Link to this section결제(Billing)#

공유 추론(Predict 탭 및 /api/models/{id}/predict 엔드포인트)은 모든 플랜에 추가 비용 없이 포함되어 있습니다. 공유 추론에 대한 요청당 비용은 없습니다.

더 높은 처리량이 필요한 프로덕션 워크로드의 경우, 전용 엔드포인트를 배포하십시오.

Link to this section속도 제한(Rate Limits)#

Shared inference is rate-limited to 20 requests/min per API key. When throttled, the API returns 429 with a Retry-After header. See the full rate limit reference for all endpoint categories.

더 높은 처리량이 필요하십니까?

속도 제한 없는 무제한 추론, 예측 가능한 처리량 및 일관된 짧은 지연 시간 응답을 위해 전용 엔드포인트를 배포하십시오. 로컬 추론은 Predict 모드 가이드를 참조하십시오.

Link to this section오류 처리#

일반적인 오류 응답:

코드메시지해결 방법
400잘못된 이미지파일 형식 확인
401인증되지 않음API 키 확인
404모델을 찾을 수 없음모델 ID 확인
429속도 제한 초과잠시 후 다시 시도하거나 무제한 처리량을 위해 전용 엔드포인트를 사용하십시오
500서버 오류요청 재시도
503서비스를 사용할 수 없음Predict 서비스가 시작 중이거나 도달할 수 없습니다. 잠시 기다린 후 다시 시도하십시오

Link to this sectionFAQ#

Link to this section비디오에서 추론을 실행할 수 있습니까?#

두 가지 추론 방법 모두 비디오 파일을 허용합니다:

  • 전용 엔드포인트는 비디오 파일을 직접 허용합니다. 지원되는 형식(최대 100MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. 각 프레임이 개별적으로 처리되고 결과는 프레임별로 반환됩니다. 자세한 내용은 전용 엔드포인트를 참조하십시오.
  • 공유 추론(/api/models/{id}/predict)은 동일한 Predict 서비스를 사용하며 동일한 비디오 형식을 허용합니다. 그러나 UI의 브라우저 Predict 탭은 이미지만 업로드하므로 비디오 워크로드에는 REST API를 직접 사용하거나 전용 엔드포인트를 사용하십시오. 공유 엔드포인트는 분당 20회 요청으로 속도 제한이 적용되므로, 대규모 비디오 워크로드에는 전용 엔드포인트가 더 나은 선택입니다.

Link to this section주석이 달린 이미지는 어떻게 얻습니까?#

API는 JSON 예측을 반환합니다. 시각화하려면:

  1. 예측을 사용하여 로컬에서 박스 그리기
  2. Ultralytics plot() 메서드 사용:
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
results = model("image.jpg")
results[0].save("annotated.jpg")

전체 결과 API 및 시각화 옵션은 Predict 모드 문서를 참조하십시오.

Link to this section최대 이미지 크기는 얼마입니까?#

  • 업로드 제한: 10MB
  • 권장: 빠른 추론을 위해 <5MB
  • 자동 크기 조정: 이미지는 선택된 Image Size 매개변수로 크기가 조정됩니다

큰 이미지는 종횡비를 유지하면서 자동으로 크기가 조정됩니다.

Link to this section배치 추론을 실행할 수 있습니까?#

현재 API는 요청당 하나의 이미지를 처리합니다. 배치를 수행하려면:

  1. 동시 요청 전송
  2. 더 높은 처리량을 위해 전용 엔드포인트 사용
  3. 대규모 배치는 로컬 추론 고려
Python을 사용한 배치 추론
import concurrent.futures

import requests

url = "https://predict-abc123.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
images = ["img1.jpg", "img2.jpg", "img3.jpg"]

def predict(image_path):
    with open(image_path, "rb") as f:
        return requests.post(url, headers=headers, files={"file": f}).json()

with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    results = list(executor.map(predict, images))

댓글