Meet YOLO26: next-gen vision AI.

Link to this sectionSuy luận#

Ultralytics Platform cung cấp API suy luận để kiểm tra các model đã được huấn luyện. Sử dụng tab Predict trên trình duyệt để xác thực nhanh hoặc REST API để truy cập theo lập trình.

Ultralytics Platform Model Predict Tab With Detections Overlay

Link to this sectionTab Dự đoán (Predict)#

Mỗi model đều bao gồm tab Predict cho việc suy luận trên trình duyệt:

  1. Điều hướng đến model của bạn
  2. Nhấp vào tab Predict
  3. Tải lên một hình ảnh, sử dụng hình ảnh ví dụ hoặc mở webcam của bạn
  4. Xem kết quả dự đoán ngay lập tức với các lớp phủ bounding box

Ultralytics Platform Predict Tab Image Upload Dropzone

Link to this sectionPhương thức đầu vào#

Bảng điều khiển dự đoán hỗ trợ nhiều phương thức đầu vào:

Phương thứcMô tả
Tải lên hình ảnhKéo và thả hoặc nhấp để tải lên hình ảnh
Hình ảnh ví dụNhấp vào các ví dụ tích hợp sẵn (hình ảnh tập dữ liệu hoặc mặc định)
Chụp từ webcamLuồng video trực tiếp với khả năng chụp ảnh đơn khung
graph LR
    A[Upload Image] --> D[Auto-Inference]
    B[Example Image] --> D
    C[Webcam Capture] --> D
    D --> E[Results + Overlays]

    style D fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Link to this sectionTải lên hình ảnh#

Kéo và thả hoặc nhấp để tải lên:

  • Các định dạng được hỗ trợ: JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP, DNG, MPO
  • Dung lượng tối đa: 10MB
  • Tự động suy luận: Kết quả xuất hiện tự động sau khi tải lên
Tự động Suy luận

Bảng dự đoán sẽ tự động chạy suy luận khi bạn tải lên hình ảnh, chọn ví dụ hoặc chụp khung hình webcam. Không cần nhấp nút.

Link to this sectionHình ảnh ví dụ#

Bảng dự đoán hiển thị các hình ảnh ví dụ từ tập dữ liệu được liên kết với model của bạn. Nếu không có tập dữ liệu nào được liên kết, các ví dụ mặc định sẽ được sử dụng:

Hình ảnhNội dung
bus.jpgCảnh đường phố với các phương tiện
zidane.jpgCảnh thể thao với con người

Đối với các model OBB, hình ảnh chụp từ trên không về tàu thuyền và sân bay sẽ được hiển thị thay thế.

Hình ảnh được tải sẵn

Các hình ảnh ví dụ được tải sẵn khi trang tải xong, vì vậy việc nhấp vào một ví dụ sẽ kích hoạt suy luận gần như tức thì mà không cần chờ đợi tải xuống.

Link to this sectionWebcam#

Nhấp vào thẻ webcam để bắt đầu luồng camera trực tiếp:

  1. Cấp quyền truy cập camera khi được yêu cầu
  2. Nhấp vào bản xem trước video để chụp khung hình
  3. Suy luận tự động chạy trên khung hình đã chụp
  4. Nhấp lại để khởi động lại webcam

Link to this sectionXem kết quả#

Kết quả suy luận hiển thị:

  • Bounding box với nhãn lớp dưới dạng lớp phủ SVG
  • Điểm tin cậy (Confidence score) cho mỗi lần phát hiện
  • Màu sắc lớp từ bảng màu của tập dữ liệu (hoặc bảng màu mặc định của Ultralytics)
  • Phân tích tốc độ: Tiền xử lý, suy luận, hậu xử lý và thời gian mạng

Ultralytics Platform Predict Tab Results With Detections And Speed Stats

Bảng kết quả hiển thị:

Trường (Field)Mô tả
Danh sách các đối tượng phát hiệnMỗi đối tượng phát hiện kèm tên lớp và độ tin cậy
Số liệu thống kê tốc độTiền xử lý, suy luận, hậu xử lý, mạng (ms)
Phản hồi JSONPhản hồi API thô trong một khối mã

Link to this sectionTham số suy luận#

Điều chỉnh hành vi phát hiện với các tham số trong phần Parameters có thể thu gọn:

Ultralytics Platform Predict Tab Parameters Sliders

Tham sốPhạm viMặc địnhMô tả
Confidence0.01 – 1.00.25Ngưỡng tin cậy tối thiểu
IoU0.0 – 0.950.7Ngưỡng NMS IoU
Kích thước Hình ảnh320, 640, 1280 (chuyển đổi trên UI)640Kích thước thay đổi đầu vào (API chấp nhận bất kỳ giá trị nào từ 32 – 1280)
Tự động chạy lại

Việc thay đổi bất kỳ tham số nào sẽ tự động chạy lại suy luận trên hình ảnh hiện tại với độ trễ 500ms. Không cần tải lên lại.

Link to this sectionNgưỡng tin cậy#

Lọc các dự đoán theo độ tin cậy:

  • Cao hơn (0.5+): Ít dự đoán hơn, độ chính xác cao hơn
  • Thấp hơn (0.1-0.25): Nhiều dự đoán hơn, có thể kèm theo nhiễu
  • Mặc định (0.25): Cân bằng cho hầu hết các trường hợp sử dụng

Link to this sectionNgưỡng IoU#

Kiểm soát Non-Maximum Suppression:

  • Cao hơn (0.7+): Cho phép nhiều hộp chồng lấp hơn
  • Thấp hơn (0.3-0.5): Hợp nhất các lần phát hiện gần nhau một cách quyết liệt hơn
  • Mặc định (0.7): Hành vi NMS cân bằng cho hầu hết các trường hợp sử dụng

Link to this sectionSuy luận triển khai#

Mỗi endpoint chuyên dụng đang chạy đều bao gồm một tab Predict ngay trên thẻ triển khai của nó. Tính năng này sử dụng dịch vụ suy luận riêng của bản triển khai thay vì dịch vụ dự đoán dùng chung, cho phép bạn kiểm tra endpoint đã triển khai từ trình duyệt.

Link to this sectionREST API#

Truy cập suy luận theo lập trình:

Link to this sectionXác thực#

Bao gồm khóa API của bạn trong các yêu cầu:

Authorization: Bearer YOUR_API_KEY
Yêu cầu khóa API

Để chạy suy luận từ các tập lệnh, notebook hoặc ứng dụng của riêng bạn, hãy bao gồm khóa API. Tạo một khóa trong Settings > API Keys.

Link to this sectionEndpoint#

POST https://platform.ultralytics.com/api/models/{modelId}/predict

Link to this sectionYêu cầu#

import requests

url = "https://platform.ultralytics.com/api/models/MODEL_ID/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())

Ultralytics Platform Predict Tab Code Examples Python Tab

Link to this sectionTham số yêu cầu#

Tham sốLoạiMặc địnhPhạm viMô tả
filetệp--Tệp hình ảnh hoặc video (bắt buộc trừ khi source được đặt)
conffloat0.250.01 – 1.0Ngưỡng tin cậy tối thiểu
ioufloat0.70.0 – 0.95Ngưỡng NMS IoU
imgszint64032 – 1280Kích thước hình ảnh đầu vào theo pixel
normalizeboolfalse-Trả về tọa độ bounding box theo thang đo 0 – 1
decimalsint50 – 10Độ chính xác thập phân cho các giá trị tọa độ
sourcestring--URL hình ảnh hoặc chuỗi base64 (thay thế cho file)

Link to this sectionPhản hồi#

{
    "images": [
        {
            "shape": [1080, 1920],
            "results": [
                {
                    "class": 0,
                    "name": "person",
                    "confidence": 0.92,
                    "box": { "x1": 100, "y1": 50, "x2": 300, "y2": 400 }
                },
                {
                    "class": 2,
                    "name": "car",
                    "confidence": 0.87,
                    "box": { "x1": 400, "y1": 200, "x2": 600, "y2": 350 }
                }
            ],
            "speed": {
                "preprocess": 1.2,
                "inference": 12.5,
                "postprocess": 2.3
            }
        }
    ],
    "metadata": {
        "imageCount": 1,
        "functionTimeCall": 0.018,
        "model": "model.pt",
        "version": {
            "ultralytics": "8.x.x",
            "torch": "2.6.0",
            "torchvision": "0.21.0",
            "python": "3.13.0"
        }
    }
}

Ultralytics Platform Predict Tab Json Response View

Link to this sectionCác trường phản hồi#

Trường (Field)LoạiMô tả
imagesarrayDanh sách các hình ảnh đã được xử lý
images[].shapearrayKích thước ảnh [chiều cao, chiều rộng]
images[].resultsarrayDanh sách các kết quả phát hiện
images[].results[].classintChỉ số lớp (ID số nguyên)
images[].results[].namestringTên lớp
images[].results[].confidencefloatĐộ tin cậy của kết quả phát hiện (0-1)
images[].results[].boxđối tượngTọa độ hộp bao
images[].speedđối tượngThời gian xử lý tính bằng mili giây
metadatađối tượngMetadata yêu cầu và thông tin phiên bản

Link to this sectionPhản hồi đặc thù cho từng tác vụ#

Định dạng phản hồi thay đổi tùy theo tác vụ:

{
  "class": 0,
  "name": "person",
  "confidence": 0.92,
  "box": {"x1": 100, "y1": 50, "x2": 300, "y2": 400}
}

Link to this sectionThanh toán#

Tính năng suy luận dùng chung (tab Predict và endpoint /api/models/{id}/predict) được bao gồm mà không tính thêm chi phí trên tất cả các gói. Không có phí tính theo mỗi yêu cầu cho suy luận dùng chung.

Đối với khối lượng công việc thực tế đòi hỏi thông lượng cao hơn, hãy triển khai một dedicated endpoint.

Link to this sectionGiới hạn tốc độ (Rate Limits)#

Suy luận dùng chung bị giới hạn tốc độ ở mức 20 yêu cầu/phút cho mỗi API key. Khi bị giới hạn, API sẽ trả về mã 429 kèm tiêu đề Retry-After. Xem tài liệu tham khảo về giới hạn tốc độ đầy đủ cho tất cả các loại endpoint.

Cần thông lượng cao hơn?

Triển khai một dedicated endpoint để suy luận không giới hạn mà không có rào cản về tốc độ, thông lượng có thể dự đoán và phản hồi có độ trễ thấp nhất quán. Để suy luận cục bộ, hãy xem hướng dẫn chế độ Predict.

Link to this sectionXử lý lỗi#

Các phản hồi lỗi phổ biến:

Thông báoGiải pháp
400Ảnh không hợp lệKiểm tra định dạng tệp
401Không được phép (Unauthorized)Xác minh API key
404Không tìm thấy mô hìnhKiểm tra ID mô hình
429Giới hạn tốc độ (Rate limited)Đợi và thử lại, hoặc sử dụng dedicated endpoint để có thông lượng không giới hạn
500Lỗi máy chủThử lại yêu cầu
503Dịch vụ không khả dụngDịch vụ Predict đang khởi động hoặc không thể truy cập; hãy đợi một lát rồi thử lại

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTôi có thể chạy suy luận trên video không?#

Cả hai phương thức suy luận đều chấp nhận tệp video:

  • Dedicated endpoints chấp nhận trực tiếp tệp video. Các định dạng được hỗ trợ (lên đến 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. Mỗi khung hình được xử lý riêng biệt và kết quả được trả về theo từng khung hình. Xem dedicated endpoints để biết chi tiết.
  • Suy luận dùng chung (/api/models/{id}/predict) sử dụng cùng dịch vụ dự đoán và chấp nhận các định dạng video tương tự. Tuy nhiên, tab Predict trên trình duyệt trong giao diện người dùng chỉ tải lên hình ảnh — hãy sử dụng trực tiếp REST API hoặc dedicated endpoint cho các quy trình làm việc với video. Endpoint dùng chung cũng bị giới hạn tốc độ ở mức 20 yêu cầu/phút, vì vậy dedicated endpoints là lựa chọn tốt hơn cho khối lượng công việc video lớn.

Link to this sectionLàm cách nào để lấy ảnh đã được chú thích?#

API trả về các dự đoán dưới dạng JSON. Để trực quan hóa:

  1. Sử dụng các dự đoán để vẽ hộp bao cục bộ
  2. Sử dụng phương thức plot() của Ultralytics:
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
results = model("image.jpg")
results[0].save("annotated.jpg")

Xem tài liệu chế độ Predict để biết đầy đủ về API kết quả và các tùy chọn trực quan hóa.

Link to this sectionKích thước ảnh tối đa là bao nhiêu?#

  • Giới hạn tải lên: 10MB
  • Khuyến nghị: <5MB để suy luận nhanh
  • Tự động thay đổi kích thước: Ảnh được thay đổi kích thước theo tham số Image Size đã chọn

Ảnh lớn sẽ tự động được thay đổi kích thước trong khi vẫn giữ nguyên tỷ lệ khung hình.

Link to this sectionTôi có thể chạy suy luận theo lô (batch) không?#

API hiện tại xử lý một ảnh mỗi yêu cầu. Để xử lý theo lô:

  1. Gửi các yêu cầu đồng thời
  2. Sử dụng dedicated endpoint để có thông lượng cao hơn
  3. Cân nhắc suy luận cục bộ cho các lô lớn
Suy luận theo lô với Python
import concurrent.futures

import requests

url = "https://predict-abc123.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
images = ["img1.jpg", "img2.jpg", "img3.jpg"]

def predict(image_path):
    with open(image_path, "rb") as f:
        return requests.post(url, headers=headers, files={"file": f}).json()

with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    results = list(executor.map(predict, images))

Bình luận