Meet YOLO26: next-gen vision AI.

Link to this sectionDedicated Endpoints#

Ultralytics Platform cho phép triển khai các model YOLO tới những endpoint chuyên dụng tại 43 khu vực trên toàn cầu. Mỗi endpoint là một dịch vụ đơn thuê bao (single-tenant) với khả năng scale-to-zero, URL endpoint duy nhất và cơ chế giám sát độc lập.

Ảnh Tab Triển Khai Model trên Ultralytics Platform với Bản Đồ Khu Vực và Bảng

Link to this sectionTạo Endpoint#

Link to this sectionTừ Tab Triển Khai (Deploy)#

Triển khai model từ tab Deploy của nó:

  1. Điều hướng tới model của bạn
  2. Nhấp vào tab Deploy
  3. Chọn một khu vực từ bản đồ thế giới tương tác — các khu vực được mã màu theo độ trễ từ vị trí của bạn trên dải màu từ xanh lá cây sang đỏ (khu vực nhanh hơn có màu xanh hơn, khu vực chậm hơn có màu đỏ hơn)
  4. Nhấp Deploy trên hàng khu vực tương ứng

Tên triển khai được tự động tạo từ tên model và thành phố khu vực (ví dụ: yolo26n-iowa).

Link to this sectionTừ Trang Triển Khai (Deployments)#

Tạo một triển khai từ trang Deploy chung trong thanh bên:

  1. Nhấp New Deployment
  2. Chọn một model từ bộ chọn model
  3. Chọn một khu vực từ bản đồ hoặc bảng
  4. Xem lại tên triển khai được tự động tạo (có thể chỉnh sửa) và các tài nguyên mặc định
  5. Nhấp Deploy Model

Ảnh Hộp Thoại Triển Khai Mới trên Ultralytics Platform với Bộ Chọn Model và Bản Đồ Khu Vực

Link to this sectionVòng đời Triển khai#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this sectionChọn khu vực#

Chọn từ 43 khu vực trên toàn thế giới. Bản đồ và bảng khu vực tương tác hiển thị:

  • Ghim khu vực: Được mã màu theo độ trễ trên dải màu từ xanh lá cây sang đỏ (khu vực nhanh hơn có màu xanh hơn, khu vực chậm hơn có màu đỏ hơn)
  • Khu vực đã triển khai: Được làm nổi bật với huy hiệu "Deployed"
  • Khu vực đang triển khai: Chỉ báo dạng xung nhịp
  • Làm nổi bật hai chiều: Di chuột trên bản đồ làm nổi bật hàng bảng và ngược lại

Ảnh Bảng Độ Trễ Khu Vực Tab Deploy trên Ultralytics Platform được sắp xếp theo độ trễ

Bảng khu vực trên tab Deploy của model bao gồm:

CộtMô tả
Vị trí (Location)Thành phố và quốc gia kèm biểu tượng cờ
Zone (Khu vực)Định danh khu vực
Độ trễThời gian ping đo được (trung vị của 3 lần ping)
Khoảng cách (Distance)Khoảng cách từ vị trí của bạn tính bằng km
Hành động (Actions)Nút Deploy hoặc huy hiệu trạng thái "Deployed"
Hộp Thoại Triển Khai Mới

Hộp thoại New Deployment (từ trang Deploy chung) hiển thị một bảng khu vực đơn giản hơn chỉ với các cột Vị trí, Độ trễ và Chọn.

Chọn Thông Minh

Chọn khu vực gần nhất với người dùng của bạn để có độ trễ thấp nhất. Sử dụng nút Rescan để đo lại độ trễ từ vị trí hiện tại của bạn.

Link to this sectionCác Khu Vực Khả Dụng#

ZoneVị trí
us-central1Iowa, Mỹ
us-east1South Carolina, USA
us-east4Northern Virginia, USA
us-east5Columbus, USA
us-south1Dallas, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
northamerica-northeast1Montreal, Canada
northamerica-northeast2Toronto, Canada
northamerica-south1Queretaro, Mexico
southamerica-east1Sao Paulo, Brazil
southamerica-west1Santiago, Chile

Link to this sectionCấu hình Endpoint#

Link to this sectionHộp Thoại Triển Khai Mới#

Hộp thoại New Deployment cung cấp:

Cài đặtMô tảMặc định
ModelChọn từ các model đã hoàn thiện-
RegionKhu vực triển khai-
Deployment NameTự động tạo, có thể chỉnh sửa-
CPU CoresMặc định cố định1
Memory (GB)Mặc định cố định2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Các triển khai sử dụng giá trị mặc định cố định là 1 CPU, 2 GiB bộ nhớ, minInstances = 0maxInstances = 1. Chúng tự động co giãn về 0 khi nhàn rỗi, vì vậy bạn chỉ trả phí cho thời gian suy luận thực tế.

Tên được tạo tự động

Tên triển khai được tạo tự động từ tên model và thành phố thuộc region (ví dụ: yolo26n-iowa). Nếu bạn triển khai cùng một model vào cùng một region lần nữa, một hậu tố số sẽ được thêm vào (ví dụ: yolo26n-iowa-2).

Link to this sectionTab Deploy (Triển khai nhanh)#

Khi triển khai từ tab Deploy của model, các endpoint được tạo với tài nguyên mặc định (1 CPU, 2 GB bộ nhớ) với tính năng co giãn về 0 được bật. Tên triển khai được tạo tự động.

Link to this sectionQuản lý Endpoint#

Link to this sectionChế độ xem#

Danh sách triển khai hỗ trợ ba chế độ xem:

Chế độMô tả
CardsThẻ chi tiết đầy đủ với nhật ký, ví dụ mã, bảng dự đoán
CompactLưới các thẻ nhỏ hơn với các chỉ số chính
TableDataTable với các cột có thể sắp xếp và tìm kiếm

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionThẻ triển khai (Chế độ xem thẻ)#

Mỗi thẻ triển khai trong chế độ xem thẻ hiển thị:

  • Header: Tên, cờ region, trạng thái, các nút start/stop/delete
  • Endpoint URL: URL có thể sao chép với liên kết đến tài liệu API
  • Metrics: Số lượng yêu cầu (24h), độ trễ P95, tỷ lệ lỗi
  • Health check: Chỉ báo trạng thái trực tiếp với độ trễ và làm mới thủ công
  • Tabs: Logs, Code, và Predict

Tab Logs hiển thị các mục nhật ký gần đây với bộ lọc mức độ nghiêm trọng (Tất cả / Lỗi). Tab Code hiển thị các ví dụ mã sẵn sàng sử dụng bằng Python, JavaScript và cURL với URL endpoint và API key thực tế của bạn. Tab Predict cung cấp bảng dự đoán nội dòng để kiểm thử trực tiếp trên triển khai.

Link to this sectionTrạng thái triển khai#

Trạng tháiMô tả
CreatingTriển khai đang được thiết lập
DeployingContainer đang khởi động
ReadyEndpoint đang trực tuyến và chấp nhận yêu cầu
StoppingEndpoint đang tắt
StoppedEndpoint đã tạm dừng (không tính phí)
FailedTriển khai thất bại (xem thông báo lỗi)

Link to this sectionEndpoint URL#

Mỗi endpoint có một URL duy nhất, ví dụ:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

Nhấp vào nút sao chép để sao chép URL. Nhấp vào biểu tượng tài liệu để xem tài liệu API được tự động tạo cho endpoint.

Link to this sectionQuản lý vòng đời#

Kiểm soát trạng thái endpoint của bạn:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
Hành độngMô tả
StartTiếp tục chạy một endpoint đã dừng
StopTạm dừng endpoint (không tính phí)
DeleteXóa vĩnh viễn endpoint

Link to this sectionDừng Endpoint#

Dừng endpoint để tạm dừng tính phí:

  1. Nhấp vào biểu tượng tạm dừng trên thẻ triển khai
  2. Trạng thái endpoint chuyển sang "Stopping" sau đó là "Stopped"

Các endpoint đã dừng:

  • Không chấp nhận yêu cầu
  • Không phát sinh chi phí
  • Có thể được khởi động lại bất cứ lúc nào

Link to this sectionXóa Endpoint#

Xóa vĩnh viễn một endpoint:

  1. Nhấp vào biểu tượng xóa (thùng rác) trên thẻ triển khai
  2. Xác nhận xóa trong hộp thoại
Hành động vĩnh viễn

Việc xóa diễn ra ngay lập tức và vĩnh viễn. Bạn luôn có thể tạo một endpoint mới.

Link to this sectionSử dụng Endpoint#

Link to this sectionXác thực#

Mỗi triển khai được tạo với một API key từ tài khoản của bạn. Hãy bao gồm nó trong các yêu cầu:

Authorization: Bearer YOUR_API_KEY

Tiền tố API key được hiển thị ở phần chân trang của thẻ triển khai để nhận diện. Tạo key từ API Keys.

Link to this sectionKhông có giới hạn tốc độ#

Các yêu cầu gửi trực tiếp tới URL endpoint chuyên dụng của bạn không bị giới hạn bởi giới hạn tốc độ Platform API — thông lượng chỉ bị giới hạn bởi CPU, bộ nhớ và cấu hình mở rộng của endpoint. (Các yêu cầu được chuyển tiếp qua Platform API, ví dụ như trình kiểm tra trong trình duyệt, vẫn sử dụng giới hạn dự đoán tiêu chuẩn là 20 yêu cầu/phút.) Đây là ưu điểm chính so với inference chia sẻ, vốn bị giới hạn ở mức 20 yêu cầu/phút cho mỗi API key.

Link to this sectionVí dụ về yêu cầu#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionTham số yêu cầu#

Tham sốLoạiMặc địnhPhạm viMô tả
filetệp--Tệp hình ảnh hoặc video (bắt buộc)
conffloat0.250.01 – 1.0Ngưỡng độ tin cậy tối thiểu
ioufloat0.70.0 – 0.95Ngưỡng NMS IoU
imgszint64032 – 1280Kích thước hình ảnh đầu vào tính bằng pixel
normalizeboolfalse-Trả về tọa độ BBox dưới dạng 0 – 1
decimalsint50 – 10Độ chính xác thập phân cho các giá trị tọa độ
sourcestring--URL hình ảnh hoặc chuỗi base64 (thay thế cho file)
Inference video

Các endpoint chuyên dụng chấp nhận cả hình ảnh và video thông qua tham số file.

  • Định dạng hình ảnh (tối đa 100 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Định dạng video (tối đa 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Mỗi khung hình video được xử lý riêng biệt và kết quả được trả về theo từng khung hình. Bạn cũng có thể truyền URL hình ảnh công khai hoặc hình ảnh đã mã hóa base64 thông qua tham số source thay vì file.

Link to this sectionĐịnh dạng phản hồi#

Tương tự như inference chia sẻ với các trường cụ thể theo tác vụ.

Link to this sectionGiá cả#

Các endpoint chuyên dụng cơ bản được miễn phí trên mọi gói. Các cấu hình tài nguyên cao hơn (nhiều vCPU hơn, nhiều bộ nhớ hơn, khởi động nóng) sẽ cung cấp giá theo mức sử dụng trong tương lai.

Tối ưu hóa chi phí
  • Sử dụng tính năng scale-to-zero (mặc định) để các endpoint chỉ chạy khi nhận được yêu cầu
  • Thiết lập số lượng instance tối đa phù hợp cho lưu lượng truy cập của bạn
  • Giám sát mức sử dụng trong bảng điều khiển Monitoring

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTôi có thể tạo bao nhiêu endpoint?#

Giới hạn endpoint phụ thuộc vào gói của bạn:

  • Free: Tối đa 3 lần triển khai
  • Pro: Tối đa 10 lần triển khai
  • Enterprise: Triển khai không giới hạn

Mỗi model vẫn có thể được triển khai tới nhiều khu vực trong hạn mức gói của bạn.

Link to this sectionTôi có thể thay đổi khu vực sau khi triển khai không?#

Không, các khu vực là cố định. Để thay đổi khu vực:

  1. Xóa endpoint hiện tại
  2. Tạo một endpoint mới trong khu vực mong muốn

Link to this sectionLàm thế nào để xử lý việc triển khai đa khu vực?#

Để phủ sóng toàn cầu:

  1. Triển khai tới nhiều khu vực
  2. Sử dụng bộ cân bằng tải hoặc định tuyến DNS
  3. Định tuyến người dùng đến endpoint gần nhất

Link to this sectionThời gian cold start là bao lâu?#

Thời gian cold start phụ thuộc vào kích thước model và việc container đã được lưu trong bộ nhớ đệm tại khu vực đó hay chưa. Các phạm vi điển hình:

Kịch bảnCold Start
Container đã lưu bộ nhớ đệm~5-15 giây
Lần triển khai/khu vực đầu tiên~15-45 giây

Kiểm tra tình trạng sử dụng thời gian chờ 55 giây để xử lý các trường hợp cold start lâu nhất.

Link to this sectionTôi có thể sử dụng tên miền tùy chỉnh không?#

Tên miền tùy chỉnh sẽ sớm ra mắt. Hiện tại, các endpoint sử dụng URL do nền tảng tạo.

Bình luận