Chuyển đến nội dung

Điểm cuối chuyên dụng

Nền tảng Ultralytics cho phép triển khai YOLO Các mô hình được kết nối đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu. Mỗi điểm cuối là một dịch vụ đơn người dùng với khả năng tự động mở rộng quy mô, URL điểm cuối duy nhất và giám sát độc lập.

Ultralytics Mô hình nền tảng - Triển khai tab với bản đồ khu vực và bảng.

Tạo điểm cuối

Từ tab Triển khai

Triển khai một mô hình từ đó. Deploy tab:

  1. Điều hướng đến mô hình của bạn
  2. Nhấp vào tab Triển khai
  3. Chọn một khu vực từ bảng khu vực (được sắp xếp theo độ trễ so với vị trí của bạn)
  4. Nhấp vào Triển khai trên hàng khu vực

Tên triển khai được tự động tạo từ tên mô hình và thành phố khu vực (ví dụ: yolo11n-iowa).

Từ trang Triển khai

Tạo bản triển khai từ toàn cầu Deploy trang trong thanh bên:

  1. Nhấp vào Triển khai mới
  2. Chọn một mẫu từ bộ chọn mẫu.
  3. Chọn một khu vực từ bản đồ hoặc bảng.
  4. Tùy chọn tùy chỉnh tên triển khai và tài nguyên.
  5. Nhấp vào Triển khai Mô hình

Ultralytics Hộp thoại triển khai nền tảng mới với bộ chọn mô hình và bản đồ khu vực

Chu kỳ triển khai

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Lựa chọn khu vực

Chọn từ 43 khu vực trên toàn thế giới. Bản đồ và bảng tương tác hiển thị các khu vực sau:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Các khu vực đã triển khai : Được đánh dấu bằng huy hiệu "Đã triển khai".
  • Các khu vực triển khai : Chỉ báo xung động hoạt hình
  • Tính năng tô sáng hai chiều : Khi di chuột lên bản đồ, hàng trong bảng sẽ được tô sáng, và ngược lại.

Ultralytics Bảng độ trễ khu vực triển khai nền tảng được sắp xếp theo độ trễ

Bảng khu vực trên mô hình Deploy Tab này bao gồm:

CộtMô tả
Vị tríThành phố và quốc gia kèm biểu tượng quốc kỳ
VùngMã định danh vùng
Độ trễThời gian phản hồi (trung vị của 3 lần phản hồi) đã đo được.
Khoảng cáchKhoảng cách từ vị trí của bạn (km)
Hành độngNút triển khai hoặc huy hiệu trạng thái "Đã triển khai"

Hộp thoại triển khai mới

Hàm New Deployment đối thoại (từ toàn cầu) Deploy (trang) hiển thị một bảng khu vực đơn giản hơn chỉ với các cột Vị trí, Độ trễ và Chọn.

Chọn một cách khôn ngoan

Chọn khu vực gần người dùng nhất để có độ trễ thấp nhất. Sử dụng nút Quét lại để đo lại độ trễ từ vị trí hiện tại của bạn.

Các khu vực khả dụng

VùngVị trí
us-central1Iowa, Hoa Kỳ
us-east1Nam Carolina, Hoa Kỳ
us-east4Bắc Virginia, Hoa Kỳ
us-east5Columbus, Hoa Kỳ
us-south1Dallas, Hoa Kỳ
us-west1Oregon, Hoa Kỳ
us-west2Los Angeles, Hoa Kỳ
us-west3Salt Lake City, Hoa Kỳ
us-west4Las Vegas, Hoa Kỳ
northamerica-northeast1Montreal, Canada
northamerica-northeast2Toronto, Canada
bắc mỹ-nam1Queretaro, Mexico
southamerica-east1Sao Paulo, Brazil
southamerica-west1Santiago, Chile
VùngVị trí
europe-west1Thánh Ghislain, Bỉ
europe-west2London, Vương quốc Anh
europe-west3Frankfurt, Đức
europe-west4Eemshaven, Hà Lan
europe-west6Zurich, Thụy Sĩ
europe-west8Milan, Ý
europe-west9Paris, Pháp
europe-west10Berlin, Đức
europe-west12Turin, Ý
europe-north1Hamina, Phần Lan
châu Âu-bắc2Stockholm, Thụy Điển
europe-central2Warsaw, Ba Lan
europe-southwest1Madrid, Tây Ban Nha
VùngVị trí
asia-east1Chương Hóa, Đài Loan
asia-east2Cửu Long, Hồng Kông
asia-northeast1Tokyo, Nhật Bản
asia-northeast2Osaka, Nhật Bản
asia-northeast3Seoul, Hàn Quốc
asia-south1Mumbai, Ấn Độ
asia-south2Delhi, Ấn Độ
asia-southeast1Jurong West, Singapore
asia-southeast2Jakarta, Indonesia
asia-southeast3Bangkok, Thái Lan
australia-southeast1Sydney, Úc
australia-southeast2Melbourne, Úc
VùngVị trí
châu Phi-Nam1Johannesburg, Nam Phi
me-central1Doha, Qatar
me-central2Dammam, Ả Rập Xê Út
me-west1Tel Aviv, Israel

Cấu hình điểm cuối

Hộp thoại triển khai mới

Hàm New Deployment hộp thoại cung cấp:

Thiết lậpMô tảMặc định
Mô hìnhChọn từ các mô hình đã hoàn thiện-
Khu vựcKhu vực triển khai-
Tên triển khaiĐược tạo tự động, có thể chỉnh sửa-
CPU LõiCPU phân bổ (1-8)1
Bộ nhớ (GB)Phân bổ bộ nhớ (1-32 GB)2

Ultralytics Bảng Tài nguyên trong hộp thoại Triển khai Nền tảng Mới đã được mở rộng

Các thiết lập tài nguyên có sẵn trong phần Tài nguyên có thể thu gọn. Theo mặc định, các triển khai sử dụng chế độ thu nhỏ về 0 (số lượng phiên bản tối thiểu = 0, số lượng phiên bản tối đa = 1) — bạn chỉ phải trả tiền cho thời gian suy luận thực tế.

Tên được tạo tự động

Tên triển khai được tạo tự động từ tên mô hình và thành phố khu vực (ví dụ: yolo11n-iowaNếu bạn triển khai lại cùng một mô hình đến cùng một khu vực, một hậu tố số sẽ được thêm vào (ví dụ: yolo11n-iowa-2).

Tab Triển khai (Triển khai nhanh)

Khi triển khai từ mô hình Deploy tab, các điểm cuối được tạo với tài nguyên mặc định (1) CPU (Bộ nhớ 2 GB) với tính năng thu nhỏ về 0 được bật. Tên triển khai được tạo tự động.

Quản lý điểm cuối

Chế độ xem

Danh sách triển khai hỗ trợ ba chế độ xem:

Cách thứcMô tả
ThẻCác thẻ chi tiết đầy đủ với nhật ký, ví dụ mã, bảng dự đoán.
Thu gọnLưới gồm các thẻ nhỏ hơn với các chỉ số quan trọng.
BảngBảng dữ liệu (DataTable) với các cột có thể sắp xếp và tìm kiếm.

Ultralytics Tab Triển khai Nền tảng > Chế độ xem Thẻ Triển khai Đang hoạt động

Thẻ triển khai (Chế độ xem thẻ)

Mỗi thẻ triển khai trong chế độ xem thẻ hiển thị:

  • Tiêu đề : Tên, cờ khu vực, huy hiệu trạng thái, các nút bắt đầu/dừng/xóa
  • URL điểm cuối : URL có thể sao chép với liên kết đến tài liệu API.
  • Các chỉ số : Số lượng yêu cầu (24 giờ), độ trễ P95, tỷ lệ lỗi
  • Kiểm tra sức khỏe : Chỉ báo sức khỏe trực tiếp với độ trễ và khả năng làm mới thủ công.
  • Các tab: Logs, Code, và Predict

Hàm Logs Tab này hiển thị các mục nhật ký gần đây với bộ lọc theo mức độ nghiêm trọng (Tất cả / Lỗi). Code Tab này hiển thị các ví dụ mã sẵn sàng sử dụng. Python , JavaScript và cURL với URL điểm cuối và khóa API thực tế của bạn. Predict Tab này cung cấp bảng dự đoán nội tuyến để kiểm tra trực tiếp trên hệ thống đang triển khai.

Trạng thái triển khai

Trạng tháiMô tả
TạoQuá trình triển khai đang được thiết lập.
Triển khaiContainer đang khởi động
Sẵn sàngĐiểm cuối đã hoạt động và đang chấp nhận yêu cầu.
Dừng lạiĐiểm cuối đang tắt.
Đã dừng lạiĐiểm cuối đang tạm dừng (không tính phí)
Thất bạiQuá trình triển khai thất bại (xem thông báo lỗi)

URL điểm cuối

Mỗi điểm cuối có một URL duy nhất, ví dụ:

https://predict-abc123.run.app

Ultralytics URL điểm cuối của thẻ triển khai nền tảng với nút sao chép

Nhấp vào nút sao chép để sao chép URL. Nhấp vào biểu tượng tài liệu để xem tài liệu API được tạo tự động cho điểm cuối.

Quản lý Vòng đời

Kiểm soát trạng thái điểm cuối của bạn:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
Hành độngMô tả
Bắt đầuTiếp tục một điểm cuối đã dừng
DừngTạm dừng điểm cuối (không tính phí)
XóaXóa vĩnh viễn điểm cuối

Dừng Endpoint

Dừng một điểm cuối để tạm dừng tính phí:

  1. Nhấp vào biểu tượng tạm dừng trên thẻ triển khai.
  2. Trạng thái của điểm cuối thay đổi thành "Đang dừng" rồi "Đã dừng".

Các điểm cuối đã dừng:

  • Không chấp nhận yêu cầu
  • Không phát sinh chi phí
  • Có thể khởi động lại bất cứ lúc nào

Xóa Endpoint

Xóa vĩnh viễn một điểm cuối:

  1. Nhấp vào biểu tượng xóa (thùng rác) trên thẻ triển khai.
  2. Xác nhận xóa trong hộp thoại

Hành động vĩnh viễn

Việc xóa là ngay lập tức và vĩnh viễn. Bạn luôn có thể tạo một điểm cuối mới.

Sử dụng các Endpoint

Xác thực

Mỗi lần triển khai được tạo bằng khóa API từ tài khoản của bạn. Hãy thêm khóa này vào các yêu cầu:

Authorization: Bearer YOUR_API_KEY

Mã tiền tố của khóa API được hiển thị ở chân trang thẻ triển khai để nhận dạng. Tạo khóa từ Khóa API .

Không giới hạn tỷ lệ

Các điểm cuối chuyên dụng không chịu giới hạn tốc độ của API nền tảng . Các yêu cầu được gửi trực tiếp đến dịch vụ chuyên dụng của bạn, do đó thông lượng chỉ bị giới hạn bởi điểm cuối của bạn. CPU , bộ nhớ và cấu hình mở rộng. Đây là một lợi thế quan trọng so với suy luận dùng chung , vốn bị giới hạn tốc độ ở mức 20 yêu cầu/phút cho mỗi khóa API.

Ví dụ Yêu cầu

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Tham số yêu cầu

Tham sốLoạiMặc địnhMô tả
filetệp-Tệp hình ảnh (bắt buộc)
confsố thực0.25Ngưỡng tin cậy tối thiểu
iousố thực0.7Ngưỡng IoU NMS
imgszint640Kích thước ảnh đầu vào
normalizechuỗi-Trả về tọa độ đã chuẩn hóa

Định dạng phản hồi

Tương tự như suy luận chia sẻ với các trường dành riêng cho tác vụ.

Giá cả

Các điểm cuối chuyên dụng được tính phí dựa trên:

Thành phầnMức phí
CPUMỗi giây vCPU
Bộ nhớMỗi giây GB
Yêu cầuMỗi triệu yêu cầu

Tối ưu hóa chi phí

  • Sử dụng tính năng scale-to-zero cho các điểm cuối phát triển
  • Đặt số lượng phiên bản tối đa phù hợp
  • Giám sát mức sử dụng trong bảng điều khiển Giám sát
  • Xem lại chi phí trong Cài đặt > Thanh toán

Câu hỏi thường gặp

Tôi có thể tạo bao nhiêu endpoint?

Giới hạn điểm cuối phụ thuộc vào gói dịch vụ:

  • Miễn phí : Tối đa 3 lần triển khai
  • Ưu điểm : Tối đa 10 lần triển khai
  • Phiên bản doanh nghiệp : Triển khai không giới hạn

Mỗi mô hình vẫn có thể được triển khai đến nhiều khu vực trong phạm vi hạn mức gói cước của bạn.

Tôi có thể thay đổi khu vực sau khi triển khai không?

Không, các khu vực là cố định. Để thay đổi khu vực:

  1. Xóa điểm cuối hiện có
  2. Tạo một điểm cuối mới trong khu vực mong muốn

Làm thế nào để xử lý việc triển khai đa khu vực?

Để có phạm vi phủ sóng toàn cầu:

  1. Triển khai tới nhiều khu vực
  2. Sử dụng bộ cân bằng tải hoặc định tuyến DNS
  3. Định tuyến người dùng đến điểm cuối gần nhất

Thời gian khởi động nguội là bao lâu?

Thời gian khởi động nguội phụ thuộc vào kích thước mô hình và việc vùng chứa đã được lưu vào bộ nhớ cache trong khu vực đó hay chưa. Phạm vi điển hình:

Kịch bảnKhởi động lạnh
Container được lưu vào bộ nhớ cache~5-15 giây
Lần triển khai/khu vực đầu tiên~15-45 giây

Quá trình kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để xử lý các trường hợp khởi động nguội tồi tệ nhất.

Tôi có thể sử dụng tên miền tùy chỉnh không?

Tên miền tùy chỉnh sẽ sớm ra mắt. Hiện tại, các điểm cuối sử dụng URL do nền tảng tạo.



📅 Được tạo 1 tháng trước ✍️ Cập nhật 4 ngày trước
glenn-jochersergiuwaxmann

Bình luận