Chuyển đến nội dung

Điểm cuối chuyên dụng

Ultralytics Platform cho phép triển khai các mô hình YOLO tới các điểm cuối chuyên dụng tại 43 khu vực toàn cầu. Mỗi điểm cuối là một dịch vụ đơn người thuê với khả năng tự động mở rộng quy mô, một URL điểm cuối duy nhất và giám sát độc lập.

Ultralytics Mô hình nền tảng - Triển khai tab với bản đồ khu vực và bảng.

Tạo điểm cuối

Từ tab Triển khai

Triển khai một mô hình từ Deploy tab:

  1. Điều hướng đến mô hình của bạn
  2. Nhấp vào tab Triển khai
  3. Select a region from the interactive world map — regions are color-coded by latency from your location (green < 100ms, yellow < 200ms, red > 200ms)
  4. Nhấp vào Triển khai trên hàng khu vực

Tên triển khai được tự động tạo từ tên mô hình và thành phố khu vực (ví dụ: yolo26n-iowa).

Từ trang Triển khai

Tạo một triển khai từ toàn cầu Deploy trang trong thanh bên:

  1. Nhấp vào Triển khai Mới
  2. Chọn một mẫu từ bộ chọn mẫu.
  3. Chọn một khu vực từ bản đồ hoặc bảng.
  4. Tùy chọn tùy chỉnh tên triển khai và tài nguyên.
  5. Nhấp vào Triển khai Mô hình

Ultralytics Hộp thoại triển khai nền tảng mới với bộ chọn mô hình và bản đồ khu vực

Vòng đời Triển khai

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Lựa chọn khu vực

Chọn từ 43 khu vực trên toàn thế giới. Bản đồ và bảng khu vực tương tác hiển thị:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Khu vực đã triển khai: Được đánh dấu bằng huy hiệu "Đã triển khai"
  • Khu vực đang triển khai: Chỉ báo nhịp đập động
  • Đánh dấu hai chiều: Di chuột trên bản đồ làm nổi bật hàng trong bảng, và ngược lại

Ultralytics Bảng độ trễ khu vực triển khai nền tảng được sắp xếp theo độ trễ

Bảng khu vực trên mô hình Deploy Tab này bao gồm:

CộtMô tả
Vị tríThành phố và quốc gia với biểu tượng lá cờ
VùngMã định danh vùng
Độ trễThời gian phản hồi (trung vị của 3 lần phản hồi) đã đo được.
Khoảng cáchKhoảng cách từ vị trí của bạn tính bằng km
Hành độngNút Triển khai hoặc huy hiệu trạng thái "Đã triển khai"

Hộp thoại triển khai mới

Hàm New Deployment hộp thoại (từ biến toàn cục Deploy (trang) hiển thị một bảng khu vực đơn giản hơn chỉ với các cột Vị trí, Độ trễ và Chọn.

Chọn một cách khôn ngoan

Chọn khu vực gần người dùng nhất để có độ trễ thấp nhất. Sử dụng nút Quét lại để đo lại độ trễ từ vị trí hiện tại của bạn.

Các khu vực khả dụng

VùngVị trí
us-central1Iowa, Hoa Kỳ
us-east1Nam Carolina, Hoa Kỳ
us-east4Bắc Virginia, Hoa Kỳ
us-east5Columbus, Hoa Kỳ
us-south1Dallas, Hoa Kỳ
us-west1Oregon, Hoa Kỳ
us-west2Los Angeles, Hoa Kỳ
us-west3Salt Lake City, Hoa Kỳ
us-west4Las Vegas, Hoa Kỳ
northamerica-northeast1Montreal, Canada
northamerica-northeast2Toronto, Canada
bắc mỹ-nam1Queretaro, Mexico
southamerica-east1Sao Paulo, Brazil
southamerica-west1Santiago, Chile
VùngVị trí
europe-west1Thánh Ghislain, Bỉ
europe-west2London, Vương quốc Anh
europe-west3Frankfurt, Đức
europe-west4Eemshaven, Hà Lan
europe-west6Zurich, Thụy Sĩ
europe-west8Milan, Ý
europe-west9Paris, Pháp
europe-west10Berlin, Đức
europe-west12Turin, Ý
europe-north1Hamina, Phần Lan
châu Âu-bắc2Stockholm, Thụy Điển
europe-central2Warsaw, Ba Lan
europe-southwest1Madrid, Tây Ban Nha
VùngVị trí
asia-east1Changhua, Đài Loan
asia-east2Cửu Long, Hồng Kông
asia-northeast1Tokyo, Nhật Bản
asia-northeast2Osaka, Nhật Bản
asia-northeast3Seoul, Hàn Quốc
asia-south1Mumbai, Ấn Độ
asia-south2Delhi, Ấn Độ
asia-southeast1Jurong West, Singapore
asia-southeast2Jakarta, Indonesia
asia-southeast3Băng Cốc, Thái Lan
australia-southeast1Sydney, Úc
australia-southeast2Melbourne, Úc
VùngVị trí
africa-south1Johannesburg, Nam Phi
me-central1Doha, Qatar
me-central2Dammam, Ả Rập Xê Út
me-west1Tel Aviv, Israel

Cấu hình điểm cuối

Hộp thoại triển khai mới

Hàm New Deployment hộp thoại cung cấp:

Thiết lậpMô tảMặc định
Mô hìnhChọn từ các mô hình đã hoàn thiện-
Khu vựcKhu vực triển khai-
Tên Triển khaiTự động tạo, có thể chỉnh sửa-
Lõi CPUPhân bổ CPU (1-8)1
Bộ nhớ (GB)Phân bổ bộ nhớ (1-32 GB)2

Ultralytics Bảng Tài nguyên trong hộp thoại Triển khai Nền tảng Mới đã được mở rộng

Các thiết lập tài nguyên có sẵn trong phần Tài nguyên có thể thu gọn. Theo mặc định, các triển khai sử dụng chế độ thu nhỏ về 0 (số lượng phiên bản tối thiểu = 0, số lượng phiên bản tối đa = 1) — bạn chỉ phải trả tiền cho thời gian suy luận thực tế.

Tên được Tự động Tạo

Tên triển khai được tạo tự động từ tên mô hình và thành phố khu vực (ví dụ: yolo26n-iowa). Nếu bạn triển khai cùng một mô hình đến cùng một khu vực một lần nữa, một hậu tố số sẽ được thêm vào (ví dụ: yolo26n-iowa-2).

Tab Triển khai (Triển khai nhanh)

Khi triển khai từ mô hình Deploy tab, các điểm cuối được tạo với tài nguyên mặc định (1) CPU (Bộ nhớ 2 GB) với tính năng thu nhỏ về 0 được bật. Tên triển khai được tạo tự động.

Quản lý điểm cuối

Chế độ xem

Danh sách triển khai hỗ trợ ba chế độ xem:

Cách thứcMô tả
ThẻCác thẻ chi tiết đầy đủ với nhật ký, ví dụ mã, bảng dự đoán.
Thu gọnLưới gồm các thẻ nhỏ hơn với các chỉ số quan trọng.
BảngBảng dữ liệu (DataTable) với các cột có thể sắp xếp và chức năng tìm kiếm

Ultralytics Tab Triển khai Nền tảng > Chế độ xem Thẻ Triển khai Đang hoạt động

Thẻ Triển khai (Chế độ xem thẻ)

Mỗi thẻ triển khai trong chế độ xem thẻ hiển thị:

  • Tiêu đề: Tên, cờ khu vực, huy hiệu trạng thái, nút bắt đầu/dừng/xóa
  • URL điểm cuối: URL có thể sao chép kèm liên kết đến tài liệu API
  • Chỉ số: Số lượng yêu cầu (24h), độ trễ P95, tỷ lệ lỗi
  • Kiểm tra tình trạng: Chỉ báo tình trạng trực tiếp với độ trễ và làm mới thủ công
  • Các tab: Logs, Code, và Predict

Hàm Logs Tab này hiển thị các mục nhật ký gần đây với bộ lọc theo mức độ nghiêm trọng (Tất cả / Lỗi). Code Tab này hiển thị các ví dụ mã sẵn sàng sử dụng. Python , JavaScript và cURL với URL điểm cuối và khóa API thực tế của bạn. Predict Tab này cung cấp bảng dự đoán nội tuyến để kiểm tra trực tiếp trên hệ thống đang triển khai.

Trạng thái Triển khai

Trạng tháiMô tả
Đang tạoĐang thiết lập triển khai
Đang triển khaiContainer đang khởi động
Sẵn sàngĐiểm cuối đã hoạt động và đang chấp nhận yêu cầu.
Dừng lạiĐiểm cuối đang tắt.
Đã dừng lạiĐiểm cuối đang tạm dừng (không tính phí)
Thất bạiTriển khai thất bại (xem thông báo lỗi)

URL điểm cuối

Mỗi điểm cuối có một URL duy nhất, ví dụ:

https://predict-abc123.run.app

Ultralytics URL điểm cuối của thẻ triển khai nền tảng với nút sao chép

Nhấp vào nút sao chép để sao chép URL. Nhấp vào biểu tượng tài liệu để xem tài liệu API được tạo tự động cho điểm cuối.

Quản lý Vòng đời

Kiểm soát trạng thái điểm cuối của bạn:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
Hành độngMô tả
Bắt đầuTiếp tục một điểm cuối đã dừng
DừngTạm dừng điểm cuối (không tính phí)
XóaXóa vĩnh viễn điểm cuối

Dừng Endpoint

Dừng một điểm cuối để tạm dừng tính phí:

  1. Nhấp vào biểu tượng tạm dừng trên thẻ triển khai
  2. Trạng thái của điểm cuối thay đổi thành "Đang dừng" rồi "Đã dừng".

Các điểm cuối đã dừng:

  • Không chấp nhận yêu cầu
  • Không phát sinh chi phí
  • Có thể khởi động lại bất cứ lúc nào

Xóa Endpoint

Xóa vĩnh viễn một điểm cuối:

  1. Nhấp vào biểu tượng xóa (thùng rác) trên thẻ triển khai
  2. Xác nhận xóa trong hộp thoại

Hành động vĩnh viễn

Việc xóa là ngay lập tức và vĩnh viễn. Bạn luôn có thể tạo một điểm cuối mới.

Sử dụng các Endpoint

Xác thực

Mỗi lần triển khai được tạo bằng khóa API từ tài khoản của bạn. Hãy thêm khóa này vào các yêu cầu:

Authorization: Bearer YOUR_API_KEY

Mã tiền tố của khóa API được hiển thị ở chân trang thẻ triển khai để nhận dạng. Tạo khóa từ Khóa API .

Không giới hạn tỷ lệ

Các điểm cuối chuyên dụng không bị giới hạn tốc độ của API nền tảng. Các yêu cầu được gửi trực tiếp đến dịch vụ chuyên dụng của bạn, do đó thông lượng chỉ bị giới hạn bởi CPU, bộ nhớ và cấu hình mở rộng của điểm cuối. Đây là một lợi thế chính so với suy luận chia sẻ, vốn bị giới hạn tốc độ ở mức 20 yêu cầu/phút cho mỗi khóa API.

Ví dụ Yêu cầu

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Tham số yêu cầu

Tham sốLoạiMặc địnhMô tả
filetệp-Tệp hình ảnh hoặc video (bắt buộc)
confsố thực0.25Ngưỡng tin cậy tối thiểu
iousố thực0.7Ngưỡng IoU NMS
imgszint640Kích thước ảnh đầu vào
normalizechuỗi-Trả về tọa độ đã chuẩn hóa

Suy luận video

Các điểm cuối chuyên dụng chấp nhận tệp video ngoài hình ảnh. Các định dạng video được hỗ trợ (tối đa 100MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. Mỗi khung hình được xử lý riêng lẻ và kết quả được trả về cho từng khung hình. Các định dạng hình ảnh được hỗ trợ (tối đa 50MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP.

Định dạng phản hồi

Tương tự như suy luận chia sẻ với các trường dành riêng cho tác vụ.

Giá cả

Các điểm cuối chuyên dụng cơ bản miễn phí trên tất cả các gói. Các cấu hình tài nguyên cao hơn (nhiều vCPU hơn, nhiều bộ nhớ hơn, khởi động nóng) sẽ có giá dựa trên mức sử dụng trong tương lai.

Tối ưu hóa chi phí

  • Sử dụng chế độ thu nhỏ về 0 (mặc định) để các điểm cuối chỉ chạy khi nhận được yêu cầu.
  • Đặt số lượng phiên bản tối đa phù hợp cho lưu lượng truy cập của bạn.
  • Giám sát mức sử dụng trong bảng điều khiển Giám sát

Câu hỏi thường gặp

Tôi có thể tạo bao nhiêu endpoint?

Giới hạn điểm cuối phụ thuộc vào gói dịch vụ:

  • Miễn phí: Tối đa 3 lượt triển khai
  • Pro: Lên đến 10 triển khai
  • Enterprise: Triển khai không giới hạn

Mỗi mô hình vẫn có thể được triển khai đến nhiều khu vực trong phạm vi hạn mức gói cước của bạn.

Tôi có thể thay đổi khu vực sau khi triển khai không?

Không, các khu vực là cố định. Để thay đổi khu vực:

  1. Xóa điểm cuối hiện có
  2. Tạo một điểm cuối mới trong khu vực mong muốn

Làm thế nào để xử lý việc triển khai đa khu vực?

Để có phạm vi phủ sóng toàn cầu:

  1. Triển khai tới nhiều khu vực
  2. Sử dụng bộ cân bằng tải hoặc định tuyến DNS
  3. Định tuyến người dùng đến điểm cuối gần nhất

Thời gian khởi động nguội là bao lâu?

Thời gian khởi động nguội phụ thuộc vào kích thước mô hình và liệu container đã được lưu vào bộ nhớ cache trong khu vực hay chưa. Phạm vi điển hình:

Kịch bảnKhởi động lạnh
Container đã được lưu vào bộ nhớ đệm~5-15 giây
Lần triển khai/khu vực đầu tiên~15-45 giây

Quá trình kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để xử lý các trường hợp khởi động nguội tồi tệ nhất.

Tôi có thể sử dụng tên miền tùy chỉnh không?

Tên miền tùy chỉnh sẽ sớm ra mắt. Hiện tại, các điểm cuối sử dụng URL do nền tảng tạo.



📅 Được tạo 2 tháng trước ✏️ Cập nhật 7 ngày trước
glenn-jochert-hakobyansergiuwaxmann

Bình luận