Chuyển đến nội dung

Triển khai

Ultralytics Platform cung cấp các tùy chọn triển khai toàn diện để đưa các mô hình YOLO của bạn vào sản xuất. Kiểm tra mô hình với Inference API, triển khai đến các điểm cuối chuyên dụng và giám sát hiệu suất theo thời gian thực.

Tổng quan

Phần Triển khai giúp bạn:

  • Kiểm tra mô hình trực tiếp trong trình duyệt
  • Triển khai đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu
  • Giám sát các chỉ số yêu cầu và nhật ký
  • Mở rộng quy mô tự động theo lưu lượng truy cập

Tùy chọn triển khai

Ultralytics Platform cung cấp nhiều lộ trình triển khai:

Tùy chọnMô tảTốt nhất cho
Tab kiểm traKiểm thử suy luận dựa trên trình duyệtPhát triển, xác thực
API dùng chungDịch vụ suy luận đa người thuêSử dụng nhẹ, kiểm thử
Điểm cuối chuyên dụngDịch vụ sản xuất đơn người thuêSản xuất, độ trễ thấp

Quy trình làm việc

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
Giai đoạnMô tả
Kiểm thửXác thực mô hình với sample_images
Cấu hìnhChọn khu vực và tùy chọn mở rộng quy mô
Triển khaiTạo điểm cuối chuyên dụng
Giám sáttrack các yêu cầu, độ trễ và lỗi

Kiến trúc

Suy luận dùng chung

Dịch vụ suy luận chia sẻ hoạt động tại 3 khu vực chính:

Khu vựcVị trí
MỹIowa, Hoa Kỳ
EUBỉ, Châu Âu
APĐài Loan, khu vực Châu Á - Thái Bình Dương

Các yêu cầu được định tuyến đến khu vực dữ liệu của bạn một cách tự động.

Điểm cuối chuyên dụng

Triển khai tại 43 khu vực trên toàn thế giới:

  • Châu Mỹ: 15 khu vực
  • Châu Âu: 12 khu vực
  • Châu Á Thái Bình Dương: 16 khu vực

Mỗi điểm cuối là một dịch vụ đơn người thuê với:

  • Tài nguyên tính toán chuyên dụng
  • Tự động điều chỉnh quy mô (0-N phiên bản)
  • URL tùy chỉnh
  • Giám sát độc lập

Các tính năng chính

Phạm vi toàn cầu

Triển khai gần người dùng của bạn với 43 khu vực bao phủ:

  • Bắc Mỹ, Nam Mỹ
  • Châu Âu, Trung Đông, Châu Phi
  • Châu Á Thái Bình Dương, Châu Đại Dương

Tự động điều chỉnh quy mô

Các điểm cuối tự động điều chỉnh quy mô:

  • Điều chỉnh về 0: Không tốn chi phí khi không hoạt động
  • Mở rộng quy mô: Xử lý các đợt tăng đột biến lưu lượng truy cập
  • Giới hạn có thể cấu hình: Đặt số phiên bản tối thiểu/tối đa

Độ trễ thấp

Các điểm cuối chuyên dụng cung cấp:

  • Khởi động lạnh: ~2-5 giây
  • Suy luận nóng: 50-200ms (tùy thuộc vào mô hình)
  • Định tuyến theo khu vực để đạt hiệu suất tối ưu

Câu hỏi thường gặp

Sự khác biệt giữa suy luận dùng chung và suy luận chuyên dụng là gì?

Tính năngĐã chia sẻChuyên dụng
Độ trễBiến đổiỔn định
Chi phíThanh toán theo yêu cầuThanh toán theo thời gian hoạt động
Tỉ lệHạn chếCó thể cấu hình
Khu vực343
URLTổng quátTùy chỉnh

Việc triển khai mất bao lâu?

Triển khai điểm cuối chuyên dụng thường mất 1-2 phút:

  1. Kéo ảnh (~30 giây)
  2. Khởi động container (~30 giây)
  3. Kiểm tra tình trạng (~30 giây)

Tôi có thể triển khai nhiều mô hình không?

Có, mỗi mô hình có thể có nhiều điểm cuối ở các khu vực khác nhau. Không có giới hạn về tổng số điểm cuối (tùy thuộc vào gói của bạn).

Điều gì xảy ra khi một điểm cuối không hoạt động?

Khi bật tính năng tự động giảm về 0:

  • Điểm cuối giảm quy mô sau khi không hoạt động
  • Yêu cầu đầu tiên kích hoạt khởi động nguội
  • Các yêu cầu tiếp theo sẽ nhanh

Để tránh khởi động nguội, hãy đặt số lượng phiên bản tối thiểu > 0.



📅 Được tạo 20 ngày trước ✏️ Cập nhật 14 ngày trước
glenn-jocher

Bình luận