Chuyển đến nội dung

Triển khai

Nền tảng Ultralytics cung cấp các tùy chọn triển khai toàn diện để đưa... YOLO Đưa các mô hình vào sản xuất. Kiểm thử các mô hình bằng API suy luận, triển khai đến các điểm cuối chuyên dụng và giám sát hiệu suất theo thời gian thực.

Tổng quan

Phần Triển khai giúp bạn:

  • Kiểm thử mô hình trực tiếp trong trình duyệt
  • Triển khai đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu.
  • Theo dõi số liệu và nhật ký yêu cầu
  • Tự động điều chỉnh quy mô theo lưu lượng truy cập

Tùy chọn triển khai

Ultralytics Nền tảng này cung cấp nhiều phương thức triển khai khác nhau:

Lựa chọnMô tảTốt nhất cho
Tab thử nghiệmKiểm thử suy luận dựa trên trình duyệtPhát triển, kiểm chứng
API dùng chungDịch vụ suy luận đa người dùngSử dụng nhẹ nhàng, thử nghiệm
Điểm cuối chuyên dụngDịch vụ sản xuất dành riêng cho một người dùngSản xuất, độ trễ thấp

Quy trình làm việc

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
Sân khấuMô tả
Bài kiểm traKiểm tra tính hợp lệ của mô hình bằng hình ảnh mẫu.
Cấu hìnhChọn khu vực và tùy chọn tỷ lệ
Triển khaiTạo điểm cuối chuyên dụng
Màn hìnhTheo dõi yêu cầu, độ trễ và lỗi.

Kiến trúc

Suy luận chung

Dịch vụ suy luận chung hoạt động ở 3 khu vực chính:

Vùng đấtVị trí
CHÚNG TATrung tâm Hoa Kỳ (Iowa)
Liên minh châu ÂuEU Tây (Bỉ)
APChâu Á Thái Bình Dương (Hồng Kông)

Các yêu cầu sẽ được tự động chuyển đến vùng dữ liệu của bạn.

Điểm cuối chuyên dụng

Triển khai tại 43 khu vực trên toàn thế giới:

  • Châu Mỹ : 15 khu vực
  • Châu Âu : 12 khu vực
  • Châu Á Thái Bình Dương : 16 khu vực

Mỗi điểm cuối là một dịch vụ dành riêng cho một người dùng duy nhất với:

  • Tài nguyên tính toán chuyên dụng
  • Tự động mở rộng quy mô (0-N phiên bản)
  • URL tùy chỉnh
  • Giám sát độc lập

Các tính năng chính

Phạm vi phủ sóng toàn cầu

Triển khai gần người dùng hơn với 43 khu vực bao phủ:

  • Bắc Mỹ, Nam Mỹ
  • Châu Âu, Trung Đông, Châu Phi
  • Châu Á Thái Bình Dương, Châu Đại Dương

Tự động điều chỉnh tỷ lệ

Các điểm cuối tự động mở rộng quy mô:

  • Về mức 0 : Không tốn chi phí khi không hoạt động
  • Mở rộng quy mô : Xử lý lưu lượng truy cập tăng đột biến
  • Giới hạn có thể cấu hình : Đặt số lượng phiên bản tối thiểu/tối đa.

Độ trễ thấp

Các điểm cuối chuyên dụng cung cấp:

  • Khởi động nguội: ~2-5 giây
  • Suy luận nhanh: 50-200ms (tùy thuộc vào mô hình)
  • Định tuyến khu vực để đạt hiệu suất tối ưu

Câu hỏi thường gặp

Sự khác biệt giữa suy luận dùng chung và suy luận chuyên dụng là gì?

Tính năngChia sẻTận tụy
Độ trễBiếnNhất quán
Trị giáThanh toán theo yêu cầuTrả phí theo thời gian hoạt động
Tỉ lệGiới hạnCó thể cấu hình
Các vùng343
URLChungTùy chỉnh

Quá trình triển khai mất bao lâu?

Việc triển khai điểm cuối chuyên dụng thường mất 1-2 phút:

  1. Tải ảnh (~30 giây)
  2. Khởi động container (~30 giây)
  3. Kiểm tra sức khỏe (~30 giây)

Tôi có thể triển khai nhiều mô hình không?

Đúng vậy, mỗi mô hình có thể có nhiều điểm cuối ở các khu vực khác nhau. Không có giới hạn về tổng số điểm cuối (tùy thuộc vào gói dịch vụ của bạn).

Điều gì xảy ra khi một thiết bị đầu cuối ở trạng thái rảnh rỗi?

Khi bật chế độ thu nhỏ về 0:

  • Kích thước điểm cuối sẽ giảm sau khi không hoạt động.
  • Yêu cầu đầu tiên kích hoạt quá trình khởi động nguội.
  • Các yêu cầu tiếp theo được xử lý nhanh chóng.

Để tránh tình trạng khởi động chậm, hãy đặt số lượng instance tối thiểu > 0.



📅 Được tạo 0 ngày trước ✏️ Được cập nhật 0 ngày trước
glenn-jocher

Bình luận