Chuyển đến nội dung

Triển khai

Ultralytics Platform cung cấp các tùy chọn triển khai toàn diện để đưa các mô hình YOLO của bạn vào sản xuất. Kiểm tra mô hình với suy luận dựa trên trình duyệt, triển khai tới các điểm cuối chuyên dụng trên 43 khu vực toàn cầu và giám sát hiệu suất theo thời gian thực.



Xem: Bắt đầu với Ultralytics Nền tảng - Triển khai

Tổng quan

Phần Triển khai giúp bạn:

  • Kiểm thử các mô hình trực tiếp trong trình duyệt với Predict tab
  • Triển khai đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu
  • Giám sát các chỉ số yêu cầu, nhật ký và kiểm tra tình trạng
  • Tự động điều chỉnh theo lưu lượng truy cập (bao gồm tự động giảm về 0)

Ultralytics Trang triển khai nền tảng - Bản đồ thế giới kèm thẻ tổng quan

Tùy chọn triển khai

Ultralytics Platform cung cấp nhiều lộ trình triển khai:

Tùy chọnMô tảTốt nhất cho
Tab Dự đoánSuy luận trên trình duyệt với hình ảnh, webcam và ví dụPhát triển, xác thực
Suy luận dùng chungDịch vụ đa người dùng trên 3 khu vựcSử dụng nhẹ, kiểm thử
Điểm cuối chuyên dụngDịch vụ dành riêng cho từng khách hàng tại 43 khu vực.Sản xuất, độ trễ thấp

Quy trình làm việc

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
Giai đoạnMô tả
Kiểm thửXác thực mô hình với Predict tab
Cấu hìnhChọn khu vực, tài nguyên và tên triển khai.
Triển khaiTạo một điểm cuối chuyên dụng từ Deploy tab
Giám sátTheo dõi các yêu cầu, độ trễ, lỗi và nhật ký trong phần Giám sát.

Kiến trúc

Suy luận dùng chung

Dịch vụ suy luận dùng chung hoạt động ở 3 khu vực chính, tự động định tuyến yêu cầu dựa trên khu vực dữ liệu của bạn:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
Khu vựcVị trí
MỹIowa, Hoa Kỳ
EUBỉ, Châu Âu
APHồng Kông, Châu Á-Thái Bình Dương

Điểm cuối chuyên dụng

Triển khai đến 43 khu vực trên toàn thế giới trên Ultralytics Cloud:

  • Châu Mỹ: 14 khu vực
  • Châu Âu: 13 khu vực
  • Châu Á - Thái Bình Dương: 12 khu vực
  • Trung Đông & Châu Phi: 4 khu vực

Mỗi điểm cuối là một dịch vụ đơn người thuê với:

  • Tài nguyên tính toán chuyên dụng (CPU và bộ nhớ có thể cấu hình)
  • Tự động mở rộng quy mô (thu nhỏ về 0 khi không hoạt động)
  • URL điểm cuối duy nhất
  • Giám sát độc lập, nhật ký và kiểm tra sức khỏe.

Trang Triển khai

Truy cập trang triển khai toàn cầu từ thanh bên dưới mục Deploy. Trang này hiển thị:

  • Bản đồ thế giới với các ghim khu vực đã triển khai (bản đồ tương tác)
  • Thẻ tổng quan: Tổng số yêu cầu (24h), Triển khai đang hoạt động, Tỷ lệ lỗi (24h), Độ trễ P95 (24h)
  • Danh sách triển khai với ba chế độ xem: thẻ, gọn và bảng
  • Triển khai mới nút để tạo điểm cuối từ bất kỳ mô hình đã hoàn thành nào

Ultralytics Tổng quan trang triển khai nền tảng: Thẻ và danh sách triển khai

Tự động thăm dò

Trang này sẽ kiểm tra trạng thái cập nhật số liệu cứ sau 30 giây. Khi các triển khai đang trong trạng thái chuyển tiếp (đang tạo, đang triển khai, đang dừng), tần suất kiểm tra sẽ tăng lên 2-3 giây một lần để nhận phản hồi gần như tức thì.

Các tính năng chính

Phạm vi toàn cầu

Triển khai gần người dùng của bạn với 43 khu vực bao phủ:

  • Bắc Mỹ, Nam Mỹ
  • Châu Âu, Trung Đông, Châu Phi
  • Châu Á Thái Bình Dương, Châu Đại Dương

Tự động điều chỉnh quy mô

Các điểm cuối tự động điều chỉnh quy mô:

  • Tự động giảm về 0: Không tốn chi phí khi không hoạt động (mặc định)
  • Tự động mở rộng: Xử lý các đợt tăng đột biến lưu lượng truy cập tự động

Tiết kiệm chi phí

Chế độ thu nhỏ về 0 được bật theo mặc định (số lượng mẫu tối thiểu = 0). Bạn chỉ trả tiền cho thời gian suy luận thực tế.

Độ trễ thấp

Các điểm cuối chuyên dụng cung cấp:

  • Khởi động nguội: ~5-15 giây (container đã lưu cache), lên đến ~45 giây (triển khai lần đầu)
  • Suy luận nóng: 50-200ms (tùy thuộc vào mô hình)
  • Định tuyến theo khu vực để đạt hiệu suất tối ưu

Khám sức khỏe

Mỗi lần triển khai đều bao gồm một bước kiểm tra trạng thái tự động với các bước sau:

  • Chỉ báo trạng thái trực tiếp (khỏe mạnh/không khỏe mạnh)
  • Hiển thị độ trễ phản hồi
  • Tự động thử lại khi không ổn định (kiểm tra mỗi 20 giây)
  • Nút làm mới thủ công

Bắt đầu nhanh

Triển khai một mô hình trong vòng chưa đầy 2 phút:

  1. Huấn luyện hoặc tải mô hình lên dự án
  2. Vào tab Triển khai của mô hình.
  3. Chọn một khu vực từ bảng độ trễ.
  4. Nhấp vào Triển khai — điểm cuối của bạn đã hoạt động

Triển khai nhanh

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

Sau khi triển khai, hãy sử dụng URL điểm cuối cùng cùng với khóa API của bạn để gửi yêu cầu suy luận từ bất kỳ ứng dụng nào.

Câu hỏi thường gặp

Sự khác biệt giữa suy luận dùng chung và suy luận chuyên dụng là gì?

Tính năngĐã chia sẻChuyên dụng
Độ trễBiến đổiỔn định
Chi phíMiễn phí (đã bao gồm)Miễn phí (cơ bản), tính phí theo mức sử dụng (nâng cao)
Tỉ lệHạn chếCó thể cấu hình
Khu vực343
URLTổng quátTùy chỉnh
Mức phí20 yêu cầu/phútKhông giới hạn

Việc triển khai mất bao lâu?

Triển khai điểm cuối chuyên dụng thường mất 1-2 phút:

  1. Kéo ảnh (~30 giây)
  2. Khởi động container (~30 giây)
  3. Kiểm tra tình trạng (~30 giây)

Tôi có thể triển khai nhiều mô hình không?

Có, mỗi mô hình có thể có nhiều điểm cuối ở các khu vực khác nhau. Không có giới hạn về tổng số điểm cuối (tùy thuộc vào gói của bạn).

Điều gì xảy ra khi một điểm cuối không hoạt động?

Khi bật tính năng tự động giảm về 0:

  • Điểm cuối giảm quy mô sau khi không hoạt động
  • Yêu cầu đầu tiên kích hoạt khởi động nguội
  • Các yêu cầu tiếp theo sẽ nhanh

Các yêu cầu đầu tiên sau một khoảng thời gian không hoạt động sẽ kích hoạt quá trình khởi động nguội.



📅 Được tạo 2 tháng trước ✏️ Cập nhật 10 ngày trước
glenn-jocherRizwanMunawarsergiuwaxmann

Bình luận