Hướng dẫn triển khai YOLO11 trên Amazon SageMaker Endpoints
Triển khai các mô hình thị giác máy tính tiên tiến như YOLO11 của Ultralytics trên Amazon SageMaker Endpoints mở ra nhiều khả năng cho nhiều ứng dụng học máy khác nhau. Chìa khóa để sử dụng hiệu quả các mô hình này nằm ở việc hiểu các quy trình thiết lập, cấu hình và triển khai của chúng. YOLO11 trở nên mạnh mẽ hơn nữa khi được tích hợp liền mạch với Amazon SageMaker, một dịch vụ học máy mạnh mẽ và có khả năng mở rộng của AWS.
Hướng dẫn này sẽ hướng dẫn bạn từng bước triển khai mô hình YOLO11 PyTorch trên Amazon SageMaker Endpoints. Bạn sẽ tìm hiểu những điều cần thiết để chuẩn bị môi trường AWS, cấu hình mô hình phù hợp và sử dụng các công cụ như AWS CloudFormation và AWS Cloud Development Kit (CDK) để triển khai.
Amazon SageMaker
Amazon SageMaker là dịch vụ machine learning của Amazon Web Services (AWS) giúp đơn giản hóa quá trình xây dựng, đào tạo và triển khai các mô hình machine learning. Nó cung cấp một loạt các công cụ để xử lý các khía cạnh khác nhau của quy trình làm việc học máy. Điều này bao gồm các tính năng tự động để điều chỉnh mô hình, tùy chọn cho các mô hình đào tạo ở quy mô lớn và các phương pháp đơn giản để triển khai các mô hình vào sản xuất. SageMaker hỗ trợ các khung học máy phổ biến, cung cấp sự linh hoạt cần thiết cho các dự án đa dạng. Các tính năng của nó cũng bao gồm ghi nhãn dữ liệu, quản lý quy trình làm việc và phân tích hiệu suất.
Triển khai YOLO11 trên Amazon SageMaker Endpoints
Triển khai YOLO11 trên Amazon SageMaker cho phép bạn sử dụng môi trường được quản lý của nó để suy luận theo thời gian thực và tận dụng các tính năng như tự động mở rộng quy mô. Hãy xem kiến trúc AWS bên dưới.
Bước 1: Thiết lập môi trường AWS của bạn
Trước tiên, hãy đảm bảo bạn có các điều kiện tiên quyết sau:
Tài khoản AWS: Nếu bạn chưa có, hãy đăng ký tài khoản AWS.
Vai trò IAM đã định cấu hình: Bạn sẽ cần một vai trò IAM có các quyền cần thiết cho Amazon SageMaker, AWS CloudFormation và Amazon S3. Vai trò này phải có các chính sách cho phép nó truy cập các dịch vụ này.
AWS CLI: Nếu chưa cài đặt, hãy tải xuống và cài đặt Giao diện dòng lệnh AWS (CLI) và định cấu hình nó với chi tiết tài khoản của bạn. Theo AWS CLI Hướng dẫn cài đặt.
AWS CDK: Nếu chưa được cài đặt, hãy cài đặt AWS Cloud Development Kit (CDK), sẽ được sử dụng để tạo tập lệnh triển khai. Làm theo hướng dẫn cài đặt AWS CDK .
Định mức dịch vụ đầy đủ: Xác nhận rằng bạn có đủ hạn ngạch cho hai tài nguyên riêng biệt trong Amazon SageMaker: một cho
ml.m5.4xlarge
để sử dụng điểm cuối và một thiết bị khác choml.m5.4xlarge
để sử dụng phiên bản sổ ghi chép. Mỗi trong số này yêu cầu tối thiểu một giá trị hạn ngạch. Nếu hạn ngạch hiện tại của bạn thấp hơn yêu cầu này, điều quan trọng là phải yêu cầu tăng cho mỗi hạn ngạch. Bạn có thể yêu cầu tăng hạn ngạch bằng cách làm theo hướng dẫn chi tiết trong Tài liệu về AWS Service Quotas.
Bước 2: Sao chép kho lưu trữ YOLO11 SageMaker
Bước tiếp theo là sao chép kho lưu trữ AWS cụ thể chứa các tài nguyên để triển khai YOLO11 trên SageMaker. Kho lưu trữ này, được lưu trữ trên GitHub, bao gồm các tập lệnh CDK và tệp cấu hình cần thiết.
- Sao chép kho lưu trữ GitHub: Thực hiện lệnh sau trong thiết bị đầu cuối của bạn để sao chép máy chủ-yolov8-on-sagemaker-endpoint repository:
- Điều hướng đến Thư mục nhân bản: Thay đổi thư mục của bạn thành kho lưu trữ nhân bản:
Bước 3: Thiết lập môi trường CDK
Bây giờ bạn đã có mã cần thiết, hãy thiết lập môi trường của bạn để triển khai với AWS CDK.
- Tạo một Python Môi trường ảo: Điều này cô lập Python môi trường và sự phụ thuộc. Chạy:
- Kích hoạt môi trường ảo:
- Cài đặt phụ thuộc: Cài đặt yêu cầu Python Sự phụ thuộc cho dự án:
- Nâng cấp Thư viện AWS CDK: Đảm bảo bạn có phiên bản mới nhất của thư viện AWS CDK:
Bước 4: Tạo AWS CloudFormation Stack
- Tổng hợp ứng dụng CDK: Tạo mẫu AWS CloudFormation từ mã CDK của bạn:
- Khởi động ứng dụng CDK: Chuẩn bị môi trường AWS của bạn để triển khai CDK:
- Triển khai ngăn xếp: Điều này sẽ tạo ra các tài nguyên AWS cần thiết và triển khai mô hình của bạn:
Bước 5: Triển khai YOLO Người mẫu
Trước khi tìm hiểu hướng dẫn triển khai, hãy đảm bảo kiểm tra phạm vi các mô hình YOLO11 do Ultralytics cung cấp . Điều này sẽ giúp bạn chọn mô hình phù hợp nhất cho yêu cầu dự án của mình.
Sau khi tạo AWS CloudFormation Stack, bước tiếp theo là triển khai YOLO11.
Mở Phiên bản sổ ghi chép: Truy cập Bảng điều khiển AWS và điều hướng đến dịch vụ Amazon SageMaker. Chọn "Phiên bản sổ ghi chép" từ bảng thông tin, sau đó định vị phiên bản sổ ghi chép được tạo bởi tập lệnh triển khai CDK của bạn. Mở phiên bản sổ ghi chép để truy cập môi trường Jupyter.
Truy cập và sửa đổi inference.py: Sau khi mở phiên bản sổ ghi chép SageMaker trong Jupyter, hãy định vị tệp inference.py. Chỉnh sửa hàm output_fn trong inference.py như hình dưới đây và lưu các thay đổi của bạn vào tập lệnh, đảm bảo rằng không có lỗi cú pháp.
import json
def output_fn(prediction_output):
"""Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
print("Executing output_fn from inference.py ...")
infer = {}
for result in prediction_output:
if result.boxes is not None:
infer["boxes"] = result.boxes.numpy().data.tolist()
if result.masks is not None:
infer["masks"] = result.masks.numpy().data.tolist()
if result.keypoints is not None:
infer["keypoints"] = result.keypoints.numpy().data.tolist()
if result.obb is not None:
infer["obb"] = result.obb.numpy().data.tolist()
if result.probs is not None:
infer["probs"] = result.probs.numpy().data.tolist()
return json.dumps(infer)
- Triển khai Điểm cuối bằng 1_DeployEndpoint.ipynb: Trong môi trường Jupyter, hãy mở sổ ghi chép 1_DeployEndpoint.ipynb nằm trong thư mục sm-notebook. Làm theo hướng dẫn trong sổ ghi chép và chạy các ô để tải xuống mô hình YOLO11, đóng gói nó với mã suy luận đã cập nhật và tải nó lên thùng Amazon S3. Sổ ghi chép sẽ hướng dẫn bạn tạo và triển khai điểm cuối SageMaker cho mô hình YOLO11.
Bước 6: Kiểm tra triển khai của bạn
Bây giờ mô hình YOLO11 của bạn đã được triển khai, điều quan trọng là phải kiểm tra hiệu suất và chức năng của nó.
Mở Test Notebook: Trong cùng một môi trường Jupyter, định vị và mở sổ ghi chép 2_TestEndpoint.ipynb, cũng trong thư mục sm-notebook.
Chạy Sổ tay thử nghiệm: Thực hiện theo hướng dẫn trong sổ tay để thử nghiệm điểm cuối SageMaker đã triển khai. Điều này bao gồm gửi hình ảnh đến điểm cuối và chạy suy luận. Sau đó, bạn sẽ vẽ biểu đồ đầu ra để trực quan hóa hiệu suất và độ chính xác của mô hình, như được hiển thị bên dưới.
- Tài nguyên dọn dẹp: Sổ ghi chép kiểm tra cũng sẽ hướng dẫn bạn qua quy trình dọn dẹp điểm cuối và mô hình được lưu trữ. Đây là một bước quan trọng để quản lý chi phí và nguồn lực một cách hiệu quả, đặc biệt nếu bạn không có kế hoạch sử dụng mô hình được triển khai ngay lập tức.
Bước 7: Giám sát và quản lý
Sau khi thử nghiệm, việc giám sát và quản lý liên tục mô hình đã triển khai của bạn là rất cần thiết.
Giám sát bằng Amazon CloudWatch: Thường xuyên kiểm tra hiệu suất và tình trạng của điểm cuối SageMaker bằng Amazon CloudWatch.
Quản lý điểm cuối: Sử dụng bảng điều khiển SageMaker để quản lý điểm cuối liên tục. Điều này bao gồm mở rộng quy mô, cập nhật hoặc triển khai lại mô hình theo yêu cầu.
Bằng cách hoàn thành các bước này, bạn sẽ triển khai và thử nghiệm thành công mô hình YOLO11 trên Amazon SageMaker Endpoints. Quy trình này không chỉ trang bị cho bạn kinh nghiệm thực tế trong việc sử dụng dịch vụ AWS để triển khai học máy mà còn đặt nền tảng cho việc triển khai các mô hình tiên tiến khác trong tương lai.
Tóm tắt
Hướng dẫn này hướng dẫn bạn từng bước triển khai YOLO11 trên Amazon SageMaker Endpoints bằng AWS CloudFormation và AWS Cloud Development Kit (CDK). Quy trình bao gồm sao chép kho lưu trữ GitHub cần thiết, thiết lập môi trường CDK, triển khai mô hình bằng dịch vụ AWS và kiểm tra hiệu suất của mô hình trên SageMaker.
Để biết thêm chi tiết kỹ thuật, hãy tham khảo bài viết này trên Blog về Machine Learning của AWS. Bạn cũng có thể xem Tài liệu chính thức của Amazon SageMaker để biết thêm thông tin chi tiết về các tính năng và chức năng khác nhau.
Bạn có muốn tìm hiểu thêm về các tích hợp YOLO11 khác nhau không? Truy cập trang hướng dẫn tích hợp Ultralytics để khám phá các công cụ và khả năng bổ sung có thể nâng cao các dự án học máy của bạn.
FAQ
Làm thế nào để tôi triển khai Ultralytics Mô hình YOLO11 trên Amazon SageMaker Endpoints?
Để triển khai Ultralytics Mô hình YOLO11 trên Amazon SageMaker Endpoints, hãy làm theo các bước sau:
- Thiết lập môi trường AWS của bạn: Đảm bảo bạn có Tài khoản AWS, vai trò IAM với các quyền cần thiết và AWS CLI Cấu hình. Cài đặt AWS CDK nếu chưa hoàn tất (tham khảo hướng dẫn AWS CDK).
- Sao chép kho lưu trữ YOLO11 SageMaker:
- Thiết lập môi trường CDK: Tạo một Python môi trường ảo, kích hoạt nó, cài đặt các thành phần phụ thuộc và nâng cấp thư viện AWS CDK.
- Triển khai bằng AWS CDK: Tổng hợp và deploy CloudFormation stack, bootstrap môi trường.
Để biết thêm chi tiết, hãy xem lại phần tài liệu.
Điều kiện tiên quyết để triển khai YOLO11 trên Amazon SageMaker là gì?
Để triển khai YOLO11 trên Amazon SageMaker, hãy đảm bảo bạn có đủ các điều kiện tiên quyết sau:
- Tài khoản AWS: Tài khoản AWS đang hoạt động (đăng ký tại đây).
- Vai trò IAM: Vai trò IAM được định cấu hình với các quyền cho SageMaker, CloudFormation và Amazon S3.
- AWS CLI: Đã cài đặt và cấu hình Giao diện dòng lệnh AWS (AWS CLI hướng dẫn cài đặt).
- AWS CDK: Bộ công cụ phát triển đám mây AWS đã cài đặt (hướng dẫn thiết lập CDK).
- Định mức dịch vụ: Đủ hạn ngạch cho
ml.m5.4xlarge
Phiên bản cho cả mức sử dụng điểm cuối và sổ ghi chép (Yêu cầu tăng hạn ngạch).
Để biết thiết lập chi tiết, hãy tham khảo phần này.
Tại sao tôi nên sử dụng Ultralytics YOLO11 trên Amazon SageMaker?
Sử dụng Ultralytics YOLO11 trên Amazon SageMaker mang lại một số lợi thế:
- Khả năng mở rộng và quản lý: SageMaker cung cấp một môi trường được quản lý với các tính năng như tự động thay đổi quy mô, giúp đáp ứng nhu cầu suy luận theo thời gian thực.
- Tích hợp với Dịch vụ AWS: Tích hợp liền mạch với các dịch vụ AWS khác, chẳng hạn như S3 để lưu trữ dữ liệu, CloudFormation cho cơ sở hạ tầng dưới dạng mã và CloudWatch để giám sát.
- Dễ triển khai: Thiết lập đơn giản bằng cách sử dụng tập lệnh AWS CDK và các quy trình triển khai được hợp lý hóa.
- Hiệu năng: Tận dụng cơ sở hạ tầng hiệu năng cao của Amazon SageMaker để chạy các tác vụ suy luận quy mô lớn một cách hiệu quả.
Khám phá thêm về những lợi thế của việc sử dụng SageMaker trong phần giới thiệu.
Tôi có thể tùy chỉnh logic suy luận cho YOLO11 trên Amazon SageMaker không?
Có, bạn có thể tùy chỉnh logic suy luận cho YOLO11 trên Amazon SageMaker:
Thay đổi
inference.py
: Định vị và tùy chỉnhoutput_fn
hàm tronginference.py
để điều chỉnh các định dạng đầu ra.import json def output_fn(prediction_output): """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints.""" infer = {} for result in prediction_output: if result.boxes is not None: infer["boxes"] = result.boxes.numpy().data.tolist() # Add more processing logic if necessary return json.dumps(infer)
Triển khai mô hình cập nhật: Đảm bảo bạn triển khai lại mô hình bằng sổ ghi chép Jupyter được cung cấp (
1_DeployEndpoint.ipynb
) để bao gồm những thay đổi này.
Tham khảo các bước chi tiết để triển khai mô hình sửa đổi.
Làm thế nào tôi có thể kiểm tra mô hình YOLO11 đã triển khai trên Amazon SageMaker?
Để kiểm tra mô hình YOLO11 đã triển khai trên Amazon SageMaker:
- Mở Sổ ghi chép Kiểm tra: Xác định vị trí
2_TestEndpoint.ipynb
máy tính xách tay trong môi trường SageMaker Jupyter. - Chạy Sổ ghi chép: Làm theo hướng dẫn của sổ ghi chép để gửi hình ảnh đến điểm cuối, thực hiện suy luận và hiển thị kết quả.
- Trực quan hóa kết quả: Sử dụng các chức năng vẽ đồ thị tích hợp sẵn để trực quan hóa các chỉ số hiệu suất, chẳng hạn như giới hạn các hộp xung quanh các đối tượng được phát hiện.
Để biết hướng dẫn kiểm tra toàn diện, hãy truy cập phần thử nghiệm.