Hướng dẫn triển khai YOLO26 trên Amazon SageMaker Endpoints

Việc triển khai các mô hình computer vision tiên tiến như Ultralytics' YOLO26 trên Amazon SageMaker Endpoints mở ra vô vàn khả năng cho nhiều ứng dụng machine learning khác nhau. Chìa khóa để sử dụng hiệu quả các mô hình này nằm ở việc nắm vững các quy trình thiết lập, cấu hình và triển khai. YOLO26 trở nên mạnh mẽ hơn nữa khi được tích hợp liền mạch với Amazon SageMaker, một dịch vụ machine learning mạnh mẽ và có khả năng mở rộng của AWS.

Hướng dẫn này sẽ đưa bạn đi qua quy trình triển khai từng bước các mô hình PyTorch YOLO26 trên Amazon SageMaker Endpoints. Bạn sẽ học được các yếu tố cần thiết để chuẩn bị môi trường AWS, cấu hình mô hình phù hợp và sử dụng các công cụ như AWS CloudFormation và AWS Cloud Development Kit (CDK) để triển khai.

Amazon SageMaker

Amazon SageMaker ML platform architecture

Amazon SageMaker là một dịch vụ machine learning từ Amazon Web Services (AWS) giúp đơn giản hóa quy trình xây dựng, huấn luyện và triển khai các mô hình machine learning. Nó cung cấp một loạt các công cụ để xử lý nhiều khía cạnh khác nhau của quy trình làm việc machine learning. Điều này bao gồm các tính năng tự động để tinh chỉnh mô hình, các tùy chọn để huấn luyện mô hình ở quy mô lớn và các phương pháp đơn giản để triển khai mô hình vào sản xuất. SageMaker hỗ trợ các framework machine learning phổ biến, mang lại sự linh hoạt cần thiết cho các dự án đa dạng. Các tính năng của nó cũng bao gồm gắn nhãn dữ liệu, quản lý quy trình làm việc và phân tích hiệu suất.

Triển khai YOLO26 trên Amazon SageMaker Endpoints

Triển khai YOLO26 trên Amazon SageMaker cho phép bạn sử dụng môi trường được quản lý của nó để suy luận theo thời gian thực và tận dụng các tính năng như tự động mở rộng (autoscaling). Hãy xem qua kiến trúc AWS dưới đây.

AWS SageMaker YOLO training architecture

Bước 1: Thiết lập môi trường AWS của bạn

Trước tiên, hãy đảm bảo bạn đã đáp ứng các điều kiện tiên quyết sau:

  • Tài khoản AWS: Nếu bạn chưa có, hãy đăng ký tài khoản AWS.

  • Vai trò IAM đã cấu hình: Bạn sẽ cần một vai trò IAM có các quyền cần thiết cho Amazon SageMaker, AWS CloudFormation và Amazon S3. Vai trò này cần có các chính sách cho phép truy cập vào các dịch vụ này.

  • AWS CLI: Nếu chưa cài đặt, hãy tải xuống và cài đặt AWS Command Line Interface (CLI) và cấu hình nó với chi tiết tài khoản của bạn. Thực hiện theo hướng dẫn AWS CLI để cài đặt.

  • AWS CDK: Nếu chưa cài đặt, hãy cài đặt AWS Cloud Development Kit (CDK), công cụ này sẽ được sử dụng để viết kịch bản triển khai. Thực hiện theo hướng dẫn AWS CDK để cài đặt.

  • Hạn mức dịch vụ đầy đủ: Xác nhận rằng bạn có đủ hạn mức cho hai tài nguyên riêng biệt trong Amazon SageMaker: một cho ml.m5.4xlarge để sử dụng endpoint và một cho ml.m5.4xlarge để sử dụng notebook instance. Mỗi tài nguyên này yêu cầu tối thiểu một giá trị hạn mức. Nếu hạn mức hiện tại của bạn dưới mức yêu cầu này, điều quan trọng là phải yêu cầu tăng hạn mức cho từng tài nguyên. Bạn có thể yêu cầu tăng hạn mức bằng cách làm theo các hướng dẫn chi tiết trong tài liệu AWS Service Quotas.

Bước 2: Clone repository YOLO26 SageMaker

Bước tiếp theo là clone repository AWS cụ thể chứa các tài nguyên để triển khai YOLO26 trên SageMaker. Repository này, được lưu trữ trên GitHub, bao gồm các kịch bản CDK và tệp cấu hình cần thiết.

  • Clone GitHub Repository: Chạy lệnh sau trong terminal để clone repository host-yolov8-on-sagemaker-endpoint:

    git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
  • Điều hướng đến thư mục đã clone: Thay đổi thư mục của bạn đến repository đã clone:

    cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk

Bước 3: Thiết lập môi trường CDK

Bây giờ bạn đã có mã cần thiết, hãy thiết lập môi trường để triển khai với AWS CDK.

  • Tạo môi trường ảo Python: Việc này giúp cách ly môi trường Python và các dependency của bạn. Chạy:

    python3 -m venv .venv
  • Kích hoạt môi trường ảo:

    source .venv/bin/activate
  • Cài đặt Dependency: Cài đặt các dependency Python cần thiết cho dự án:

    pip3 install -r requirements.txt
  • Nâng cấp thư viện AWS CDK: Đảm bảo bạn có phiên bản mới nhất của thư viện AWS CDK:

    pip install --upgrade aws-cdk-lib

Bước 4: Tạo AWS CloudFormation Stack

  • Tổng hợp ứng dụng CDK: Tạo mẫu AWS CloudFormation từ mã CDK của bạn:

    cdk synth
  • Bootstrap ứng dụng CDK: Chuẩn bị môi trường AWS của bạn cho việc triển khai CDK:

    cdk bootstrap
  • Triển khai Stack: Lệnh này sẽ tạo các tài nguyên AWS cần thiết và triển khai mô hình của bạn:

    cdk deploy

Bước 5: Triển khai mô hình YOLO

Trước khi đi sâu vào các hướng dẫn triển khai, hãy nhớ kiểm tra danh sách các mô hình YOLO26 được cung cấp bởi Ultralytics. Điều này sẽ giúp bạn chọn mô hình phù hợp nhất cho các yêu cầu dự án của mình.

Sau khi tạo AWS CloudFormation Stack, bước tiếp theo là triển khai YOLO26.

  • Mở Notebook Instance: Truy cập AWS Console và điều hướng đến dịch vụ Amazon SageMaker. Chọn "Notebook Instances" từ bảng điều khiển, sau đó định vị notebook instance đã được tạo bởi kịch bản triển khai CDK của bạn. Mở notebook instance để truy cập môi trường Jupyter.

  • Truy cập và sửa đổi inference.py: Sau khi mở notebook instance SageMaker trong Jupyter, hãy định vị tệp inference.py. Chỉnh sửa hàm output_fn trong inference.py như hiển thị dưới đây và lưu các thay đổi vào kịch bản, đảm bảo rằng không có lỗi cú pháp.

    import json
    
    def output_fn(prediction_output):
        """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
        print("Executing output_fn from inference.py ...")
        infer = {}
        for result in prediction_output:
            if result.boxes is not None:
                infer["boxes"] = result.boxes.numpy().data.tolist()
            if result.masks is not None:
                infer["masks"] = result.masks.numpy().data.tolist()
            if result.keypoints is not None:
                infer["keypoints"] = result.keypoints.numpy().data.tolist()
            if result.obb is not None:
                infer["obb"] = result.obb.numpy().data.tolist()
            if result.probs is not None:
                infer["probs"] = result.probs.numpy().data.tolist()
        return json.dumps(infer)
  • Triển khai Endpoint bằng cách sử dụng 1_DeployEndpoint.ipynb: Trong môi trường Jupyter, mở notebook 1_DeployEndpoint.ipynb nằm trong thư mục sm-notebook. Thực hiện theo các hướng dẫn trong notebook và chạy các cell để tải xuống mô hình YOLO26, đóng gói nó với mã suy luận đã cập nhật và tải nó lên bucket Amazon S3. Notebook sẽ hướng dẫn bạn qua quy trình tạo và triển khai một SageMaker endpoint cho mô hình YOLO26.

Bước 6: Kiểm thử việc triển khai của bạn

Bây giờ mô hình YOLO26 của bạn đã được triển khai, điều quan trọng là phải kiểm tra hiệu suất và chức năng của nó.

  • Mở Notebook Kiểm thử: Trong cùng môi trường Jupyter, định vị và mở notebook 2_TestEndpoint.ipynb, cũng nằm trong thư mục sm-notebook.

  • Chạy Notebook Kiểm thử: Thực hiện theo các hướng dẫn trong notebook để kiểm tra SageMaker endpoint đã triển khai. Điều này bao gồm gửi hình ảnh đến endpoint và chạy các suy luận. Sau đó, bạn sẽ vẽ biểu đồ đầu ra để trực quan hóa hiệu suất và độ chính xác của mô hình, như hiển thị dưới đây.

Testing Results YOLO26

  • Dọn dẹp tài nguyên: Notebook kiểm thử cũng sẽ hướng dẫn bạn quy trình dọn dẹp endpoint và mô hình đã lưu trữ. Đây là một bước quan trọng để quản lý chi phí và tài nguyên hiệu quả, đặc biệt nếu bạn không có kế hoạch sử dụng mô hình đã triển khai ngay lập tức.

Bước 7: Giám sát và Quản lý

Sau khi kiểm thử, việc giám sát và quản lý liên tục mô hình đã triển khai của bạn là rất cần thiết.

  • Giám sát với Amazon CloudWatch: Thường xuyên kiểm tra hiệu suất và tình trạng của SageMaker endpoint của bạn bằng cách sử dụng Amazon CloudWatch.

  • Quản lý Endpoint: Sử dụng bảng điều khiển SageMaker để quản lý endpoint liên tục. Điều này bao gồm việc mở rộng quy mô, cập nhật hoặc triển khai lại mô hình khi cần.

Bằng cách hoàn thành các bước này, bạn sẽ triển khai và kiểm tra thành công mô hình YOLO26 trên Amazon SageMaker Endpoints. Quy trình này không chỉ trang bị cho bạn kinh nghiệm thực tế khi sử dụng các dịch vụ AWS cho việc triển khai machine learning mà còn đặt nền móng cho việc triển khai các mô hình tiên tiến khác trong tương lai.

Tóm tắt

Hướng dẫn này đã đưa bạn đi qua từng bước triển khai YOLO26 trên Amazon SageMaker Endpoints bằng cách sử dụng AWS CloudFormation và AWS Cloud Development Kit (CDK). Quy trình bao gồm việc clone repository GitHub cần thiết, thiết lập môi trường CDK, triển khai mô hình bằng các dịch vụ AWS và kiểm tra hiệu suất của nó trên SageMaker.

Để biết thêm chi tiết kỹ thuật, hãy tham khảo bài viết này trên Blog AWS Machine Learning. Bạn cũng có thể xem Tài liệu chính thức về Amazon SageMaker để có thêm thông tin chi tiết về các tính năng và chức năng khác nhau.

Bạn có quan tâm đến việc tìm hiểu thêm về các tích hợp YOLO26 khác không? Hãy truy cập trang hướng dẫn tích hợp của Ultralytics để khám phá các công cụ và khả năng bổ sung có thể nâng cao các dự án machine learning của bạn.

Câu hỏi thường gặp (FAQ)

Làm cách nào để tôi triển khai mô hình Ultralytics YOLO26 trên Amazon SageMaker Endpoints?

Để triển khai mô hình Ultralytics YOLO26 trên Amazon SageMaker Endpoints, hãy làm theo các bước sau:

  1. Thiết lập môi trường AWS: Đảm bảo bạn có tài khoản AWS, các vai trò IAM với quyền cần thiết và AWS CLI đã cấu hình. Cài đặt AWS CDK nếu chưa thực hiện (tham khảo hướng dẫn AWS CDK).
  2. Clone repository YOLO26 SageMaker:
    git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
    cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
  3. Thiết lập môi trường CDK: Tạo môi trường ảo Python, kích hoạt nó, cài đặt các dependency và nâng cấp thư viện AWS CDK.
    python3 -m venv .venv
    source .venv/bin/activate
    pip3 install -r requirements.txt
    pip install --upgrade aws-cdk-lib
  4. Triển khai bằng AWS CDK: Tổng hợp và triển khai CloudFormation stack, bootstrap môi trường.
    cdk synth
    cdk bootstrap
    cdk deploy

Để biết thêm chi tiết, hãy xem lại phần tài liệu.

Các điều kiện tiên quyết để triển khai YOLO26 trên Amazon SageMaker là gì?

Để triển khai YOLO26 trên Amazon SageMaker, hãy đảm bảo bạn có các điều kiện tiên quyết sau:

  1. Tài khoản AWS: Tài khoản AWS đang hoạt động (đăng ký tại đây).
  2. Vai trò IAM: Các vai trò IAM đã cấu hình với quyền truy cập SageMaker, CloudFormation và Amazon S3.
  3. AWS CLI: Đã cài đặt và cấu hình AWS Command Line Interface (hướng dẫn cài đặt AWS CLI).
  4. AWS CDK: Đã cài đặt AWS Cloud Development Kit (hướng dẫn thiết lập CDK).
  5. Hạn mức dịch vụ: Đủ hạn mức cho các instance ml.m5.4xlarge cho cả việc sử dụng endpoint và notebook (yêu cầu tăng hạn mức).

Để thiết lập chi tiết, hãy tham khảo phần này.

Tại sao tôi nên sử dụng Ultralytics YOLO26 trên Amazon SageMaker?

Sử dụng Ultralytics YOLO26 trên Amazon SageMaker mang lại một số lợi thế:

  1. Khả năng mở rộng và quản lý: SageMaker cung cấp môi trường được quản lý với các tính năng như tự động mở rộng, giúp ích cho các nhu cầu suy luận theo thời gian thực.
  2. Tích hợp với các dịch vụ AWS: Tích hợp liền mạch với các dịch vụ AWS khác, chẳng hạn như S3 để lưu trữ dữ liệu, CloudFormation cho cơ sở hạ tầng dưới dạng mã và CloudWatch để giám sát.
  3. Dễ dàng triển khai: Thiết lập đơn giản bằng cách sử dụng các kịch bản AWS CDK và các quy trình triển khai hợp lý.
  4. Hiệu suất: Tận dụng cơ sở hạ tầng hiệu suất cao của Amazon SageMaker để chạy các tác vụ suy luận quy mô lớn một cách hiệu quả.

Khám phá thêm về các ưu điểm khi sử dụng SageMaker trong phần giới thiệu.

Tôi có thể tùy chỉnh logic suy luận cho YOLO26 trên Amazon SageMaker không?

Có, bạn có thể tùy chỉnh logic suy luận cho YOLO26 trên Amazon SageMaker:

  1. Sửa đổi inference.py: Định vị và tùy chỉnh hàm output_fn trong tệp inference.py để điều chỉnh các định dạng đầu ra.

    import json
    
    def output_fn(prediction_output):
        """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
        infer = {}
        for result in prediction_output:
            if result.boxes is not None:
                infer["boxes"] = result.boxes.numpy().data.tolist()
            # Add more processing logic if necessary
        return json.dumps(infer)
  2. Triển khai mô hình đã cập nhật: Đảm bảo bạn triển khai lại mô hình bằng cách sử dụng các Jupyter notebook được cung cấp (1_DeployEndpoint.ipynb) để bao gồm các thay đổi này.

Tham khảo các bước chi tiết để triển khai mô hình đã sửa đổi.

Làm thế nào tôi có thể kiểm tra mô hình YOLO26 đã triển khai trên Amazon SageMaker?

Để kiểm tra mô hình YOLO26 đã triển khai trên Amazon SageMaker:

  1. Mở Notebook Kiểm thử: Định vị notebook 2_TestEndpoint.ipynb trong môi trường SageMaker Jupyter.
  2. Chạy Notebook: Thực hiện theo hướng dẫn của notebook để gửi hình ảnh đến endpoint, thực hiện suy luận và hiển thị kết quả.
  3. Trực quan hóa kết quả: Sử dụng các tính năng vẽ biểu đồ tích hợp để trực quan hóa các chỉ số hiệu suất, chẳng hạn như các khung bao (bounding box) xung quanh các đối tượng được phát hiện.

Để có hướng dẫn kiểm thử toàn diện, hãy truy cập phần kiểm thử.

Bình luận