콘텐츠로 건너뛰기

Amazon SageMaker 엔드포인트에 YOLO11을 배포하는 방법 가이드

Amazon SageMaker 엔드포인트에서 Ultralytics의 YOLO11과 같은 고급 컴퓨터 비전 모델을 배포하면 다양한 머신 러닝 애플리케이션에 대한 광범위한 가능성이 열립니다. 이러한 모델을 효과적으로 사용하기 위한 핵심은 설정, 구성 및 배포 프로세스를 이해하는 데 있습니다. YOLO11은 AWS의 강력하고 확장 가능한 머신 러닝 서비스인 Amazon SageMaker와 원활하게 통합될 때 더욱 강력해집니다.

이 가이드에서는 Amazon SageMaker 엔드포인트에 YOLO11 PyTorch 모델을 단계별로 배포하는 과정을 안내합니다. AWS 환경을 준비하고, 모델을 적절하게 구성하고, AWS CloudFormation 및 AWS Cloud Development Kit(CDK)와 같은 도구를 사용하여 배포하는 데 필요한 사항을 배우게 됩니다.

Amazon SageMaker

Amazon SageMaker 개요

Amazon SageMaker는 Amazon Web Services (AWS)의 머신 러닝 서비스로, 머신 러닝 모델의 구축, 훈련 및 배포 과정을 간소화합니다. 다양한 머신 러닝 워크플로우를 처리하기 위한 광범위한 도구를 제공하며, 모델 튜닝 자동화 기능, 대규모 모델 훈련 옵션, 모델을 프로덕션 환경에 배포하는 간단한 방법 등을 포함합니다. SageMaker는 널리 사용되는 머신 러닝 프레임워크를 지원하여 다양한 프로젝트에 필요한 유연성을 제공합니다. 또한 데이터 레이블링, 워크플로우 관리 및 성능 분석 기능도 제공합니다.

Amazon SageMaker 엔드포인트에 YOLO11 배포

Amazon SageMaker에 YOLO11을 배포하면 실시간 추론을 위해 관리형 환경을 사용하고 자동 스케일링과 같은 기능을 활용할 수 있습니다. 아래 AWS 아키텍처를 살펴보십시오.

AWS 아키텍처

1단계: AWS 환경 설정

먼저 다음 필수 구성 요소가 있는지 확인하십시오.

  • AWS 계정: 아직 계정이 없는 경우 AWS 계정에 가입하십시오.

  • IAM 역할 구성: Amazon SageMaker, AWS CloudFormation 및 Amazon S3에 필요한 권한이 있는 IAM 역할이 필요합니다. 이 역할에는 이러한 서비스에 액세스할 수 있도록 허용하는 정책이 있어야 합니다.

  • AWS CLI: 아직 설치하지 않았다면 AWS Command Line Interface(CLI)를 다운로드하여 설치하고 계정 정보로 구성합니다. 설치 방법은 AWS CLI 안내를 따르십시오.

  • AWS CDK: 아직 설치하지 않았다면 배포 스크립팅에 사용될 AWS Cloud Development Kit(CDK)를 설치합니다. 설치 방법은 AWS CDK 안내를 따르십시오.

  • 적절한 서비스 할당량: Amazon SageMaker에서 두 개의 개별 리소스에 대한 충분한 할당량이 있는지 확인합니다. 하나는 ml.m5.4xlarge 엔드포인트 사용법과 ml.m5.4xlarge 노트북 인스턴스 사용을 위해 각 항목은 최소 1개의 할당량 값을 필요로 합니다. 현재 할당량이 이 요구 사항보다 낮으면 각 항목에 대한 증가를 요청하는 것이 중요합니다. 할당량 증가는 다음의 자세한 지침에 따라 요청할 수 있습니다. AWS 서비스 할당량 문서.

2단계: YOLO11 SageMaker 리포지토리 복제

다음 단계는 SageMaker에 YOLO11을 배포하는 데 필요한 리소스가 포함된 특정 AWS 리포지토리를 복제하는 것입니다. GitHub에서 호스팅되는 이 리포지토리에는 필요한 CDK 스크립트와 구성 파일이 포함되어 있습니다.

  • GitHub 저장소 복제: 터미널에서 다음 명령을 실행하여 host-yolov8-on-sagemaker-endpoint 저장소를 복제합니다.

    git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
    
  • 복제된 디렉토리로 이동: 디렉토리를 복제된 저장소로 변경합니다:

    cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
    

3단계: CDK 환경 설정

이제 필요한 코드가 있으므로 AWS CDK를 사용하여 배포할 환경을 설정합니다.

  • Python 가상 환경 생성: 이는 Python 환경과 종속성을 격리합니다. 다음을 실행합니다.

    python3 -m venv .venv
    
  • 가상 환경 활성화:

    source .venv/bin/activate
    
  • 종속성 설치: 프로젝트에 필요한 python 종속성을 설치합니다:

    pip3 install -r requirements.txt
    
  • AWS CDK 라이브러리 업그레이드: 최신 버전의 AWS CDK 라이브러리가 있는지 확인하십시오.

    pip install --upgrade aws-cdk-lib
    

4단계: AWS CloudFormation 스택 생성

  • CDK 애플리케이션 종합: CDK 코드에서 AWS CloudFormation 템플릿을 생성합니다.

    cdk synth
    
  • CDK 애플리케이션 부트스트랩: CDK 배포를 위해 AWS 환경을 준비합니다.

    cdk bootstrap
    
  • 스택 배포: 필요한 AWS 리소스를 생성하고 모델을 배포합니다.

    cdk deploy
    

5단계: YOLO 모델 배포

배포 지침을 살펴보기 전에 Ultralytics에서 제공하는 다양한 YOLO11 모델을 확인하십시오. 이는 프로젝트 요구 사항에 가장 적합한 모델을 선택하는 데 도움이 될 것입니다.

AWS CloudFormation 스택을 생성한 후 다음 단계는 YOLO11을 배포하는 것입니다.

  • 노트북 인스턴스 열기: AWS 콘솔로 이동하여 Amazon SageMaker 서비스를 탐색합니다. 대시보드에서 "노트북 인스턴스"를 선택한 다음 CDK 배포 스크립트에 의해 생성된 노트북 인스턴스를 찾습니다. 노트북 인스턴스를 열어 Jupyter 환경에 액세스합니다.

  • inference.py에 접근 및 수정: Jupyter에서 SageMaker 노트북 인스턴스를 연 후 inference.py 파일을 찾습니다. 아래와 같이 inference.py에서 output_fn 함수를 편집하고 스크립트에 구문 오류가 없는지 확인하면서 변경 사항을 저장합니다.

    import json
    
    
    def output_fn(prediction_output):
        """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
        print("Executing output_fn from inference.py ...")
        infer = {}
        for result in prediction_output:
            if result.boxes is not None:
                infer["boxes"] = result.boxes.numpy().data.tolist()
            if result.masks is not None:
                infer["masks"] = result.masks.numpy().data.tolist()
            if result.keypoints is not None:
                infer["keypoints"] = result.keypoints.numpy().data.tolist()
            if result.obb is not None:
                infer["obb"] = result.obb.numpy().data.tolist()
            if result.probs is not None:
                infer["probs"] = result.probs.numpy().data.tolist()
        return json.dumps(infer)
    
  • 1_DeployEndpoint.ipynb를 사용하여 엔드포인트 배포: Jupyter 환경에서 sm-notebook 디렉터리에 있는 1_DeployEndpoint.ipynb 노트북을 엽니다. 노트북의 지침을 따르고 셀을 실행하여 YOLO11 모델을 다운로드하고, 업데이트된 추론 코드로 패키징하고, Amazon S3 버킷에 업로드합니다. 이 노트북은 YOLO11 모델을 위한 SageMaker 엔드포인트를 생성하고 배포하는 과정을 안내합니다.

6단계: 배포 테스트

이제 YOLO11 모델이 배포되었으므로 성능과 기능을 테스트하는 것이 중요합니다.

  • 테스트 노트북 열기: 동일한 Jupyter 환경에서 sm-notebook 디렉터리에 있는 2_TestEndpoint.ipynb 노트북을 찾아 엽니다.

  • 테스트 노트북 실행: 노트북 내의 지침에 따라 배포된 SageMaker 엔드포인트를 테스트합니다. 여기에는 엔드포인트로 이미지를 보내고 추론을 실행하는 것이 포함됩니다. 그런 다음 아래와 같이 모델의 성능과 정확도를 시각화하기 위해 출력을 플롯합니다.

테스트 결과 YOLO11

  • 리소스 정리: 테스트 노트북은 엔드포인트와 호스팅된 모델을 정리하는 과정도 안내합니다. 이는 특히 배포된 모델을 즉시 사용할 계획이 없는 경우 비용과 리소스를 효율적으로 관리하는 데 중요한 단계입니다.

7단계: 모니터링 및 관리

테스트 후 배포된 모델의 지속적인 모니터링 및 관리가 필수적입니다.

  • Amazon CloudWatch를 사용하여 Amazon CloudWatch로 모니터링합니다. SageMaker 엔드포인트의 성능과 상태를 정기적으로 확인하세요.

  • 엔드포인트 관리: SageMaker 콘솔을 사용하여 엔드포인트를 지속적으로 관리합니다. 여기에는 필요에 따라 모델 확장, 업데이트 또는 재배포가 포함됩니다.

이러한 단계를 완료하면 Amazon SageMaker 엔드포인트에 YOLO11 모델을 성공적으로 배포하고 테스트한 것입니다. 이 프로세스는 머신 러닝 배포를 위해 AWS 서비스를 사용하는 데 대한 실질적인 경험을 제공할 뿐만 아니라 향후 다른 고급 모델을 배포하기 위한 토대를 마련합니다.

요약

이 가이드에서는 AWS CloudFormation 및 AWS Cloud Development Kit(CDK)를 사용하여 Amazon SageMaker 엔드포인트에 YOLO11을 배포하는 단계를 안내합니다. 이 프로세스에는 필요한 GitHub 리포지토리를 복제하고, CDK 환경을 설정하고, AWS 서비스를 사용하여 모델을 배포하고, SageMaker에서 성능을 테스트하는 과정이 포함됩니다.

자세한 기술 정보는 AWS Machine Learning 블로그의 이 문서를 참조하십시오. 다양한 기능 및 기능에 대한 자세한 내용은 공식 Amazon SageMaker 설명서를 확인할 수도 있습니다.

다양한 YOLO11 통합에 대해 더 자세히 알고 싶으십니까? Ultralytics 통합 가이드 페이지를 방문하여 머신 러닝 프로젝트를 향상시킬 수 있는 추가 도구 및 기능을 찾아보세요.

FAQ

Amazon SageMaker 엔드포인트에 Ultralytics YOLO11 모델을 어떻게 배포합니까?

Amazon SageMaker 엔드포인트에 Ultralytics YOLO11 모델을 배포하려면 다음 단계를 따르세요.

  1. AWS 환경 설정: AWS 계정, 필요한 권한이 있는 IAM 역할 및 AWS CLI가 구성되어 있는지 확인합니다. 아직 설치하지 않은 경우 AWS CDK를 설치합니다(AWS CDK 지침 참조).
  2. YOLO11 SageMaker 저장소를 복제합니다.:
    git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
    cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
    
  3. CDK 환경 설정: python 가상 환경을 생성하고 활성화한 다음 종속성을 설치하고 AWS CDK 라이브러리를 업그레이드합니다.
    python3 -m venv .venv
    source .venv/bin/activate
    pip3 install -r requirements.txt
    pip install --upgrade aws-cdk-lib
    
  4. AWS CDK를 사용하여 배포: CloudFormation 스택을 합성 및 배포하고 환경을 부트스트랩합니다.
    cdk synth
    cdk bootstrap
    cdk deploy
    

자세한 내용은 문서 섹션을 검토하십시오.

Amazon SageMaker에 YOLO11을 배포하기 위한 전제 조건은 무엇입니까?

Amazon SageMaker에 YOLO11을 배포하려면 다음 필수 구성 요소가 있는지 확인하세요.

  1. AWS 계정: 활성 AWS 계정(여기에서 가입).
  2. IAM 역할: SageMaker, CloudFormation 및 Amazon S3에 대한 권한으로 구성된 IAM 역할입니다.
  3. AWS CLI: 설치 및 구성된 AWS Command Line Interface(AWS CLI 설치 가이드).
  4. AWS CDK: 설치된 AWS Cloud Development Kit(CDK 설정 가이드).
  5. 서비스 할당량: 다음을 위한 충분한 할당량 ml.m5.4xlarge 엔드포인트 및 노트북 사용을 위한 인스턴스 (할당량 증가 요청)입니다.

자세한 설정 방법은 이 섹션을 참조하세요.

Amazon SageMaker에서 Ultralytics YOLO11을 사용해야 하는 이유는 무엇입니까?

Amazon SageMaker에서 Ultralytics YOLO11을 사용하면 여러 가지 장점이 있습니다:

  1. 확장성 및 관리: SageMaker는 실시간 추론 요구 사항에 도움이 되는 자동 크기 조정과 같은 기능이 있는 관리형 환경을 제공합니다.
  2. AWS 서비스와 통합: 데이터 저장을 위한 S3, 코드형 인프라를 위한 CloudFormation, 모니터링을 위한 CloudWatch와 같은 다른 AWS 서비스와 원활하게 통합됩니다.
  3. 쉬운 배포: AWS CDK 스크립트를 사용한 간소화된 설정 및 능률화된 배포 프로세스.
  4. 성능: Amazon SageMaker의 고성능 인프라를 활용하여 대규모 추론 작업을 효율적으로 실행합니다.

소개 섹션에서 SageMaker 사용의 장점에 대해 자세히 알아보십시오.

Amazon SageMaker에서 YOLO11에 대한 추론 로직을 사용자 정의할 수 있습니까?

예, Amazon SageMaker에서 YOLO11에 대한 추론 로직을 사용자 정의할 수 있습니다.

  1. 수정 inference.py: 다음을 찾아 사용자 정의합니다. output_fn 다음의 함수 inference.py 파일을 사용하여 출력 형식을 조정하십시오.

    import json
    
    
    def output_fn(prediction_output):
        """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
        infer = {}
        for result in prediction_output:
            if result.boxes is not None:
                infer["boxes"] = result.boxes.numpy().data.tolist()
            # Add more processing logic if necessary
        return json.dumps(infer)
    
  2. 업데이트된 모델 배포: 제공된 Jupyter Notebook을 사용하여 모델을 재배포해야 합니다(1_DeployEndpoint.ipynb)을 포함하여 이러한 변경 사항을 적용합니다.

수정된 모델 배포에 대한 자세한 단계를 참조하십시오.

Amazon SageMaker에서 배포된 YOLO11 모델을 어떻게 테스트할 수 있습니까?

Amazon SageMaker에서 배포된 YOLO11 모델을 테스트하려면:

  1. 테스트 노트북 열기: 다음을 찾습니다. 2_TestEndpoint.ipynb SageMaker Jupyter 환경의 노트북입니다.
  2. 노트북 실행: 노트북의 지침에 따라 엔드포인트로 이미지를 보내고, 추론을 수행하고, 결과를 표시합니다.
  3. 결과 시각화: 내장된 플로팅 기능을 사용하여 감지된 객체 주위의 경계 상자와 같은 성능 지표를 시각화합니다.

종합적인 테스트 지침은 테스트 섹션을 방문하십시오.



📅 1년 전에 생성됨 ✏️ 2개월 전에 업데이트됨

댓글