Amazon SageMaker 엔드포인트에 YOLO26 배포 가이드

Q: How do I deploy the Ultralytics YOLO26 model on Amazon SageMaker Endpoints?

Ultralytics YOLO26 모델을 Amazon SageMaker 엔드포인트에 배포하려면 다음 단계를 따르세요. 자세한 내용은 문서 섹션을 검토하십시오.

Q: What are the prerequisites for deploying YOLO26 on Amazon SageMaker?

Amazon SageMaker에 YOLO26을 배포하려면 다음 필수 구성 요소를 확인하십시오. 자세한 설정은 이 섹션을 참조하십시오.

Q: Why should I use Ultralytics YOLO26 on Amazon SageMaker?

Amazon SageMaker에서 Ultralytics YOLO26을 사용하면 여러 가지 이점이 있습니다. SageMaker 사용의 이점에 대해 더 자세히 알아보려면 서론 섹션을 살펴보십시오.

Q: Can I customize the inference logic for YOLO26 on Amazon SageMaker?

네, Amazon SageMaker에서 YOLO26의 추론 로직을 사용자 지정할 수 있습니다. 수정된 모델 배포를 위한 자세한 단계를 참조하십시오.

Q: How can I test the deployed YOLO26 model on Amazon SageMaker?

Amazon SageMaker에 배포된 YOLO26 모델을 테스트하려면: 포괄적인 테스트 지침은 테스트 섹션을 방문하십시오.

Amazon SageMaker 엔드포인트에 Ultralytics의 YOLO26과 같은 고급 컴퓨터 비전 모델을 배포하면 다양한 머신러닝 애플리케이션에 대한 광범위한 가능성이 열립니다. 이러한 모델을 효과적으로 활용하는 핵심은 모델의 설정, 구성 및 배포 프로세스를 이해하는 것입니다. YOLO26은 AWS의 강력하고 확장 가능한 머신러닝 서비스인 Amazon SageMaker와 원활하게 통합될 때 더욱 강력해집니다.

이 가이드에서는 Amazon SageMaker 엔드포인트에 YOLO26 PyTorch 모델을 배포하는 과정을 단계별로 안내합니다. AWS 환경 준비, 모델 적절하게 구성, AWS CloudFormation 및 AWS Cloud Development Kit (CDK)와 같은 도구를 배포에 사용하는 필수 사항을 배우게 됩니다.

Amazon SageMaker

Amazon SageMaker 머신러닝 플랫폼 아키텍처

Amazon SageMaker는 Amazon Web Services (AWS)의 머신 러닝 서비스로, 머신 러닝 모델의 구축, 훈련 및 배포 과정을 간소화합니다. 다양한 머신 러닝 워크플로우를 처리하기 위한 광범위한 도구를 제공하며, 모델 튜닝 자동화 기능, 대규모 모델 훈련 옵션, 모델을 프로덕션 환경에 배포하는 간단한 방법 등을 포함합니다. SageMaker는 널리 사용되는 머신 러닝 프레임워크를 지원하여 다양한 프로젝트에 필요한 유연성을 제공합니다. 또한 데이터 레이블링, 워크플로우 관리 및 성능 분석 기능도 제공합니다.

Amazon SageMaker 엔드포인트에 YOLO26 배포

Amazon SageMaker에 YOLO26을 배포하면 관리형 환경을 사용하여 실시간 추론을 수행하고 오토스케일링과 같은 기능을 활용할 수 있습니다. 아래 AWS 아키텍처를 살펴보십시오.

AWS SageMaker YOLO 아키텍처

1단계: AWS 환경 설정

먼저 다음 필수 구성 요소가 있는지 확인하십시오.

AWS 계정: 아직 계정이 없는 경우 AWS 계정에 가입하십시오.
IAM 역할 구성: Amazon SageMaker, AWS CloudFormation 및 Amazon S3에 필요한 권한이 있는 IAM 역할이 필요합니다. 이 역할에는 이러한 서비스에 액세스할 수 있도록 허용하는 정책이 있어야 합니다.
AWS CLI: 아직 설치하지 않았다면 AWS Command Line Interface(CLI)를 다운로드하여 설치하고 계정 정보로 구성합니다. 설치 방법은 AWS CLI 안내를 따르십시오.
AWS CDK: 아직 설치하지 않았다면 배포 스크립팅에 사용될 AWS Cloud Development Kit(CDK)를 설치합니다. 설치 방법은 AWS CDK 안내를 따르십시오.
적절한 서비스 할당량: Amazon SageMaker에서 두 개의 개별 리소스에 대한 충분한 할당량이 있는지 확인합니다. 하나는 ml.m5.4xlarge 엔드포인트 사용법과 ml.m5.4xlarge 노트북 인스턴스 사용을 위해 각 항목은 최소 1개의 할당량 값을 필요로 합니다. 현재 할당량이 이 요구 사항보다 낮으면 각 항목에 대한 증가를 요청하는 것이 중요합니다. 할당량 증가는 다음의 자세한 지침에 따라 요청할 수 있습니다. AWS 서비스 할당량 문서.

2단계: YOLO26 SageMaker 리포지토리 복제

다음 단계는 SageMaker에 YOLO26을 배포하기 위한 리소스가 포함된 특정 AWS 리포지토리를 클론하는 것입니다. GitHub에 호스팅된 이 리포지토리에는 필요한 CDK 스크립트와 구성 파일이 포함되어 있습니다.

GitHub 저장소 복제: 터미널에서 다음 명령을 실행하여 host-yolov8-on-sagemaker-endpoint 저장소를 복제합니다.
```
git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
```
복제된 디렉토리로 이동: 디렉토리를 복제된 저장소로 변경합니다:
```
cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
```

3단계: CDK 환경 설정

이제 필요한 코드가 있으므로 AWS CDK를 사용하여 배포할 환경을 설정합니다.

Python 가상 환경 생성: 이는 Python 환경과 종속성을 격리합니다. 다음을 실행합니다.
```
python3 -m venv .venv
```
가상 환경 활성화:
```
source .venv/bin/activate
```
종속성 설치: 프로젝트에 필요한 python 종속성을 설치합니다:
```
pip3 install -r requirements.txt
```
AWS CDK 라이브러리 업그레이드: 최신 버전의 AWS CDK 라이브러리가 있는지 확인하십시오.
```
pip install --upgrade aws-cdk-lib
```

4단계: AWS CloudFormation 스택 생성

CDK 애플리케이션 종합: CDK 코드에서 AWS CloudFormation 템플릿을 생성합니다.
```
cdk synth
```
CDK 애플리케이션 부트스트랩: CDK 배포를 위해 AWS 환경을 준비합니다.
```
cdk bootstrap
```
스택 배포: 필요한 AWS 리소스를 생성하고 모델을 배포합니다.
```
cdk deploy
```

5단계: YOLO 모델 배포

배포 지침을 시작하기 전에 Ultralytics에서 제공하는 YOLO26 모델의 범위를 확인하십시오. 이는 프로젝트 요구 사항에 가장 적합한 모델을 선택하는 데 도움이 될 것입니다.

AWS CloudFormation 스택을 생성한 후 다음 단계는 YOLO26을 배포하는 것입니다.

노트북 인스턴스 열기: AWS 콘솔로 이동하여 Amazon SageMaker 서비스를 탐색합니다. 대시보드에서 "노트북 인스턴스"를 선택한 다음 CDK 배포 스크립트에 의해 생성된 노트북 인스턴스를 찾습니다. 노트북 인스턴스를 열어 Jupyter 환경에 액세스합니다.

inference.py에 접근 및 수정: Jupyter에서 SageMaker 노트북 인스턴스를 연 후 inference.py 파일을 찾습니다. 아래와 같이 inference.py에서 output_fn 함수를 편집하고 스크립트에 구문 오류가 없는지 확인하면서 변경 사항을 저장합니다.

import json


def output_fn(prediction_output):
    """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
    print("Executing output_fn from inference.py ...")
    infer = {}
    for result in prediction_output:
        if result.boxes is not None:
            infer["boxes"] = result.boxes.numpy().data.tolist()
        if result.masks is not None:
            infer["masks"] = result.masks.numpy().data.tolist()
        if result.keypoints is not None:
            infer["keypoints"] = result.keypoints.numpy().data.tolist()
        if result.obb is not None:
            infer["obb"] = result.obb.numpy().data.tolist()
        if result.probs is not None:
            infer["probs"] = result.probs.numpy().data.tolist()
    return json.dumps(infer)

1_DeployEndpoint.ipynb를 사용하여 엔드포인트 배포: Jupyter 환경에서 sm-notebook 디렉터리에 있는 1_DeployEndpoint.ipynb 노트북을 엽니다. 노트북의 지침을 따르고 셀을 실행하여 YOLO26 모델을 다운로드하고, 업데이트된 추론 코드와 함께 패키징한 다음, Amazon S3 버킷에 업로드하십시오. 이 노트북은 YOLO26 모델용 SageMaker 엔드포인트를 생성하고 배포하는 과정을 안내할 것입니다.

6단계: 배포 테스트

이제 YOLO26 모델이 배포되었으므로 성능과 기능을 테스트하는 것이 중요합니다.

테스트 노트북 열기: 동일한 Jupyter 환경에서 sm-notebook 디렉터리에 있는 2_TestEndpoint.ipynb 노트북을 찾아 엽니다.
테스트 노트북 실행: 노트북 내의 지침에 따라 배포된 SageMaker 엔드포인트를 테스트합니다. 여기에는 엔드포인트로 이미지를 보내고 추론을 실행하는 것이 포함됩니다. 그런 다음 아래와 같이 모델의 성능과 정확도를 시각화하기 위해 출력을 플롯합니다.

테스트 결과 YOLO26

리소스 정리: 테스트 노트북은 엔드포인트와 호스팅된 모델을 정리하는 과정도 안내합니다. 이는 특히 배포된 모델을 즉시 사용할 계획이 없는 경우 비용과 리소스를 효율적으로 관리하는 데 중요한 단계입니다.

7단계: 모니터링 및 관리

테스트 후 배포된 모델의 지속적인 모니터링 및 관리가 필수적입니다.

Amazon CloudWatch를 사용하여 Amazon CloudWatch로 모니터링합니다. SageMaker 엔드포인트의 성능과 상태를 정기적으로 확인하세요.
엔드포인트 관리: SageMaker 콘솔을 사용하여 엔드포인트를 지속적으로 관리합니다. 여기에는 필요에 따라 모델 확장, 업데이트 또는 재배포가 포함됩니다.

이 단계를 완료하면 Amazon SageMaker 엔드포인트에 YOLO26 모델을 성공적으로 배포하고 테스트하게 됩니다. 이 과정은 머신러닝 배포를 위한 AWS 서비스 사용에 대한 실질적인 경험을 제공할 뿐만 아니라, 향후 다른 고급 모델을 배포하기 위한 기반을 마련합니다.

요약

이 가이드는 AWS CloudFormation 및 AWS Cloud Development Kit (CDK)를 사용하여 Amazon SageMaker 엔드포인트에 YOLO26을 배포하는 과정을 단계별로 안내했습니다. 이 과정에는 필요한 GitHub 리포지토리 클론, CDK 환경 설정, AWS 서비스를 사용한 모델 배포, SageMaker에서의 성능 테스트가 포함됩니다.

자세한 기술 정보는 AWS Machine Learning 블로그의 이 문서를 참조하십시오. 다양한 기능 및 기능에 대한 자세한 내용은 공식 Amazon SageMaker 설명서를 확인할 수도 있습니다.

다양한 YOLO26 통합에 대해 더 자세히 알아보는 데 관심이 있으십니까? Ultralytics 통합 가이드 페이지를 방문하여 머신러닝 프로젝트를 향상시킬 수 있는 추가 도구와 기능을 살펴보십시오.

FAQ

Amazon SageMaker 엔드포인트에 Ultralytics YOLO26 모델을 어떻게 배포하나요?

Amazon SageMaker 엔드포인트에 Ultralytics YOLO26 모델을 배포하려면 다음 단계를 따르십시오.

AWS 환경 설정: AWS 계정, 필요한 권한이 있는 IAM 역할 및 AWS CLI가 구성되어 있는지 확인합니다. 아직 설치하지 않은 경우 AWS CDK를 설치합니다(AWS CDK 지침 참조).

YOLO26 SageMaker 리포지토리 클론:

git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git
cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk

CDK 환경 설정: python 가상 환경을 생성하고 활성화한 다음 종속성을 설치하고 AWS CDK 라이브러리를 업그레이드합니다.
```
python3 -m venv .venv
source .venv/bin/activate
pip3 install -r requirements.txt
pip install --upgrade aws-cdk-lib
```
AWS CDK를 사용하여 배포: CloudFormation 스택을 합성 및 배포하고 환경을 부트스트랩합니다.
```
cdk synth
cdk bootstrap
cdk deploy
```

자세한 내용은 문서 섹션을 검토하십시오.

Amazon SageMaker에 YOLO26을 배포하기 위한 필수 구성 요소는 무엇인가요?

Amazon SageMaker에 YOLO26을 배포하려면 다음 사전 요구 사항을 충족해야 합니다.

AWS 계정: 활성 AWS 계정(여기에서 가입).
IAM 역할: SageMaker, CloudFormation 및 Amazon S3에 대한 권한으로 구성된 IAM 역할입니다.
AWS CLI: 설치 및 구성된 AWS Command Line Interface(AWS CLI 설치 가이드).
AWS CDK: 설치된 AWS Cloud Development Kit(CDK 설정 가이드).
서비스 할당량: 다음을 위한 충분한 할당량 ml.m5.4xlarge 엔드포인트 및 노트북 사용을 위한 인스턴스 (할당량 증가 요청)입니다.

자세한 설정 방법은 이 섹션을 참조하세요.

Amazon SageMaker에서 Ultralytics YOLO26을 사용해야 하는 이유는 무엇인가요?

Amazon SageMaker에서 Ultralytics YOLO26을 사용하면 다음과 같은 여러 이점이 있습니다.

확장성 및 관리: SageMaker는 실시간 추론 요구 사항에 도움이 되는 자동 크기 조정과 같은 기능이 있는 관리형 환경을 제공합니다.
AWS 서비스와 통합: 데이터 저장을 위한 S3, 코드형 인프라를 위한 CloudFormation, 모니터링을 위한 CloudWatch와 같은 다른 AWS 서비스와 원활하게 통합됩니다.
쉬운 배포: AWS CDK 스크립트를 사용한 간소화된 설정 및 능률화된 배포 프로세스.
성능: Amazon SageMaker의 고성능 인프라를 활용하여 대규모 추론 작업을 효율적으로 실행합니다.

소개 섹션에서 SageMaker 사용의 장점에 대해 자세히 알아보십시오.

Amazon SageMaker에서 YOLO26의 추론 로직을 사용자 지정할 수 있나요?

예, Amazon SageMaker에서 YOLO26의 추론 로직을 사용자 지정할 수 있습니다.

수정 inference.py: 다음을 찾아 사용자 정의합니다. output_fn 다음의 함수 inference.py 파일을 사용하여 출력 형식을 조정하십시오.

import json


def output_fn(prediction_output):
    """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints."""
    infer = {}
    for result in prediction_output:
        if result.boxes is not None:
            infer["boxes"] = result.boxes.numpy().data.tolist()
        # Add more processing logic if necessary
    return json.dumps(infer)