Link to this sectionAmazon SageMaker Endpoints에 YOLO26을 배포하기 위한 가이드#
Deploying advanced computer vision models like Ultralytics' YOLO26 on Amazon SageMaker Endpoints opens up a wide range of possibilities for various machine learning applications. The key to effectively using these models lies in understanding their setup, configuration, and deployment processes. YOLO26 becomes even more powerful when integrated seamlessly with Amazon SageMaker, a robust and scalable machine learning service by AWS.
본 가이드는 Amazon SageMaker Endpoints에 YOLO26 PyTorch 모델을 단계별로 배포하는 과정을 안내합니다. AWS 환경을 준비하고, 모델을 적절하게 구성하며, 배포를 위해 AWS CloudFormation 및 AWS Cloud Development Kit (CDK)와 같은 도구를 사용하는 방법을 배우게 됩니다.
Link to this sectionAmazon SageMaker#
Amazon SageMaker는 머신 러닝 모델의 구축, 학습 및 배포 과정을 간소화하는 Amazon Web Services(AWS)의 머신 러닝 서비스입니다. 이 서비스는 머신 러닝 워크플로의 다양한 측면을 처리하기 위한 광범위한 도구를 제공합니다. 여기에는 모델 튜닝을 위한 자동화된 기능, 대규모 모델 학습 옵션, 모델을 프로덕션 환경에 배포하기 위한 간편한 방법이 포함됩니다. SageMaker는 널리 사용되는 머신 러닝 프레임워크를 지원하여 다양한 프로젝트에 필요한 유연성을 제공합니다. 또한 데이터 라벨링, 워크플로 관리 및 성능 분석 기능도 포함하고 있습니다.
Link to this sectionAmazon SageMaker Endpoints에 YOLO26 배포하기#
Amazon SageMaker에 YOLO26을 배포하면 관리형 환경에서 실시간 추론을 수행하고 자동 확장과 같은 기능을 활용할 수 있습니다. 아래의 AWS 아키텍처를 확인하십시오.
Link to this section1단계: AWS 환경 설정#
먼저 다음 사전 요구 사항이 준비되었는지 확인하십시오:
-
AWS 계정: 계정이 없다면 AWS 계정을 생성하십시오.
-
구성된 IAM 역할: Amazon SageMaker, AWS CloudFormation 및 Amazon S3에 필요한 권한을 가진 IAM 역할이 필요합니다. 이 역할에는 해당 서비스에 액세스할 수 있는 정책이 포함되어야 합니다.
-
AWS CLI: 아직 설치되지 않은 경우 AWS Command Line Interface (CLI)를 다운로드하여 설치하고 계정 정보로 구성하십시오. 설치 방법은 AWS CLI 지침을 따르십시오.
-
AWS CDK: 아직 설치되지 않은 경우 배포 스크립트 작성에 사용될 AWS Cloud Development Kit (CDK)를 설치하십시오. 설치 방법은 AWS CDK 지침을 따르십시오.
-
적절한 서비스 할당량: Amazon SageMaker의 두 가지 개별 리소스에 대해 충분한 할당량이 있는지 확인하십시오. 엔드포인트 사용을 위한
ml.m5.4xlarge와 노트북 인스턴스 사용을 위한ml.m5.4xlarge가 각각 필요합니다. 각 리소스는 최소 1개의 할당량 값을 요구합니다. 현재 할당량이 이 요구 사항보다 낮다면 각 항목에 대해 증가를 요청하는 것이 중요합니다. AWS 서비스 할당량 설명서의 자세한 지침에 따라 할당량 증가를 요청할 수 있습니다.
Link to this section2단계: YOLO26 SageMaker 저장소 복제#
다음 단계는 SageMaker에 YOLO26을 배포하기 위한 리소스가 포함된 특정 AWS 저장소를 복제하는 것입니다. GitHub에서 호스팅되는 이 저장소에는 필요한 CDK 스크립트와 구성 파일이 포함되어 있습니다.
-
GitHub 저장소 복제: 터미널에서 다음 명령을 실행하여 host-yolov8-on-sagemaker-endpoint 저장소를 복제하십시오:
git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git -
복제된 디렉토리로 이동: 복제된 저장소로 디렉토리를 변경하십시오:
cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
Link to this section3단계: CDK 환경 설정#
이제 필요한 코드가 준비되었으므로, AWS CDK를 이용한 배포를 위해 환경을 설정합니다.
-
Python 가상 환경 생성: Python 환경과 종속성을 격리합니다. 다음을 실행하십시오:
python3 -m venv .venv -
가상 환경 활성화:
source .venv/bin/activate -
종속성 설치: 프로젝트에 필요한 Python 종속성을 설치하십시오:
pip3 install -r requirements.txt -
AWS CDK 라이브러리 업그레이드: 최신 버전의 AWS CDK 라이브러리를 사용 중인지 확인하십시오:
pip install --upgrade aws-cdk-lib
Link to this section4단계: AWS CloudFormation 스택 생성#
-
CDK 애플리케이션 합성: CDK 코드에서 AWS CloudFormation 템플릿을 생성하십시오:
cdk synth -
CDK 애플리케이션 부트스트랩: CDK 배포를 위해 AWS 환경을 준비하십시오:
cdk bootstrap -
스택 배포: 필요한 AWS 리소스를 생성하고 모델을 배포합니다:
cdk deploy
Link to this section5단계: YOLO 모델 배포#
배포 지침을 확인하기 전에 Ultralytics에서 제공하는 다양한 YOLO26 모델을 먼저 살펴보십시오. 이를 통해 프로젝트 요구 사항에 가장 적합한 모델을 선택할 수 있습니다.
AWS CloudFormation 스택을 생성한 후 다음 단계는 YOLO26을 배포하는 것입니다.
-
노트북 인스턴스 열기: AWS 콘솔로 이동하여 Amazon SageMaker 서비스로 이동합니다. 대시보드에서 "노트북 인스턴스"를 선택한 다음, CDK 배포 스크립트에 의해 생성된 노트북 인스턴스를 찾습니다. 노트북 인스턴스를 열어 Jupyter 환경에 액세스하십시오.
-
inference.py 액세스 및 수정: SageMaker 노트북 인스턴스를 Jupyter에서 연 후 inference.py 파일을 찾습니다. 아래와 같이 inference.py의 output_fn 함수를 편집하고 스크립트에 구문 오류가 없는지 확인한 후 변경 사항을 저장하십시오.
import json def output_fn(prediction_output): """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints.""" print("Executing output_fn from inference.py ...") infer = {} for result in prediction_output: if result.boxes is not None: infer["boxes"] = result.boxes.numpy().data.tolist() if result.masks is not None: infer["masks"] = result.masks.numpy().data.tolist() if result.keypoints is not None: infer["keypoints"] = result.keypoints.numpy().data.tolist() if result.obb is not None: infer["obb"] = result.obb.numpy().data.tolist() if result.probs is not None: infer["probs"] = result.probs.numpy().data.tolist() return json.dumps(infer) -
1_DeployEndpoint.ipynb를 사용하여 엔드포인트 배포: Jupyter 환경에서 sm-notebook 디렉토리에 있는 1_DeployEndpoint.ipynb 노트북을 엽니다. 노트북의 지침에 따라 셀을 실행하여 YOLO26 모델을 다운로드하고, 업데이트된 추론 코드로 패키징한 후 Amazon S3 버킷에 업로드하십시오. 노트북은 YOLO26 모델에 대한 SageMaker 엔드포인트를 생성하고 배포하는 과정을 안내합니다.
Link to this section6단계: 배포 테스트#
YOLO26 모델이 배포되었으므로 성능과 기능을 테스트하는 것이 중요합니다.
-
테스트 노트북 열기: 동일한 Jupyter 환경에서 마찬가지로 sm-notebook 디렉토리에 있는 2_TestEndpoint.ipynb 노트북을 찾아 엽니다.
-
테스트 노트북 실행: 노트북 내의 지침에 따라 배포된 SageMaker 엔드포인트를 테스트하십시오. 여기에는 엔드포인트로 이미지를 전송하고 추론을 실행하는 과정이 포함됩니다. 그런 다음 아래와 같이 출력 결과를 플로팅하여 모델의 성능과 정확도를 시각화합니다.
- 리소스 정리: 테스트 노트북은 엔드포인트와 호스팅된 모델을 정리하는 과정도 안내합니다. 이는 특히 배포된 모델을 즉시 사용할 계획이 없는 경우 비용과 리소스를 효과적으로 관리하기 위한 중요한 단계입니다.
Link to this section7단계: 모니터링 및 관리#
테스트 후에는 배포된 모델에 대한 지속적인 모니터링과 관리가 필수적입니다.
-
Amazon CloudWatch를 이용한 모니터링: Amazon CloudWatch를 사용하여 SageMaker 엔드포인트의 성능과 상태를 정기적으로 확인하십시오.
-
엔드포인트 관리: SageMaker 콘솔을 사용하여 엔드포인트를 지속적으로 관리하십시오. 여기에는 필요에 따라 모델의 확장, 업데이트 또는 재배포가 포함됩니다.
이 단계를 완료하면 Amazon SageMaker Endpoints에 YOLO26 모델을 성공적으로 배포하고 테스트하게 됩니다. 이 과정은 머신 러닝 배포를 위해 AWS 서비스를 사용하는 실무 경험을 쌓게 해줄 뿐만 아니라, 향후 다른 고급 모델을 배포하기 위한 기반이 됩니다.
Link to this section요약#
본 가이드에서는 AWS CloudFormation과 AWS Cloud Development Kit (CDK)를 사용하여 Amazon SageMaker Endpoints에 YOLO26을 배포하는 과정을 단계별로 살펴보았습니다. 이 과정에는 필요한 GitHub 저장소 복제, CDK 환경 설정, AWS 서비스를 이용한 모델 배포, 그리고 SageMaker에서의 성능 테스트가 포함됩니다.
더 자세한 기술적 내용은 AWS 머신 러닝 블로그의 이 문서를 참조하십시오. 다양한 기능에 대한 더 많은 통찰력은 공식 Amazon SageMaker 설명서에서도 확인할 수 있습니다.
다른 YOLO26 통합에 대해 더 알고 싶으십니까? Ultralytics 통합 가이드 페이지를 방문하여 머신 러닝 프로젝트를 향상시킬 수 있는 추가 도구와 기능을 확인하십시오.
Link to this sectionFAQ#
Link to this sectionAmazon SageMaker Endpoints에 Ultralytics YOLO26 모델을 어떻게 배포합니까?#
Amazon SageMaker Endpoints에 Ultralytics YOLO26 모델을 배포하려면 다음 단계를 따르십시오:
- AWS 환경 설정: AWS 계정, 필요한 권한을 가진 IAM 역할, 구성된 AWS CLI가 있는지 확인하십시오. 아직 완료되지 않았다면 AWS CDK를 설치하십시오(AWS CDK 지침 참조).
- YOLO26 SageMaker 저장소 복제:
git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk - CDK 환경 설정: Python 가상 환경을 생성 및 활성화하고, 종속성을 설치한 후 AWS CDK 라이브러리를 업그레이드하십시오.
python3 -m venv .venv source .venv/bin/activate pip3 install -r requirements.txt pip install --upgrade aws-cdk-lib - AWS CDK를 사용하여 배포: CloudFormation 스택을 합성 및 배포하고, 환경을 부트스트랩하십시오.
cdk synth cdk bootstrap cdk deploy
자세한 내용은 설명서 섹션을 검토하십시오.
Link to this sectionAmazon SageMaker에 YOLO26을 배포하기 위한 사전 요구 사항은 무엇입니까?#
Amazon SageMaker에 YOLO26을 배포하려면 다음 사전 요구 사항이 필요합니다:
- AWS 계정: 활성화된 AWS 계정(여기서 가입).
- IAM 역할: SageMaker, CloudFormation 및 Amazon S3에 대한 권한이 구성된 IAM 역할.
- AWS CLI: 설치 및 구성된 AWS Command Line Interface(AWS CLI 설치 가이드).
- AWS CDK: 설치된 AWS Cloud Development Kit(CDK 설정 가이드).
- 서비스 할당량: 엔드포인트 및 노트북 사용을 위한 충분한
ml.m5.4xlarge인스턴스 할당량(할당량 증가 요청).
자세한 설정은 이 섹션을 참조하십시오.
Link to this sectionAmazon SageMaker에서 Ultralytics YOLO26을 사용해야 하는 이유는 무엇입니까?#
Amazon SageMaker에서 Ultralytics YOLO26을 사용하면 다음과 같은 여러 이점이 있습니다:
- 확장성 및 관리: SageMaker는 실시간 추론 요구 사항을 지원하는 자동 확장과 같은 기능을 갖춘 관리형 환경을 제공합니다.
- AWS 서비스와의 통합: 데이터 저장을 위한 S3, 인프라 구성을 위한 CloudFormation, 모니터링을 위한 CloudWatch 등 다른 AWS 서비스와 원활하게 통합됩니다.
- 배포 용이성: AWS CDK 스크립트를 사용한 간편한 설정과 간소화된 배포 프로세스를 제공합니다.
- 성능: 대규모 추론 작업을 효율적으로 실행하기 위해 Amazon SageMaker의 고성능 인프라를 활용할 수 있습니다.
SageMaker 사용의 이점에 대한 자세한 내용은 소개 섹션을 살펴보십시오.
Link to this sectionAmazon SageMaker에서 YOLO26에 대한 추론 로직을 사용자 지정할 수 있습니까?#
예, Amazon SageMaker에서 YOLO26에 대한 추론 로직을 사용자 지정할 수 있습니다:
-
Modify
inference.py: Locate and customize theoutput_fnfunction in theinference.pyfile to tailor output formats.import json def output_fn(prediction_output): """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints.""" infer = {} for result in prediction_output: if result.boxes is not None: infer["boxes"] = result.boxes.numpy().data.tolist() # Add more processing logic if necessary return json.dumps(infer) -
업데이트된 모델 배포: 이러한 변경 사항을 포함하려면 제공된 Jupyter 노트북(
1_DeployEndpoint.ipynb)을 사용하여 모델을 다시 배포하십시오.
수정된 모델을 배포하는 상세 단계를 참조하십시오.
Link to this sectionAmazon SageMaker에 배포된 YOLO26 모델은 어떻게 테스트할 수 있습니까?#
Amazon SageMaker에 배포된 YOLO26 모델을 테스트하려면 다음을 수행하십시오:
- 테스트 노트북 열기: SageMaker Jupyter 환경에서
2_TestEndpoint.ipynb노트북을 찾으십시오. - 노트북 실행: 노트북의 지침에 따라 이미지를 엔드포인트로 전송하고 추론을 수행한 후 결과를 표시하십시오.
- 결과 시각화: 내장된 플로팅 기능을 사용하여 탐지된 객체 주위의 바운딩 박스 등 성능 지표를 시각화하십시오.
포괄적인 테스트 지침은 테스트 섹션을 참조하십시오.