Una Guida al Deployment di YOLO26 su Amazon SageMaker Endpoints
Il deployment di modelli avanzati di visione artificiale come YOLO26 di Ultralytics su Amazon SageMaker Endpoints apre un'ampia gamma di possibilità per diverse applicazioni di machine learning. La chiave per utilizzare efficacemente questi modelli risiede nella comprensione dei loro processi di configurazione e deployment. YOLO26 diventa ancora più potente se integrato senza soluzione di continuità con Amazon SageMaker, un servizio di machine learning robusto e scalabile di AWS.
Questa guida ti accompagnerà passo dopo passo nel processo di deployment dei modelli YOLO26 PyTorch su Amazon SageMaker Endpoints. Imparerai gli elementi essenziali per preparare il tuo ambiente AWS, configurare il modello in modo appropriato e utilizzare strumenti come AWS CloudFormation e AWS Cloud Development Kit (CDK) per il deployment.
Amazon SageMaker

Amazon SageMaker è un servizio di machine learning di Amazon Web Services (AWS) che semplifica il processo di creazione, addestramento e implementazione di modelli di machine learning. Fornisce un'ampia gamma di strumenti per la gestione di vari aspetti dei flussi di lavoro di machine learning. Ciò include funzionalità automatizzate per la messa a punto dei modelli, opzioni per l'addestramento di modelli su larga scala e metodi semplici per l'implementazione di modelli in produzione. SageMaker supporta framework di machine learning popolari, offrendo la flessibilità necessaria per diversi progetti. Le sue funzionalità coprono anche l'etichettatura dei dati, la gestione del flusso di lavoro e l'analisi delle prestazioni.
Deployment di YOLO26 su Amazon SageMaker Endpoints
Il deployment di YOLO26 su Amazon SageMaker ti consente di utilizzare il suo ambiente gestito per l'inferenza in tempo reale e di sfruttare funzionalità come l'autoscaling. Dai un'occhiata all'architettura AWS qui sotto.

Passaggio 1: Configura il tuo ambiente AWS
Innanzitutto, assicurati di avere i seguenti prerequisiti:
Un account AWS: se non ne hai già uno, registrati per un account AWS.
Ruoli IAM configurati: Avrai bisogno di un ruolo IAM con le autorizzazioni necessarie per Amazon SageMaker, AWS CloudFormation e Amazon S3. Questo ruolo dovrebbe avere policy che gli consentano di accedere a questi servizi.
AWS CLI: se non è già installata, scarica e installa l'interfaccia a riga di comando (CLI) di AWS e configurala con i dettagli del tuo account. Segui le istruzioni di AWS CLI per l'installazione.
AWS CDK: se non è già installato, installa AWS Cloud Development Kit (CDK), che verrà utilizzato per lo scripting della distribuzione. Segui le istruzioni di AWS CDK per l'installazione.
Quota di servizio adeguata: verifica di disporre di quote sufficienti per due risorse separate in Amazon SageMaker: una per
ml.m5.4xlargeper l'utilizzo dell'endpoint e un altro perml.m5.4xlargeper l'utilizzo dell'istanza notebook. Ognuno di questi richiede un valore di quota minimo. Se le tue quote attuali sono inferiori a questo requisito, è importante richiedere un aumento per ciascuna. Puoi richiedere un aumento della quota seguendo le istruzioni dettagliate nel Documentazione di AWS Service Quotas.
Passaggio 2: Clonare il repository YOLO26 SageMaker
Il passo successivo consiste nel clonare il repository AWS specifico che contiene le risorse per il deployment di YOLO26 su SageMaker. Questo repository, ospitato su GitHub, include gli script CDK e i file di configurazione necessari.
Clona il repository GitHub: esegui il seguente comando nel tuo terminale per clonare il repository host-yolov8-on-sagemaker-endpoint:
git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.gitSpostarsi nella directory clonata: cambiare la directory nel repository clonato:
cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk
Fase 3: Impostazione dell'ambiente CDK
Ora che hai il codice necessario, configura il tuo ambiente per l'implementazione con AWS CDK.
Crea un ambiente virtuale Python: questo isola il tuo ambiente Python e le dipendenze. Esegui:
python3 -m venv .venvAttiva l'ambiente virtuale:
source .venv/bin/activateInstalla le dipendenze: installa le dipendenze python richieste per il progetto:
pip3 install -r requirements.txtAggiorna la libreria AWS CDK: assicurati di avere l'ultima versione della libreria AWS CDK:
pip install --upgrade aws-cdk-lib
Fase 4: Creazione dello stack AWS CloudFormation
Sintetizza l'applicazione CDK: genera il modello AWS CloudFormation dal tuo codice CDK:
cdk synthBootstrap dell'applicazione CDK: prepara il tuo ambiente AWS per il deployment di CDK:
cdk bootstrapDistribuisci lo stack: questo creerà le risorse AWS necessarie e distribuirà il tuo modello:
cdk deploy
Fase 5: Distribuzione del modello YOLO
Prima di immergerti nelle istruzioni di deployment, assicurati di consultare la gamma di modelli YOLO26 offerti da Ultralytics. Questo ti aiuterà a scegliere il modello più appropriato per i requisiti del tuo progetto.
Dopo aver creato lo Stack AWS CloudFormation, il passo successivo è il deployment di YOLO26.
Apri l'istanza del notebook: vai alla console AWS e naviga al servizio Amazon SageMaker. Seleziona "Istanze notebook" dalla dashboard, quindi individua l'istanza notebook creata dallo script di deployment CDK. Apri l'istanza notebook per accedere all'ambiente Jupyter.
Accedere e modificare inference.py: dopo aver aperto l'istanza del notebook SageMaker in Jupyter, individuare il file inference.py. Modificare la funzione output_fn in inference.py come mostrato di seguito e salvare le modifiche allo script, assicurandosi che non ci siano errori di sintassi.
import json def output_fn(prediction_output): """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints.""" print("Executing output_fn from inference.py ...") infer = {} for result in prediction_output: if result.boxes is not None: infer["boxes"] = result.boxes.numpy().data.tolist() if result.masks is not None: infer["masks"] = result.masks.numpy().data.tolist() if result.keypoints is not None: infer["keypoints"] = result.keypoints.numpy().data.tolist() if result.obb is not None: infer["obb"] = result.obb.numpy().data.tolist() if result.probs is not None: infer["probs"] = result.probs.numpy().data.tolist() return json.dumps(infer)Effettuare il deployment dell'Endpoint utilizzando 1_DeployEndpoint.ipynb: Nell'ambiente Jupyter, apri il notebook 1_DeployEndpoint.ipynb situato nella directory sm-notebook. Segui le istruzioni nel notebook ed esegui le celle per scaricare il modello YOLO26, impacchettarlo con il codice di inferenza aggiornato e caricarlo in un bucket Amazon S3. Il notebook ti guiderà nella creazione e nel deployment di un endpoint SageMaker per il modello YOLO26.
Passo 6: Test del tuo deployment
Ora che il tuo modello YOLO26 è stato deployato, è importante testarne le prestazioni e la funzionalità.
Apri il notebook di test: nello stesso ambiente Jupyter, individua e apri il notebook 2_TestEndpoint.ipynb, anch'esso nella directory sm-notebook.
Esegui il Notebook di test: segui le istruzioni all'interno del notebook per testare l'endpoint SageMaker distribuito. Ciò include l'invio di un'immagine all'endpoint e l'esecuzione di inferenze. Quindi, traccerai l'output per visualizzare le prestazioni e l'accuratezza del modello, come mostrato di seguito.

- Pulizia delle risorse: il notebook di test ti guiderà anche attraverso il processo di pulizia dell'endpoint e del modello ospitato. Questo è un passo importante per gestire i costi e le risorse in modo efficace, soprattutto se non prevedi di utilizzare immediatamente il modello distribuito.
Passo 7: Monitoraggio e gestione
Dopo il test, il monitoraggio e la gestione continui del modello distribuito sono essenziali.
Monitora con Amazon CloudWatch: Controlla regolarmente le prestazioni e lo stato del tuo endpoint SageMaker utilizzando Amazon CloudWatch.
Gestisci l'endpoint: utilizza la console SageMaker per la gestione continua dell'endpoint. Ciò include il ridimensionamento, l'aggiornamento o la ridistribuzione del modello come richiesto.
Completando questi passaggi, avrai deployato e testato con successo un modello YOLO26 su Amazon SageMaker Endpoints. Questo processo non solo ti fornisce esperienza pratica nell'utilizzo dei servizi AWS per il deployment di machine learning, ma pone anche le basi per il deployment di altri modelli avanzati in futuro.
Riepilogo
Questa guida ti ha accompagnato passo dopo passo nel deployment di YOLO26 su Amazon SageMaker Endpoints utilizzando AWS CloudFormation e AWS Cloud Development Kit (CDK). Il processo include la clonazione del repository GitHub necessario, la configurazione dell'ambiente CDK, il deployment del modello utilizzando i servizi AWS e il test delle sue prestazioni su SageMaker.
Per maggiori dettagli tecnici, consultare questo articolo sul blog di AWS Machine Learning. Puoi anche consultare la Documentazione ufficiale di Amazon SageMaker per ulteriori approfondimenti su varie funzionalità.
Sei interessato a saperne di più sulle diverse integrazioni di YOLO26? Visita la pagina della guida alle integrazioni di Ultralytics per scoprire strumenti e funzionalità aggiuntivi che possono migliorare i tuoi progetti di machine learning.
FAQ
Come si effettua il deployment del modello Ultralytics YOLO26 su Amazon SageMaker Endpoints?
Per effettuare il deployment del modello Ultralytics YOLO26 su Amazon SageMaker Endpoints, segui questi passaggi:
- Configura il tuo ambiente AWS: Assicurati di avere un account AWS, ruoli IAM con le autorizzazioni necessarie e la CLI AWS configurata. Installa AWS CDK se non è già stato fatto (fai riferimento alle istruzioni di AWS CDK).
- Clonare il repository YOLO26 SageMaker:
git clone https://github.com/aws-samples/host-yolov8-on-sagemaker-endpoint.git cd host-yolov8-on-sagemaker-endpoint/yolov8-pytorch-cdk - Configura l'ambiente CDK: Crea un ambiente virtuale python, attivalo, installa le dipendenze e aggiorna la libreria AWS CDK.
python3 -m venv .venv source .venv/bin/activate pip3 install -r requirements.txt pip install --upgrade aws-cdk-lib - Distribuisci utilizzando AWS CDK: Sintetizza e distribuisci lo stack CloudFormation, avvia l'ambiente.
cdk synth cdk bootstrap cdk deploy
Per ulteriori dettagli, consultare la sezione della documentazione.
Quali sono i prerequisiti per il deployment di YOLO26 su Amazon SageMaker?
Per effettuare il deployment di YOLO26 su Amazon SageMaker, assicurati di avere i seguenti prerequisiti:
- Account AWS: Account AWS attivo (registrati qui).
- Ruoli IAM: ruoli IAM configurati con autorizzazioni per SageMaker, CloudFormation e Amazon S3.
- AWS CLI: Interfaccia a riga di comando AWS installata e configurata (guida all'installazione di AWS CLI).
- AWS CDK: AWS Cloud Development Kit installato (guida all'installazione di CDK).
- Quote di servizio: Quote sufficienti per
ml.m5.4xlargeistanze sia per l'endpoint che per l'utilizzo del notebook (richiedi un aumento della quota).
Per una configurazione dettagliata, consultare questa sezione.
Perché dovrei usare Ultralytics YOLO26 su Amazon SageMaker?
L'utilizzo di Ultralytics YOLO26 su Amazon SageMaker offre diversi vantaggi:
- Scalabilità e gestione: SageMaker fornisce un ambiente gestito con funzionalità come lo scaling automatico, che aiuta nelle esigenze di inferenza in tempo reale.
- Integrazione con i servizi AWS: Integra senza problemi con altri servizi AWS, come S3 per l'archiviazione dei dati, CloudFormation per l'infrastruttura come codice e CloudWatch per il monitoraggio.
- Facilità di implementazione: Configurazione semplificata tramite script AWS CDK e processi di implementazione ottimizzati.
- Performance: Sfrutta l'infrastruttura ad alte prestazioni di Amazon SageMaker per eseguire in modo efficiente attività di inferenza su larga scala.
Scopri di più sui vantaggi dell'utilizzo di SageMaker nella sezione introduttiva.
Posso personalizzare la logica di inferenza per YOLO26 su Amazon SageMaker?
Sì, è possibile personalizzare la logica di inferenza per YOLO26 su Amazon SageMaker:
Modifica
inference.py: Individua e personalizza iloutput_fnfunzione nelinference.pyfile per personalizzare i formati di output.import json def output_fn(prediction_output): """Formats model outputs as JSON string, extracting attributes like boxes, masks, keypoints.""" infer = {} for result in prediction_output: if result.boxes is not None: infer["boxes"] = result.boxes.numpy().data.tolist() # Add more processing logic if necessary return json.dumps(infer)Distribuisci il modello aggiornato: Assicurati di ridistribuire il modello utilizzando i notebook Jupyter forniti (
1_DeployEndpoint.ipynb) per includere queste modifiche.
Consulta i passaggi dettagliati per la distribuzione del modello modificato.
Come posso testare il modello YOLO26 deployato su Amazon SageMaker?
Per testare il modello YOLO26 distribuito su Amazon SageMaker:
- Apri il notebook di test: Individua il
2_TestEndpoint.ipynbnotebook nell'ambiente SageMaker Jupyter. - Esegui il notebook: Segui le istruzioni del notebook per inviare un'immagine all'endpoint, eseguire l'inferenza e visualizzare i risultati.
- Visualizza i risultati: Utilizza le funzionalità di tracciamento integrate per visualizzare le metriche di performance, come i riquadri di delimitazione attorno agli oggetti rilevati.
Per istruzioni di test complete, visitare la sezione relativa ai test.