Guia de Início Rápido do Modal para Ultralytics
Este guia fornece uma introdução abrangente à execução do Ultralytics YOLO26 em Modal, abrangendo inferência em GPU serverless e treinamento de modelos.
O que é o Modal?
Modal é uma plataforma serverless cloud computing para cargas de trabalho de IA e machine learning. Ele gerencia o provisionamento, escalonamento e execução automaticamente — você escreve código Python localmente e o Modal o executa na nuvem com acesso à GPU. Isso o torna ideal para executar deep learning modelos como o YOLO26 sem precisar gerenciar infraestrutura.
O que vais aprender
- Configurando o Modal e autenticando
- Executando inferência do YOLO26 no Modal
- Usando GPUs para uma inferência mais rápida
- Treinando modelos YOLO26 no Modal
Antes de começar, certifique-se de que você tem acesso a um workspace do AzureML. Se você ainda não tem um, pode criar um novo
- Uma conta Modal (inscreva-se gratuitamente em modal.com)
- Python 3.9 ou posterior instalado na sua máquina local
Instalação
Instale o pacote Python do Modal e autentique-se:
pip install modalmodal token newO argumento modal token new o comando abrirá uma janela do navegador para autenticar sua conta Modal. Após a autenticação, você pode executar comandos do Modal a partir do terminal.
Executando inferência do YOLO26
Crie um novo arquivo Python chamado modal_yolo.py com o seguinte código:
"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""
import modal
app = modal.App("ultralytics-yolo")
image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")
@app.function(image=image)
def predict(image_url: str):
"""Run YOLO26 inference on an image URL."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
results = model(image_url)
for r in results:
print(f"Detected {len(r.boxes)} objects:")
for box in r.boxes:
print(f" - {model.names[int(box.cls)]}: {float(box.conf):.2f}")
@app.local_entrypoint()
def main():
"""Test inference with sample image."""
predict.remote("https://ultralytics.com/images/bus.jpg")Execute a inferência:
modal run modal_yolo.pySaída esperada:
✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)
Detected 5 objects:
- bus: 0.92
- person: 0.91
- person: 0.91
- person: 0.87
- person: 0.53
✓ App completed.Você pode monitorar a execução da sua função no painel do Modal:
Usando GPU para uma inferência mais rápida
Adicione uma GPU à sua função especificando o gpu :
@app.function(image=image, gpu="T4") # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
"""Run YOLO26 inference on GPU."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
results = model(image_url)
print(results[0].boxes)| GPU | Memória | Melhor para |
|---|---|---|
| T4 | 16 GB | Inferência, treinamento de modelos pequenos |
| A10G | 24 GB | Tarefas de treinamento médias |
| A100 | 40 GB | Treinamento em grande escala |
| H100 | 80 GB | Desempenho máximo |
Treinando o YOLO26 no Modal
Para treinamento, use uma GPU e Volumes do Modal para armazenamento persistente. Crie um novo arquivo Python chamado train_yolo.py:
import modal
app = modal.App("ultralytics-training")
volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)
image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")
@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
"""Train YOLO26 model on Modal."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")
@app.local_entrypoint()
def main():
train.remote()Execute o treinamento:
modal run train_yolo.pyOs Volumes do Modal mantêm os dados entre as execuções das funções. Os pesos treinados são salvos em /data/runs/detect/train/weights/.
Parabéns! Você configurou com sucesso o Ultralytics YOLO26 no Modal. Para continuar aprendendo:
- Explore o documentação do Ultralytics YOLO26 para recursos avançados
- Saiba mais sobre treinar modelos personalizados com seus próprios conjuntos de dados
- Visita a Documentação do Modal para recursos avançados da plataforma
FAQ
Como escolho a GPU certa para minha carga de trabalho do YOLO26?
Para inferência, uma NVIDIA T4 (16 GB) é geralmente suficiente e econômica. Para treinamento ou modelos maiores como o YOLO26x, considere GPUs A10G ou A100.
Quanto custa executar o YOLO26 no Modal?
O Modal utiliza cobrança por segundo. Taxas aproximadas: CPU ~$0.05/hr, T4 ~$0.59/hr, A10G ~$1.10/hr, A100 ~$2.10/hr. Verifique os preços do Modal para as taxas atuais.
Posso usar meu próprio modelo YOLO personalizado?
Sim! Carregue modelos personalizados a partir de um Volume do Modal:
model = YOLO("/data/my_custom_model.pt")Para mais informações sobre como treinar modelos personalizados, consulte o guia de treino.