Skip to main content

Guia de Início Rápido do Modal para Ultralytics

Este guia fornece uma introdução abrangente à execução do Ultralytics YOLO26 em Modal, abrangendo inferência em GPU serverless e treinamento de modelos.

O que é o Modal?

Modal é uma plataforma serverless cloud computing para cargas de trabalho de IA e machine learning. Ele gerencia o provisionamento, escalonamento e execução automaticamente — você escreve código Python localmente e o Modal o executa na nuvem com acesso à GPU. Isso o torna ideal para executar deep learning modelos como o YOLO26 sem precisar gerenciar infraestrutura.

O que vais aprender

  • Configurando o Modal e autenticando
  • Executando inferência do YOLO26 no Modal
  • Usando GPUs para uma inferência mais rápida
  • Treinando modelos YOLO26 no Modal

Antes de começar, certifique-se de que você tem acesso a um workspace do AzureML. Se você ainda não tem um, pode criar um novo

  • Uma conta Modal (inscreva-se gratuitamente em modal.com)
  • Python 3.9 ou posterior instalado na sua máquina local

Instalação

Instale o pacote Python do Modal e autentique-se:

pip install modal
modal token new
Autenticação

O argumento modal token new o comando abrirá uma janela do navegador para autenticar sua conta Modal. Após a autenticação, você pode executar comandos do Modal a partir do terminal.

Executando inferência do YOLO26

Crie um novo arquivo Python chamado modal_yolo.py com o seguinte código:

"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""

import modal

app = modal.App("ultralytics-yolo")

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image)
def predict(image_url: str):
    """Run YOLO26 inference on an image URL."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)

    for r in results:
        print(f"Detected {len(r.boxes)} objects:")
        for box in r.boxes:
            print(f"  - {model.names[int(box.cls)]}: {float(box.conf):.2f}")

@app.local_entrypoint()
def main():
    """Test inference with sample image."""
    predict.remote("https://ultralytics.com/images/bus.jpg")

Execute a inferência:

modal run modal_yolo.py

Saída esperada:

✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)

Detected 5 objects:
  - bus: 0.92
  - person: 0.91
  - person: 0.91
  - person: 0.87
  - person: 0.53
✓ App completed.

Você pode monitorar a execução da sua função no painel do Modal:

Modal Dashboard Function Calls

Usando GPU para uma inferência mais rápida

Adicione uma GPU à sua função especificando o gpu :

@app.function(image=image, gpu="T4")  # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
    """Run YOLO26 inference on GPU."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)
    print(results[0].boxes)
GPUMemóriaMelhor para
T416 GBInferência, treinamento de modelos pequenos
A10G24 GBTarefas de treinamento médias
A10040 GBTreinamento em grande escala
H10080 GBDesempenho máximo

Treinando o YOLO26 no Modal

Para treinamento, use uma GPU e Volumes do Modal para armazenamento persistente. Crie um novo arquivo Python chamado train_yolo.py:

import modal

app = modal.App("ultralytics-training")

volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
    """Train YOLO26 model on Modal."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")

@app.local_entrypoint()
def main():
    train.remote()

Execute o treinamento:

modal run train_yolo.py
Persistência de Volume

Os Volumes do Modal mantêm os dados entre as execuções das funções. Os pesos treinados são salvos em /data/runs/detect/train/weights/.

Parabéns! Você configurou com sucesso o Ultralytics YOLO26 no Modal. Para continuar aprendendo:

FAQ

Como escolho a GPU certa para minha carga de trabalho do YOLO26?

Para inferência, uma NVIDIA T4 (16 GB) é geralmente suficiente e econômica. Para treinamento ou modelos maiores como o YOLO26x, considere GPUs A10G ou A100.

Quanto custa executar o YOLO26 no Modal?

O Modal utiliza cobrança por segundo. Taxas aproximadas: CPU ~$0.05/hr, T4 ~$0.59/hr, A10G ~$1.10/hr, A100 ~$2.10/hr. Verifique os preços do Modal para as taxas atuais.

Posso usar meu próprio modelo YOLO personalizado?

Sim! Carregue modelos personalizados a partir de um Volume do Modal:

model = YOLO("/data/my_custom_model.pt")

Para mais informações sobre como treinar modelos personalizados, consulte o guia de treino.

Comentários