Guia de Início Rápido do Modal para…

Q: Quanto custa executar o YOLO26 no Modal?

O Modal utiliza preços por segundo. Taxas aproximadas: CPU \$0.05/hora, T4 \$0.59/hora, A10G \$1.10/hora, A100 \$2.10/hora. Verifique os preços do Modal para as taxas atuais.

Este guia fornece uma introdução abrangente à execução do Ultralytics YOLO26 no Modal, cobrindo inferência de GPU sem servidor e treinamento de modelos.

Modal é uma plataforma de computação em nuvem sem servidor para cargas de trabalho de IA e aprendizado de máquina. Ele lida automaticamente com provisionamento, escalonamento e execução — você escreve código Python localmente e o Modal o executa na nuvem com acesso a GPU. Isso o torna ideal para executar modelos de aprendizado profundo como o YOLO26 sem precisar gerenciar infraestrutura.

Link to this sectionO que você aprenderá#

Configurando o Modal e autenticando
Executando inferência YOLO26 no Modal
Usando GPUs para inferência mais rápida
Treinando modelos YOLO26 no Modal

Link to this sectionPré-requisitos#

Uma conta Modal (inscreva-se gratuitamente em modal.com)
Python 3.9 ou superior instalado na sua máquina local

Link to this sectionInstalação#

Instale o pacote Python do Modal:

pip install modal

Em seguida, autentique a CLI com sua conta Modal:

modal token new

Autenticação

O comando modal token new abrirá uma janela do navegador para autenticar sua conta Modal. Após a autenticação, você pode executar comandos Modal a partir do terminal.

Link to this sectionExecutando Inferência YOLO26#

Crie um novo arquivo Python chamado modal_yolo.py para executar inferência com o seguinte código:

"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""

import modal

app = modal.App("ultralytics-yolo")

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image)
def predict(image_url: str):
    """Run YOLO26 inference on an image URL."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)

    for r in results:
        print(f"Detected {len(r.boxes)} objects:")
        for box in r.boxes:
            print(f"  - {model.names[int(box.cls)]}: {float(box.conf):.2f}")

@app.local_entrypoint()
def main():
    """Test inference with sample image."""
    predict.remote("https://ultralytics.com/images/bus.jpg")

Execute a inferência:

modal run modal_yolo.py

Saída esperada:

✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)

Detected 5 objects:
  - bus: 0.92
  - person: 0.91
  - person: 0.91
  - person: 0.87
  - person: 0.53
✓ App completed.

Você pode monitorar a execução da sua função no painel do Modal:

Modal Dashboard Function Calls

Link to this sectionUsando GPU para Inferência Mais Rápida#

Adicione uma GPU à sua função especificando o parâmetro gpu:

@app.function(image=image, gpu="T4")  # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
    """Run YOLO26 inference on GPU."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)
    print(results[0].boxes)

GPU	Memória	Melhor para
T4	16 GB	Inferência, treinamento de modelo pequeno
A10G	24 GB	Trabalhos de treinamento médios
A100	40 GB	Treinamento em larga escala
H100	80 GB	Desempenho máximo

Para treinamento, use uma GPU e Volumes do Modal para armazenamento persistente. Crie um novo arquivo Python chamado train_yolo.py:

import modal

app = modal.App("ultralytics-training")

volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
    """Train YOLO26 model on Modal."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")

@app.local_entrypoint()
def main():
    train.remote()

Execute o treinamento:

modal run train_yolo.py

Persistência de Volume

Os Volumes do Modal mantêm os dados entre as execuções da função. Pesos treinados são salvos em /data/runs/train/weights/.

Parabéns! Você configurou com sucesso o Ultralytics YOLO26 no Modal. Para mais aprendizado:

Explore a documentação do Ultralytics YOLO26 para recursos avançados
Saiba mais sobre treinamento de modelos personalizados com seus próprios conjuntos de dados
Experimente o Guia de Início Rápido do Docker para implementação conteinerizada
Visite a documentação do Modal para recursos avançados da plataforma

Link to this sectionFAQ#

Link to this sectionComo escolho a GPU certa para minha carga de trabalho YOLO26?#

Para inferência, uma NVIDIA T4 (16 GB) é normalmente suficiente e econômica. Para treinamento ou modelos maiores como o YOLO26x, considere GPUs A10G ou A100.

O Modal utiliza preços por segundo. Taxas aproximadas: CPU ~$0.05/hora, T4 ~$0.59/hora, A10G ~$1.10/hora, A100 ~$2.10/hora. Verifique os preços do Modal para as taxas atuais.

Link to this sectionPosso usar meu próprio modelo YOLO treinado de forma personalizada?#

Sim, você pode executar seu próprio modelo YOLO treinado de forma personalizada no Modal carregando o arquivo de pesos de um Volume do Modal:

model = YOLO("/data/my_custom_model.pt")

Para obter mais informações sobre o treinamento de modelos personalizados, consulte o guia de treinamento.

Contribuidores

RAraimbekovm² GLglenn-jocher¹

Criado há 3 mesesAtualizado há 2 semanas

Link to this sectionGuia de Início Rápido do Modal para Ultralytics#

Link to this sectionO que é o Modal?#