Treinamento na Nuvem
Ultralytics Platform Cloud Training oferece treinamento com um clique em GPUs em nuvem, tornando o treinamento de modelos acessível sem configurações complexas. Treine modelos YOLO com transmissão de métricas em tempo real e salvamento automático de checkpoints.
Treinar a partir da UI
Inicie o treinamento em nuvem diretamente da Plataforma:
- Navegue até seu projeto
- Clique em Treinar Modelo
- Configure os parâmetros de treinamento
- Clique em Iniciar Treinamento
Passo 1: Selecionar Conjunto de Dados
Escolha um conjunto de dados dos seus uploads:
| Opção | Descrição |
|---|---|
| Seus Conjuntos de Dados | Conjuntos de dados que você carregou |
| Conjuntos de Dados Públicos | Conjuntos de dados públicos do Explore |
Passo 2: Configurar Modelo
Selecione o modelo base e os parâmetros:
| Parâmetro | Descrição | Padrão |
|---|---|---|
| Modelo | Arquitetura base (YOLO26n, s, m, l, x) | YOLO26n |
| Épocas | Número de iterações de treinamento | 100 |
| Tamanho da Imagem | Resolução de entrada | 640 |
| Tamanho do Lote (Batch Size) | Amostras por iteração | Automático |
Passo 3: Selecionar GPU
Escolha seus recursos de computação:
| Nível | GPU | VRAM | Preço/hora | Ideal Para |
|---|---|---|---|---|
| Orçamento | RTX A2000 | 6 GB | $0.12 | Pequenos conjuntos de dados, testes |
| Orçamento | RTX 3080 | 10 GB | $0.25 | Conjuntos de dados médios |
| Orçamento | RTX 3080 Ti | 12 GB | $0.30 | Conjuntos de dados médios |
| Orçamento | A30 | 24 GB | $0.44 | Lotes maiores |
| Meio | RTX 4090 | 24 GB | $0.60 | Excelente relação preço/desempenho |
| Meio | A6000 | 48 GB | $0.90 | Modelos grandes |
| Meio | L4 | 24 GB | $0.54 | Inferência otimizada |
| Meio | L40S | 48 GB | $1.72 | Treinamento em grandes lotes |
| Pro | A100 40GB | 40 GB | $2.78 | Formação em produção |
| Pro | A100 80GB | 80 GB | $3.44 | Modelos muito grandes |
| Pro | H100 | 80 GB | $5.38 | Treino mais rápido |
| Empresarial | H200 | 141 GB | $5.38 | Desempenho máximo |
| Empresarial | B200 | 192 GB | $10.38 | Modelos maiores |
| Ultralytics | RTX PRO 6000 | 48 GB | $3.68 | Ultralytics |
Seleção de GPU
- RTX 4090: Melhor relação preço/desempenho para a maioria dos trabalhos, a US$ 0,60/hora
- A100 80GB: Necessária para grandes tamanhos de lote ou modelos grandes
- H100/H200: Desempenho máximo para treinos com restrições de tempo
- B200: Arquitetura NVIDIA para cargas de trabalho de ponta
Passo 4: Iniciar Treino
Clique em Iniciar Treinamento para iniciar seu trabalho. A Plataforma:
- Provisiona uma instância de GPU
- Baixa seu conjunto de dados
- Inicia o treinamento
- Transmite métricas em tempo real
Créditos Gratuitos
Novas contas recebem US$ 5 em créditos de inscrição (US$ 25 para e-mails corporativos) — o suficiente para várias sessões de treino. Verifique o seu saldo em Configurações > Faturamento.
Monitorar Treinamento
Visualize o progresso do treinamento em tempo real:
Métricas em Tempo Real
| Métrica | Descrição |
|---|---|
| Perda | Perda de treinamento e validação |
| mAP | Precisão Média Média |
| Precisão | Previsões positivas corretas |
| Recall | Verdades fundamentais detectadas |
| Utilização da GPU | Porcentagem de utilização da GPU |
| Memória | Uso de memória da GPU |
Pontos de Controlo
Os checkpoints são salvos automaticamente:
- A cada época: Pesos mais recentes salvos
- Melhor modelo: Checkpoint com o maior mAP preservado
- Modelo final: Pesos ao término do treinamento
Parar e Retomar
Parar Treino
Clique em Parar Treinamento para pausar seu trabalho:
- O checkpoint atual é salvo
- A instância de GPU é liberada
- Os créditos param de ser cobrados
Retomar Treino
Continuar do seu último checkpoint:
- Navegue até o modelo
- Clique em Retomar Treinamento
- Confirme a continuação
Limitações de Retomada
Você só pode retomar o treinamento que foi explicitamente interrompido. Trabalhos de treinamento falhos podem precisar reiniciar do zero.
Treinamento Remoto
Treine em seu próprio hardware enquanto transmite métricas para a Plataforma.
Requisito de Versão do Pacote
A integração da plataforma requer ultralytics>=8.4.0. Versões anteriores NÃO funcionarão com a Plataforma.
pip install "ultralytics>=8.4.0"
Configurar Chave API
- Vá para Configurações > Chaves de API
- Crie uma nova chave com escopo de treinamento
- Defina a variável de ambiente:
export ULTRALYTICS_API_KEY="your_api_key"
Treinar com Streaming
Use o comando project e name parâmetros para transmitir métricas:
yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(
data="coco.yaml",
epochs=100,
project="username/my-project",
name="experiment-1",
)
Utilizar Conjuntos de Dados da Plataforma
Treine com conjuntos de dados armazenados na Plataforma:
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
O ul:// O formato URI baixa e configura automaticamente seu conjunto de dados.
Faturamento
Os custos de treinamento são baseados no uso da GPU:
Estimativa de custos
Antes do início da formação, a Plataforma estima o custo total com base em:
Estimated Cost = Base Time × Model Multiplier × Dataset Multiplier × GPU Speed Factor × GPU Rate
Fatores que afetam o custo:
| Fator | Impacto |
|---|---|
| Tamanho do conjunto de dados | Mais imagens = maior tempo de treino |
| Tamanho do Modelo | Modelos maiores (m, l, x) treinam mais lentamente do que (n, s) |
| Número de épocas | Multiplicador direto no tempo de formação |
| Tamanho da Imagem | Imagens maiores aumentam a computação |
| GPU | GPUs mais rápidas reduzem o tempo de treino |
Exemplos de custos
| Cenário | GPU | Tempo | Custo |
|---|---|---|---|
| 1000 imagens, YOLO26n, 100 épocas | RTX 4090 | ~1 hora | ~$0,60 |
| 5000 imagens, YOLO26m, 100 épocas | A100 80GB | ~4 horas | ~$13,76 |
| 10.000 imagens, YOLO26x, 200 épocas | H100 | ~8 horas | ~43,04 $ |
Sistema de retenção/liquidação
A Plataforma utiliza um modelo de faturação de proteção ao consumidor:
- Estimativa: Custo calculado antes do início da formação
- Retenção: Montante estimado + margem de segurança de 20% reservada do saldo
- Comboio: Montante reservado apresentado como «Reservado» no seu saldo
- Liquidação: Após a conclusão, cobrado apenas pelo GPU real GPU utilizado
- Reembolso: Qualquer excedente será automaticamente devolvido ao seu saldo
Proteção ao Consumidor
Você nunca é cobrado mais do que a estimativa mostrada antes do treinamento. Se o treinamento for concluído antes do previsto ou for cancelado, você paga apenas pelo tempo de computação real utilizado.
Métodos de Pagamento
| Método | Descrição |
|---|---|
| Saldo da Conta | Créditos pré-carregados |
| Pagamento por Tarefa | Cobrança na conclusão da tarefa |
Saldo Mínimo
É necessário um saldo mínimo de $5,00 para iniciar o treinamento baseado em épocas.
Ver Custos de Treino
Após o treinamento, visualize os custos detalhados na aba Faturamento:
- Detalhamento de custo por época
- Tempo total de GPU
- Baixar relatório de custos
Dicas de Treino
Escolher o Tamanho Certo do Modelo
| Modelo | Parâmetros | Ideal Para |
|---|---|---|
| YOLO26n | 2.4M | Dispositivos de borda em tempo real |
| YOLO26s | 9.5M | Equilíbrio entre velocidade e precisão |
| YOLO26m | 20.4M | Maior precisão |
| YOLO26l | 24.8M | Precisão para produção |
| YOLO26x | 55.7M | Precisão máxima |
Otimizar Tempo de Treino
- Comece pequeno: Teste com menos épocas primeiro
- Use a GPU apropriada: Combine a GPU com o modelo/tamanho do lote
- Valide o conjunto de dados: Garanta a qualidade antes do treinamento
- Monitore cedo: Pare se as métricas estabilizarem
Resolução de Problemas
| Problema | Solução |
|---|---|
| Treinamento travado em 0% | Verifique o formato do conjunto de dados, tente novamente |
| Memória insuficiente | Reduza o tamanho do lote ou use uma GPU maior |
| Precisão baixa | Aumente as épocas, verifique a qualidade dos dados |
| Treinamento lento | Considere uma GPU mais rápida |
FAQ
Quanto tempo leva o treinamento?
O tempo de treinamento depende de:
- Tamanho do dataset
- Tamanho do modelo
- Número de épocas
- GPU selecionada
Tempos típicos (1000 imagens, 100 épocas):
| Modelo | RTX 4090 | A100 |
|---|---|---|
| YOLO26n | 30 min | 20 min |
| YOLO26m | 60 min | 40 min |
| YOLO26x | 120 min | 80 min |
Posso treinar durante a noite?
Sim, o treinamento continua até a conclusão. Você receberá uma notificação quando o treinamento terminar. Certifique-se de que sua conta tenha saldo suficiente para o treinamento baseado em épocas.
O que acontece se eu ficar sem créditos?
O treinamento pausa no final da época atual. Seu checkpoint é salvo, e você pode retomar após adicionar créditos.
Posso usar argumentos de treino personalizados?
Sim, utilizadores avançados podem especificar argumentos adicionais na configuração de treino.
Referência de Parâmetros de Treinamento
Parâmetros Essenciais
| Parâmetro | Tipo | Padrão | Intervalo | Descrição |
|---|---|---|---|---|
epochs | int | 100 | 1+ | Número de épocas de treino |
batch | int | 16 | -1 = automático | Tamanho do batch (-1 para automático) |
imgsz | int | 640 | 32+ | Tamanho da imagem de entrada |
patience | int | 100 | 0+ | Paciência para early stopping |
workers | int | 8 | 0+ | Workers do dataloader |
cache | booleano | Falso | - | Cache de imagens (RAM/disco) |
Parâmetros da Taxa de Aprendizagem
| Parâmetro | Tipo | Padrão | Intervalo | Descrição |
|---|---|---|---|---|
lr0 | float | 0.01 | 0.0-1.0 | Taxa de aprendizado inicial |
lrf | float | 0.01 | 0.0-1.0 | Fator LR final |
momentum | float | 0.937 | 0.0-1.0 | Momento SGD |
weight_decay | float | 0.0005 | 0.0-1.0 | Regularização L2 |
warmup_epochs | float | 3.0 | 0+ | Épocas de aquecimento |
cos_lr | booleano | Falso | - | Scheduler de LR cosseno |
Parâmetros de Aumento de Dados
| Parâmetro | Tipo | Padrão | Intervalo | Descrição |
|---|---|---|---|---|
hsv_h | float | 0.015 | 0.0-1.0 | Aumento de matiz HSV |
hsv_s | float | 0.7 | 0.0-1.0 | Saturação HSV |
hsv_v | float | 0.4 | 0.0-1.0 | Valor HSV |
degrees | float | 0.0 | - | Graus de rotação |
translate | float | 0.1 | 0.0-1.0 | Fração de translação |
scale | float | 0.5 | 0.0-1.0 | Fator de escala |
fliplr | float | 0.5 | 0.0-1.0 | Probabilidade de inversão horizontal |
flipud | float | 0.0 | 0.0-1.0 | Probabilidade de inversão vertical |
mosaic | float | 1.0 | 0.0-1.0 | Aumento de mosaico |
mixup | float | 0.0 | 0.0-1.0 | Aumento Mixup |
copy_paste | float | 0.0 | 0.0-1.0 | Copiar-colar (segment) |
Seleção do Otimizador
| Valor | Descrição |
|---|---|
auto | Seleção automática (padrão) |
SGD | Descida do Gradiente Estocástico |
Adam | Otimizador Adam |
AdamW | Adam com decaimento de peso |
Parâmetros Específicos da Tarefa
Alguns parâmetros aplicam-se apenas a tarefas específicas:
- Segmentar:
overlap_mask,mask_ratio,copy_paste - Pose:
pose(peso da perda),kobj(objectness de keypoint) - Classificar:
dropout,erasing,auto_augment