Treinamento em Nuvem

O Treinamento em Nuvem da Ultralytics Platform oferece treinamento com um clique em GPUs na nuvem, tornando o treinamento de modelos acessível sem configurações complexas. Treine modelos YOLO com streaming de métricas em tempo real e salvamento automático de checkpoints.

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

Diálogo de Treinamento

Inicie o treinamento a partir da interface da plataforma clicando em New Model (Novo Modelo) em qualquer página de projeto (ou em Train (Treinar) a partir de uma página de conjunto de dados). O diálogo de treinamento possui duas abas: Cloud Training (Treinamento em Nuvem) e Local Training (Treinamento Local).

Ultralytics Platform Training Dialog Cloud Tab

Passo 1: Selecionar Modelo Base

Escolha entre os modelos YOLO26 oficiais ou seus próprios modelos treinados:

CategoriaDescrição
OficialTodos os 25 modelos YOLO26 (5 tamanhos x 5 tarefas)
Seus ModelosSeus modelos concluídos para ajuste fino (fine-tuning)

Os modelos oficiais são organizados por tipo de tarefa (Detect, Segment, Pose, OBB, Classify) com tamanhos variando de nano a xlarge.

Passo 2: Selecionar Conjunto de Dados

Escolha um conjunto de dados para treinar (veja Datasets):

OpçãoDescrição
OficialConjuntos de dados curados pela Ultralytics
Seus Conjuntos de DadosConjuntos de dados que você enviou
Requisitos do Conjunto de Dados

Os conjuntos de dados devem estar com status ready (pronto), com pelo menos 1 imagem no conjunto de treino, 1 imagem no conjunto de validação ou teste, e pelo menos 1 imagem rotulada.

Incompatibilidade de Tarefa

Um aviso de incompatibilidade de tarefa aparece se a tarefa do modelo (ex: detect) não coincidir com a tarefa do conjunto de dados (ex: segment). O treinamento falhará se você prosseguir com tarefas incompatíveis. Certifique-se de que tanto o modelo quanto o conjunto de dados usem o mesmo tipo de tarefa, conforme descrito nos guias de tarefas.

Passo 3: Configurar Parâmetros

Defina os principais parâmetros de treinamento:

ParâmetroDescriçãoPadrão
Épocas (Epochs)Número de iterações de treinamento100
Tamanho do Lote (Batch Size)Amostras por iteração-1 (auto)
Tamanho da ImagemResolução de entrada (menu suspenso 320/416/512/640/1280, qualquer múltiplo de 32 de 32 a 4096 no editor YAML)640
Nome da Execução (Run Name)Nome opcional para a execução do treinamentoauto

Passo 4: Configurações Avançadas (Opcional)

Expanda Advanced Settings (Configurações Avançadas) para acessar o editor completo de parâmetros baseado em YAML com mais de 40 parâmetros de treinamento organizados por grupo (veja referência de configuração):

GrupoParâmetros
Taxa de Aprendizadolr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
Otimizadorauto (padrão), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
Pesos de Perda (Loss Weights)box, cls, dfl, pose, kobj, label_smoothing
Aumentação de Corhsv_h, hsv_s, hsv_v
Aument. Geométricadegrees, translate, scale, shear, perspective
Aument. de Flip e Mixflipud, fliplr, mosaic, mixup, copy_paste
Controle de Treinamentopatience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
Conjunto de Dadosfraction, freeze, single_cls, rect, multi_scale, resume

Os parâmetros são conscientes da tarefa (ex: copy_paste só aparece para tarefas de segmentação, pose/kobj apenas para tarefas de pose). Um emblema Modified (Modificado) aparece quando os valores diferem dos padrões, e você pode redefinir tudo para o padrão com o botão de redefinição.

Exemplo: Ajustando Aumentação para Pequenos Conjuntos de Dados

Para pequenos conjuntos de dados (<1000 imagens), aumente a aumentação para reduzir o overfitting:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

Passo 5: Selecionar GPU (Aba Nuvem)

Escolha sua GPU na Ultralytics Cloud:

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPUGeraçãoVRAMCusto/HoraIdeal para
RTX 2000 AdaAda16 GB$0.24Datasets pequenos, testes
RTX A4500Ampere20 GB$0.25Datasets pequenos a médios
RTX 4000 AdaAda20 GB$0.26Datasets médios
RTX A5000Ampere24 GB$0.27Datasets médios
L4Ada24 GB$0.39Otimizado para inferência
A40Ampere48 GB$0.44Tamanhos de lote maiores
RTX 3090Ampere24 GB$0.46Treinamento geral
RTX A6000Ampere48 GB$0.49Modelos grandes
RTX PRO 4500Blackwell32 GB$0.64Ótima relação preço/desempenho
RTX 4090Ada24 GB$0.69Melhor relação preço/desempenho
RTX 6000 AdaAda48 GB$0.77Treinamento de lote grande
L40SAda48 GB$0.86Treinamento de lote grande
RTX 5090Blackwell32 GB$0.99Geração de consumo mais recente
L40Ada48 GB$0.99Modelos grandes
A100 PCIeAmpere80 GB$1.39Treinamento de produção
A100 SXMAmpere80 GB$1.49Treinamento de produção
RTX PRO 6000Blackwell96 GB$1.89Padrão recomendado
H100 PCIeHopper80 GB$2.39Treinamento de alto desempenho
H100 SXMHopper80 GB$2.99Treinamento mais rápido
H100 NVLHopper94 GB$3.07Desempenho máximo
H200 NVLHopper143 GB$3.39Memória máxima
H200 SXMHopper141 GB$3.99Desempenho máximo
B200Blackwell180 GB$5.49Modelos grandes (Pro+)
B300Blackwell288 GB$7.39Modelos maiores (Pro+)
Seleção de GPU
  • RTX PRO 6000: 96 GB Blackwell, padrão recomendado para a maioria dos trabalhos
  • A100 SXM: 80 GB HBM2e — excelente escolha para grandes tamanhos de lote ou modelos maiores
  • H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper para treinamento sensível ao tempo (disponível em todos os planos)
  • H200 NVL / H200 SXM: 141–143 GB Hopper para cargas de trabalho de alta memória (disponível em todos os planos)
  • B200 / B300: 180–288 GB NVIDIA Blackwell para cargas de trabalho de ponta — requer Pro ou Enterprise

O diálogo mostra seu saldo atual e um botão Top Up (Recarregar). O custo e a duração estimados são calculados com base na sua configuração (tamanho do modelo, imagens do conjunto de dados, épocas, velocidade da GPU).

Passo 6: Iniciar Treinamento

Clique em Start Training (Iniciar Treinamento) para lançar seu trabalho. A Plataforma:

  1. Provisiona uma instância de GPU
  2. Baixa seu conjunto de dados
  3. Começa o treinamento
  4. Faz streaming de métricas em tempo real

Ciclo de Vida do Trabalho de Treinamento

Os trabalhos de treinamento progridem através dos seguintes status:

StatusDescrição
Pending (Pendente)Trabalho enviado, aguardando alocação de GPU
Starting (Iniciando)GPU provisionada, baixando conjunto de dados e modelo
Running (Em execução)Treinamento em progresso, métricas transmitidas em tempo real
Completed (Concluído)Treinamento finalizado com sucesso
Failed (Falhou)O treinamento falhou (veja os logs do console para detalhes)
Cancelled (Cancelado)O treinamento foi cancelado pelo usuário
Créditos Gratuitos

Novas contas recebem créditos de inscrição — US$ 5 para e-mails pessoais e US$ 25 para e-mails corporativos. Verifique seu saldo em Configurações > Cobrança.

Ultralytics Platform Training Progress With Charts

Monitorizar o Treino

Veja o progresso do treinamento em tempo real na aba Train (Treinar) da página do modelo:

Subaba de Gráficos

Ultralytics Platform Model Training Live Charts

MétricaDescrição
Loss (Perda)Perda de treinamento e validação
mAPPrecisão Média (Mean Average Precision)
Precision (Precisão)Previsões positivas corretas
RecallVerdades fundamentais detectadas

Subguia do Console

Saída do console ao vivo com suporte a cores ANSI, barras de progresso e detecção de erros.

Subguia do Sistema

Utilização de GPU em tempo real, memória, temperatura, CPU e uso de disco.

Checkpoints

Após a conclusão do treinamento, o melhor modelo (best.pt, o checkpoint com o maior mAP) é enviado para a plataforma e disponibilizado para download, exportação e implantação.

Cancelar Treino

Clique em Cancelar Treinamento na página do modelo para interromper um trabalho em execução:

  • A instância de computação é encerrada
  • A cobrança de créditos é interrompida
  • O melhor checkpoint permanece disponível se tiver sido alcançado antes do cancelamento

Treinamento Remoto

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Treine em seu próprio hardware enquanto transmite métricas para a plataforma.

Requisito de versão do pacote

A integração com a plataforma requer ultralytics>=8.4.35. Versões inferiores NÃO funcionarão com a Plataforma.

pip install -U ultralytics

Configurar Chave de API

  1. Go to Settings > API Keys
  2. Crie uma nova chave (ou a plataforma cria uma automaticamente quando você abre a guia de Treinamento Local)
  3. Defina a variável de ambiente:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

Treinar com Streaming

Use os parâmetros project e name para transmitir métricas:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

A guia Treinamento Local na caixa de diálogo de treinamento mostra um comando pré-configurado com sua chave de API, parâmetros selecionados e argumentos avançados incluídos.

Usando Datasets da Plataforma

Treine com datasets armazenados na plataforma usando o formato de URI ul://:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

O formato de URI ul:// baixa e configura automaticamente seu dataset. O modelo é vinculado automaticamente ao dataset na plataforma (veja Usando Datasets da Plataforma).

Faturamento

Os custos de treinamento baseiam-se no uso da GPU:

Estimativa de Custo

Antes de iniciar o treinamento, a plataforma estima o custo total por meio de:

  1. Estimativa de segundos por época a partir do tamanho do dataset, complexidade do modelo, tamanho da imagem, tamanho do lote e velocidade da GPU
  2. Cálculo do tempo total de treinamento multiplicando os segundos por época pelo número de épocas, adicionando então a sobrecarga de inicialização
  3. Cálculo do custo estimado a partir do total de horas de treinamento multiplicadas pela taxa horária da GPU

Fatores que afetam o custo:

FatorImpacto
Tamanho do DatasetMais imagens = tempo de treinamento mais longo (base: ~2,8s de computação por 1000 imagens na RTX 4090)
Tamanho do ModeloModelos maiores (m, l, x) treinam mais lentamente que (n, s)
Número de ÉpocasMultiplicador direto no tempo de treinamento
Tamanho da ImagemImgsz maior aumenta a computação: 320px=0,25x, 640px=1,0x (base), 1280px=4,0x
Tamanho do Lote (Batch Size)Lotes maiores são mais eficientes (lote 32 = ~0,85x tempo, lote 8 = ~1,2x tempo vs base de lote 16)
Velocidade da GPUGPUs mais rápidas reduzem o tempo de treinamento (por exemplo, H100 SXM = ~3,4x mais rápida que a RTX 4090)
Sobrecarga de InicializaçãoAté 5 minutos para inicialização da instância, download de dados e aquecimento (escala com o tamanho do dataset)

Exemplos de Custo

Estimativas

As estimativas de custo são aproximadas e dependem de muitos fatores. A caixa de diálogo de treinamento mostra uma estimativa em tempo real antes de você iniciar o treinamento.

CenárioGPUCusto Estimado
500 imagens, YOLO26n, 50 épocasRTX 4090~$0,50
1000 imagens, YOLO26n, 100 épocasRTX PRO 6000~$5
5000 imagens, YOLO26s, 100 épocasH100 SXM~$23

Fluxo de Faturamento

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

Fluxo de faturamento do treinamento na nuvem:

  1. Estimativa: Custo calculado antes do início do treinamento
  2. Verificação de Saldo: Os créditos disponíveis são verificados antes do lançamento
  3. Treinar: O trabalho é executado na computação selecionada
  4. Cobrança: O custo final baseia-se no tempo real de execução
Proteção ao Consumidor

O faturamento rastreia o uso real da computação, incluindo execuções parciais que são canceladas. Você nunca é cobrado por execuções de treinamento que falharam.

Faturamento por Status do Trabalho

StatusCobrado?
Completed (Concluído)Sim — tempo de GPU real usado
Cancelled (Cancelado)Sim — tempo de GPU desde o início até o cancelamento
Failed (Falhou)Não — execuções falhas não são cobradas
TravadoParcial — apenas o tempo real de treinamento cobrado
Sem Cobrança por Erros

Se uma execução de treinamento falhar devido a um erro de configuração, problema de falta de memória ou qualquer outra falha, você não será cobrado. Apenas o tempo de computação bem-sucedido é faturado. Trabalhos travados (sem atividade por 4+ horas) são encerrados automaticamente e cobrados apenas pelo tempo em que a GPU esteve treinando ativamente, não pelo tempo ocioso.

Métodos de Pagamento

MétodoDescrição
Saldo da ContaCréditos pré-carregados
Pagar Por TrabalhoCobrança na conclusão do trabalho
Saldo Mínimo

O início do treinamento requer um saldo disponível positivo e créditos suficientes para o custo estimado do trabalho.

Ver Custos de Treinamento

Após o treinamento, veja os custos detalhados na guia Faturamento:

  • Detalhamento de custo por época
  • Tempo total de GPU
  • Baixar relatório de custos

Detalhes de Faturamento de Treinamento da Plataforma Ultralytics

Dicas de Treinamento

Escolha o Tamanho de Modelo Correto

ModeloParâmetrosIdeal para
YOLO26n2,4MTempo real, dispositivos de borda
YOLO26s9,5MVelocidade/precisão equilibrada
YOLO26m20,4MMaior precisão
YOLO26l24,8MPrecisão de produção
YOLO26x55,7MPrecisão máxima

Otimizar Tempo de Treinamento

Estratégias de Economia de Custo
  1. Comece pequeno: Teste com 10-20 épocas em uma GPU econômica para verificar se seu dataset e configuração funcionam
  2. Usa a GPU apropriada: A RTX PRO 6000 lida bem com a maioria das cargas de trabalho
  3. Valida o dataset: Corrige problemas de rotulagem antes de gastar com o treinamento
  4. Monitoriza precocemente: Cancela o treinamento se a perda estagnar — só pagas pelo tempo de computação utilizado

Resolução de problemas

ProblemaSolução
Treinamento parado em 0%Verifica o formato do dataset, tenta novamente
Memória esgotada (Out of memory)Reduz o tamanho do lote (batch size) ou usa uma GPU maior
Precisão baixaAumenta as épocas, verifica a qualidade dos dados
Treinamento lentoConsidera uma GPU mais rápida
Erro de incompatibilidade de tarefaGarante que as tarefas do modelo e do dataset correspondem

Perguntas Frequentes

Quanto tempo leva o treinamento?

O tempo de treinamento depende de:

  • Tamanho do dataset
  • Tamanho do modelo
  • Número de épocas
  • GPU selecionada

Tempos típicos (1000 imagens, 100 épocas):

ModeloRTX PRO 6000A100 SXM
YOLO26n~20 min~15 min
YOLO26m~40 min~30 min
YOLO26x~80 min~60 min
Tempos aproximados

Os tempos de treinamento são aproximados e variam com a complexidade do dataset, definições de aumento de dados e tamanho do lote. Usa a estimativa de custo da caixa de diálogo de treinamento para previsões mais precisas.

Posso treinar durante a noite?

Sim, o treinamento continua até à conclusão. Receberás uma notificação quando o treinamento terminar. Certifica-te de que a tua conta tem saldo suficiente para treinamento baseado em épocas.

O que acontece se eu ficar sem créditos?

Se o teu saldo de créditos chegar a zero durante uma execução de treinamento, o treinamento continua até à conclusão e o teu saldo fica negativo. Isto garante que a tua tarefa de treinamento nunca seja interrompida a meio.

Após a conclusão do treinamento, precisarás de adicionar créditos para repor o teu saldo positivo antes de iniciar novas tarefas de treinamento. O teu modelo concluído, pontos de verificação (checkpoints) e todos os artefactos de treinamento são totalmente preservados, independentemente do saldo.

Saldo negativo

Um saldo negativo apenas impede o início de novas tarefas de treinamento. As implementações existentes e outras funcionalidades da plataforma continuam a funcionar normalmente. Adiciona créditos através de Definições > Faturação ou ativa o reabastecimento automático para evitar interrupções.

O que acontece se o meu treinamento custar mais do que o estimado?

As estimativas de custo são aproximadas — o tempo real de treinamento pode variar devido a fatores como velocidade de carregamento de dados, aquecimento da GPU e comportamento de convergência do modelo. Se o custo real exceder a estimativa, o teu saldo pode ficar negativo (ver acima). A plataforma não para o treinamento com base na estimativa.

Para gerir custos:

  • Monitoriza o progresso do treinamento em tempo real e cancela antecipadamente se necessário
  • Ativa o reabastecimento automático para repor créditos automaticamente
  • Começa com execuções mais curtas (menos épocas) para calibrar as expectativas

Posso usar argumentos de treinamento personalizados?

Sim, expande a secção Definições Avançadas na caixa de diálogo de treinamento para aceder a um editor YAML com mais de 40 parâmetros configuráveis. Valores não predefinidos são incluídos em comandos de treinamento tanto na nuvem como locais.

O editor YAML também suporta a importação de configurações de execuções de treinamento anteriores:

  • Copiar de modelo existente: Na página de qualquer modelo concluído, o cartão de Configuração de Treinamento tem um botão Copiar como JSON. Copia o JSON e cola-o diretamente no editor YAML — ele deteta automaticamente o formato JSON e importa todos os parâmetros.
  • Colar YAML ou JSON: Cola qualquer configuração de treinamento YAML ou JSON válida no editor. Os parâmetros são validados automaticamente, sendo os valores fora do intervalo delimitados e os avisos apresentados.
  • Arrastar e largar ficheiros: Arrastar um ficheiro .yaml ou .json diretamente para o editor para importar os seus parâmetros.

Diálogo de Treinamento da Plataforma Ultralytics Copiar JSON de Configuração de Treinamento

Isto torna fácil reproduzir ou iterar sobre configurações de treinamento anteriores sem ter de reintroduzir manualmente cada parâmetro.

Posso treinar a partir de uma página de dataset?

Sim, o botão Treinar nas páginas de dataset abre a caixa de diálogo de treinamento com o dataset pré-selecionado e bloqueado. De seguida, selecionas um projeto e um modelo para começar a treinar.

Referência de Parâmetros de Treinamento

ParâmetroTipoPadrãoIntervaloDescrição
epochsint1001-10000Número de épocas de treinamento
batchint-1 (auto)-1 a 512Tamanho do lote (-1 = auto-ajuste à VRAM disponível)
imgszint64032-4096Tamanho da imagem de entrada
patienceint1001-1000Paciência para paragem precoce
seedint00-2147483647Semente aleatória para reprodutibilidade
deterministicboolTrue-Modo de treinamento determinístico
ampboolTrue-Precisão mista automática
close_mosaicint100-50Desativar mosaico nas últimas N épocas
save_periodint-1-1-100Guardar checkpoint a cada N épocas
workersint80-64Trabalhadores do dataloader
cacheselecionarfalseram/disk/falseCache de imagens
Parâmetros Específicos de Tarefa

Alguns parâmetros aplicam-se apenas a tarefas específicas:

  • Apenas tarefas de detecção (detect, segment, pose, OBB — não classify): box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • Apenas segment: copy_paste
  • Apenas pose: pose (peso da perda), kobj (objectness de pontos-chave)

Comentários