Endpoints Dedicados
Ultralytics Platform permite a implantação de modelos YOLO em endpoints dedicados em 43 regiões globais. Cada endpoint é um serviço de locatário único com autoescalonamento, uma URL de endpoint única e monitoramento independente.

Criar Endpoint
Da Aba de Implantação
Implemente um modelo a partir do seu Deploy separador:
- Navegue até o seu modelo
- Clique na aba Implantar
- Selecione uma região na tabela de regiões (ordenada pela latência a partir da sua localização)
- Clique em Implantar na linha da região
O nome da implantação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa).
Da Página de Implantações
Crie uma implantação a partir do global Deploy página na barra lateral:
- Clique em Nova Implantação
- Selecione um modelo no seletor de modelos
- Selecione uma região no mapa ou na tabela
- Opcionalmente, personalize o nome e os recursos da implantação
- Clique em Implantar Modelo

Ciclo de Vida da Implantação
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
Seleção de Região
Escolha entre 43 regiões em todo o mundo. O mapa e a tabela interativos de regiões mostram:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- Regiões implantadas: Destacadas com um selo "Implantado"
- Regiões em implantação: Indicador de pulso animado
- Destaque bidirecional: Passar o mouse sobre o mapa destaca a linha da tabela e vice-versa

A tabela de regiões no modelo Deploy guia inclui:
| Coluna | Descrição |
|---|---|
| Localização | Cidade e país com ícone de bandeira |
| Zona | Identificador da região |
| Latência | Tempo de ping medido (mediana de 3 pings) |
| Distância | Distância da sua localização em km |
| Ações | Botão Deploy ou selo de status "Deployed" |
Novo Diálogo de Implantação
O New Deployment diálogo (do global Deploy página) mostra uma tabela de região mais simples com apenas as colunas Localização, Latência e Selecionar.
Escolha com Sabedoria
Selecione a região mais próxima dos seus usuários para obter a menor latência. Use o botão Rescan para medir novamente a latência a partir da sua localização atual.
Regiões Disponíveis
| Zona | Localização |
|---|---|
| us-central1 | Iowa, EUA |
| us-east1 | Carolina do Sul, EUA |
| us-east4 | Virgínia do Norte, EUA |
| us-east5 | Columbus, EUA |
| us-south1 | Dallas, EUA |
| us-west1 | Oregon, EUA |
| us-west2 | Los Angeles, EUA |
| us-west3 | Salt Lake City, EUA |
| us-west4 | Las Vegas, EUA |
| northamerica-northeast1 | Montreal, Canadá |
| northamerica-northeast2 | Toronto, Canadá |
| northamerica-south1 | Queretaro, Mexico |
| southamerica-east1 | São Paulo, Brasil |
| southamerica-west1 | Santiago, Chile |
| Zona | Localização |
|---|---|
| europe-west1 | St. Ghislain, Bélgica |
| europe-west2 | Londres, Reino Unido |
| europe-west3 | Frankfurt, Alemanha |
| europe-west4 | Eemshaven, Países Baixos |
| europe-west6 | Zurique, Suíça |
| europe-west8 | Milão, Itália |
| europe-west9 | Paris, França |
| europe-west10 | Berlim, Alemanha |
| europe-west12 | Turim, Itália |
| europe-north1 | Hamina, Finlândia |
| europa-norte2 | Estocolmo, Suécia |
| europe-central2 | Varsóvia, Polônia |
| europe-southwest1 | Madrid, Espanha |
| Zona | Localização |
|---|---|
| asia-east1 | Changhua, Taiwan |
| asia-east2 | Kowloon, Hong Kong |
| asia-northeast1 | Tóquio, Japão |
| asia-northeast2 | Osaka, Japão |
| asia-northeast3 | Seul, Coreia do Sul |
| asia-south1 | Mumbai, Índia |
| asia-south2 | Deli, Índia |
| asia-southeast1 | Jurong West, Singapura |
| asia-southeast2 | Jacarta, Indonésia |
| asia-southeast3 | Bangkok, Tailândia |
| australia-southeast1 | Sydney, Austrália |
| australia-southeast2 | Melbourne, Austrália |
| Zona | Localização |
|---|---|
| africa-south1 | Joanesburgo, África do Sul |
| me-central1 | Doha, Catar |
| me-central2 | Dammam, Arábia Saudita |
| me-west1 | Tel Aviv, Israel |
Configuração do Endpoint
Novo Diálogo de Implantação
O New Deployment o diálogo fornece:
| Configurando | Descrição | Padrão |
|---|---|---|
| Modelo | Selecione entre os modelos concluídos | - |
| Região | Região de implantação | - |
| Nome da Implantação | Gerado automaticamente, editável | - |
| Núcleos de CPU | Alocação de CPU (1-8) | 1 |
| Memória (GB) | Alocação de memória (1-32 GB) | 2 |

As configurações de recursos estão disponíveis na seção recolhível Recursos. As implantações usam escala para zero por padrão (instâncias mínimas = 0, instâncias máximas = 1) — você só paga pelo tempo de inferência ativo.
Nomes Gerados Automaticamente
O nome da implantação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa). Se você implantar o mesmo modelo na mesma região novamente, um sufixo numérico será adicionado (por exemplo, yolo11n-iowa-2).
Separador Deploy (Implementação Rápida)
Ao implantar a partir do modelo Deploy separador, os endpoints são criados com recursos predefinidos (1 CPU, 2 GB de memória) com escalonamento para zero ativado. O nome da implementação é gerado automaticamente.
Gerenciar Endpoints
Modos de Visualização
A lista de implantações suporta três modos de visualização:
| Modo | Descrição |
|---|---|
| Cartões | Cartões de detalhes completos com logs, exemplos de código, painel de previsão |
| Compacto | Grade de cartões menores com métricas chave |
| Tabela | Tabela de Dados com colunas classificáveis e pesquisa |

Cartão de Implementação (Vista de Cartões)
Cada cartão de implantação na visualização de cartões exibe:
- Cabeçalho: Nome, bandeira da região, selo de status, botões de iniciar/parar/excluir
- URL do Endpoint: URL copiável com link para a documentação da API
- Métricas: Contagem de requisições (24h), latência P95, taxa de erro
- Verificação de saúde: Indicador de saúde em tempo real com latência e atualização manual
- Separadores:
Logs,Code, ePredict
O Logs o separador mostra entradas de registo recentes com filtragem por severidade (Todos \/ Erros). O Code o separador mostra exemplos de código prontos a usar em Python, JavaScript e cURL com o seu URL de endpoint real e chave de API. O Predict guia fornece um painel de previsão embutido para testar diretamente na implantação.
Status de Implantação
| Status | Descrição |
|---|---|
| Criando | A implantação está sendo configurada |
| Implementando | O contêiner está iniciando |
| Pronto | O endpoint está ativo e aceitando requisições |
| A parar | O endpoint está sendo desligado |
| Parado | O endpoint está pausado (sem cobrança) |
| Falhou | Implantação falhou (ver mensagem de erro) |
URL do Endpoint
Cada endpoint possui uma URL única, por exemplo:
https://predict-abc123.run.app

Clique no botão de copiar para copiar a URL. Clique no ícone de documentação para visualizar a documentação da API gerada automaticamente para o endpoint.
Gerenciamento do Ciclo de Vida
Controle o estado do seu endpoint:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| Ação | Descrição |
|---|---|
| Iniciar | Retomar um endpoint parado |
| Parar | Pausar o endpoint (sem cobrança) |
| Excluir | Remover endpoint permanentemente |
Parar Endpoint
Pare um endpoint para pausar a cobrança:
- Clique no ícone de pausa no cartão de implantação
- O status do endpoint muda para "Parando" e depois "Parado"
Endpoints parados:
- Não aceitam requisições
- Não geram cobranças
- Pode ser reiniciado a qualquer momento
Excluir Endpoint
Remover permanentemente um endpoint:
- Clique no ícone de exclusão (lixeira) no cartão de implantação
- Confirmar exclusão na caixa de diálogo
Ação Permanente
A exclusão é imediata e permanente. Você sempre pode criar um novo endpoint.
Utilizando Endpoints
Autenticação
Cada implantação é criada com uma chave de API da sua conta. Inclua-a nas requisições:
Authorization: Bearer YOUR_API_KEY
O prefixo da chave de API é exibido no rodapé do cartão de implantação para identificação. Gere chaves em Chaves de API.
Sem Limites de Taxa
Endpoints dedicados não estão sujeitos aos limites de taxa da API da Plataforma. As requisições vão diretamente para o seu serviço dedicado, então a taxa de transferência é limitada apenas pela CPU, memória e configuração de escalonamento do seu endpoint. Esta é uma vantagem fundamental em relação à inferência compartilhada, que é limitada a 20 requisições/min por chave de API.
Exemplo de Requisição
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Parâmetros da Requisição
| Parâmetro | Tipo | Padrão | Descrição |
|---|---|---|---|
file | arquivo | - | Arquivo de imagem (obrigatório) |
conf | float | 0.25 | Limite mínimo de confiança |
iou | float | 0.7 | Limite de IoU da NMS |
imgsz | int | 640 | Tamanho da imagem de entrada |
normalize | string | - | Retornar coordenadas normalizadas |
Formato da Resposta
O mesmo que inferência compartilhada com campos específicos da tarefa.
Preços
Endpoints dedicados são cobrados com base em:
| Componente | Taxa |
|---|---|
| CPU | Por vCPU-segundo |
| Memória | Por GB-segundo |
| Requisições | Por milhão de requisições |
Otimização de Custos
- Use o scale-to-zero para endpoints de desenvolvimento
- Defina o número máximo de instâncias apropriado
- Monitore o uso no painel de Monitoramento
- Revise os custos em Configurações > Faturamento
FAQ
Quantos endpoints posso criar?
Os limites de endpoint dependem do plano:
- Gratuito: Até 3 implantações
- Pro: Até 10 implantações
- Empresarial: Implantações ilimitadas
Cada modelo ainda pode ser implantado em várias regiões dentro da sua cota de plano.
Posso alterar a região após a implantação?
Não, as regiões são fixas. Para alterar as regiões:
- Exclua o endpoint existente
- Crie um novo endpoint na região desejada
Como gerencio a implantação multi-região?
Para cobertura global:
- Implante em várias regiões
- Use um balanceador de carga ou roteamento DNS
- Encaminhe os usuários para o endpoint mais próximo
Qual é o tempo de inicialização a frio?
O tempo de inicialização a frio depende do tamanho do modelo e se o contêiner já está em cache na região. Intervalos típicos:
| Cenário | Cold Start |
|---|---|
| Contêiner em cache | ~5-15 segundos |
| Primeiro deploy/região | ~15-45 segundos |
A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio no pior cenário.
Posso usar domínios personalizados?
Domínios personalizados estarão disponíveis em breve. Atualmente, os endpoints utilizam URLs geradas pela plataforma.