Endpoints Dedicados
A Plataforma Ultralytics permite a implantação de modelos YOLO em endpoints dedicados em 43 regiões globais. Cada endpoint é um serviço de locatário único com autoescalonamento, URLs personalizadas e monitoramento independente.
Criar Endpoint
Implante um modelo em um endpoint dedicado:
- Navegue até o seu modelo
- Clique na aba Implantar
- Selecione uma região no mapa
- Clique em Implantar
Seleção de Região
Escolha entre 43 regiões em todo o mundo:
O mapa interativo mostra:
- Pinos de região: Clique para selecionar
- Indicadores de latência: Codificado por cor pela distância
- Green: <100ms
- Amarelo: 100-200ms
- Vermelho: >200ms
Tabela de Regiões
Visualize todas as regiões com detalhes:
| Coluna | Descrição |
|---|---|
| Região | Identificador da região |
| Localização | Cidade/país |
| Latência | Tempo de ping medido |
| Status | Disponível/implantado |
Escolha com Sabedoria
Selecione a região mais próxima dos seus usuários para obter a menor latência. Considere implantar em várias regiões para cobertura global.
Regiões Disponíveis
Américas (14 regiões)
| Zona | Localização |
|---|---|
| us-central1 | Iowa, EUA |
| us-east1 | Carolina do Sul, EUA |
| us-east4 | Virgínia, EUA |
| us-east5 | Ohio, EUA |
| us-west1 | Oregon, EUA |
| us-west2 | Los Angeles, EUA |
| us-west3 | Salt Lake City, EUA |
| us-west4 | Las Vegas, EUA |
| us-south1 | Dallas, EUA |
| northamerica-northeast1 | Montreal, Canadá |
| northamerica-northeast2 | Toronto, Canadá |
| southamerica-east1 | São Paulo, Brasil |
| southamerica-west1 | Santiago, Chile |
Europa (12 regiões)
| Zona | Localização |
|---|---|
| europe-west1 | Bélgica |
| europe-west2 | Londres, Reino Unido |
| europe-west3 | Frankfurt, Alemanha |
| europe-west4 | Países Baixos |
| europe-west6 | Zurique, Suíça |
| europe-west8 | Milão, Itália |
| europe-west9 | Paris, França |
| europe-west10 | Berlim, Alemanha |
| europe-west12 | Turim, Itália |
| europe-north1 | Finlândia |
| europe-central2 | Varsóvia, Polônia |
| europe-southwest1 | Madrid, Espanha |
Ásia-Pacífico (14 regiões)
| Zona | Localização |
|---|---|
| asia-east1 | Taiwan |
| asia-east2 | Hong Kong |
| asia-northeast1 | Tóquio, Japão |
| asia-northeast2 | Osaka, Japão |
| asia-northeast3 | Seul, Coreia do Sul |
| asia-south1 | Mumbai, Índia |
| asia-south2 | Deli, Índia |
| asia-southeast1 | Singapura |
| asia-southeast2 | Jacarta, Indonésia |
| australia-southeast1 | Sydney, Austrália |
| australia-southeast2 | Melbourne, Austrália |
Médio Oriente e África (3 regiões)
| Zona | Localização |
|---|---|
| me-central1 | Doha, Catar |
| me-central2 | Dammam, Arábia Saudita |
| me-west1 | Tel Aviv, Israel |
Configuração do Endpoint
Ao criar um endpoint:
| Configurando | Descrição | Padrão |
|---|---|---|
| Região | Região de implantação | - |
| Instâncias Mínimas | Número mínimo de instâncias em execução | 0 |
| Instâncias Máximas | Limite máximo de escalonamento | 10 |
Opções de Escalabilidade
| Configurando | Comportamento |
|---|---|
| Mín = 0 | Escala para zero quando ocioso (econômico) |
| Mín > 0 | Sempre ativo para evitar inicializações a frio |
| Máx | Limite superior para picos de tráfego |
Inicializações a Frio
Com instâncias mínimas = 0, a primeira requisição após o período de inatividade aciona uma inicialização a frio (2-5 segundos). Defina min > 0 para aplicações sensíveis à latência.
Gerenciar Endpoints
Visualize e gerencie seus endpoints:
Detalhes do Endpoint
| Campo | Descrição |
|---|---|
| URL | Endpoint HTTPS para requisições |
| Região | Região de implantação |
| Status | Em execução, Parado, Em implantação |
| Instâncias | Contagem de instâncias atual/máxima |
URL do Endpoint
Cada endpoint possui uma URL única:
https://model-abc123-us-central1.a.run.app
Clique no botão de copiar para copiar a URL.
Gerenciamento do Ciclo de Vida
Controle o estado do seu endpoint:
| Ação | Descrição |
|---|---|
| Iniciar | Retomar um endpoint parado |
| Parar | Pausar o endpoint (sem cobrança) |
| Excluir | Remover endpoint permanentemente |
Parar Endpoint
Pare um endpoint para pausar a cobrança:
- Abrir menu de ações do endpoint
- Clique em Parar
- Confirmar ação
Endpoints parados:
- Não aceitam requisições
- Não geram cobranças
- Pode ser reiniciado a qualquer momento
Excluir Endpoint
Remover permanentemente um endpoint:
- Abrir menu de ações do endpoint
- Clique em Excluir
- Confirmar exclusão
Ação Permanente
A exclusão é imediata e permanente. Você sempre pode criar um novo endpoint.
Utilizando Endpoints
Autenticação
Inclua sua chave API nas requisições:
Authorization: Bearer YOUR_API_KEY
Exemplo de Requisição
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Formato da Resposta
O mesmo que inferência compartilhada com campos específicos da tarefa.
Preços
Endpoints dedicados são cobrados com base em:
| Componente | Taxa |
|---|---|
| CPU | Por vCPU-segundo |
| Memória | Por GB-segundo |
| Requisições | Por milhão de requisições |
Otimização de Custos
- Use o scale-to-zero para endpoints de desenvolvimento
- Defina o número máximo de instâncias apropriado
- Monitore o uso no painel de Monitoramento
FAQ
Quantos endpoints posso criar?
Não há limite rígido. Cada modelo pode ter endpoints em várias regiões. O total de endpoints depende do seu plano.
Posso alterar a região após a implantação?
Não, as regiões são fixas. Para alterar as regiões:
- Exclua o endpoint existente
- Crie um novo endpoint na região desejada
Como gerencio a implantação multi-região?
Para cobertura global:
- Implante em várias regiões
- Use um balanceador de carga ou roteamento DNS
- Encaminhe os usuários para o endpoint mais próximo
Qual é o tempo de inicialização a frio?
O cold start varia de acordo com o tamanho do modelo:
| Modelo | Cold Start |
|---|---|
| YOLO26n | ~2 segundos |
| YOLO26m | ~3 segundos |
| YOLO26x | ~5 segundos |
Defina min instances > 0 para eliminar cold starts.
Posso usar domínios personalizados?
Domínios personalizados estarão disponíveis em breve. Atualmente, os endpoints utilizam URLs geradas pela plataforma.