Ir para o conteúdo

Endpoints Dedicados

A Plataforma Ultralytics permite a implantação de modelos YOLO em endpoints dedicados em 43 regiões globais. Cada endpoint é um serviço de locatário único com autoescalonamento, URLs personalizadas e monitoramento independente.

Criar Endpoint

Implante um modelo em um endpoint dedicado:

  1. Navegue até o seu modelo
  2. Clique na aba Implantar
  3. Selecione uma região no mapa
  4. Clique em Implantar

Seleção de Região

Escolha entre 43 regiões em todo o mundo:

O mapa interativo mostra:

  • Pinos de região: Clique para selecionar
  • Indicadores de latência: Codificado por cor pela distância
    • Green: <100ms
    • Amarelo: 100-200ms
    • Vermelho: >200ms

Tabela de Regiões

Visualize todas as regiões com detalhes:

ColunaDescrição
RegiãoIdentificador da região
LocalizaçãoCidade/país
LatênciaTempo de ping medido
StatusDisponível/implantado

Escolha com Sabedoria

Selecione a região mais próxima dos seus usuários para obter a menor latência. Considere implantar em várias regiões para cobertura global.

Regiões Disponíveis

Américas (14 regiões)

ZonaLocalização
us-central1Iowa, EUA
us-east1Carolina do Sul, EUA
us-east4Virgínia, EUA
us-east5Ohio, EUA
us-west1Oregon, EUA
us-west2Los Angeles, EUA
us-west3Salt Lake City, EUA
us-west4Las Vegas, EUA
us-south1Dallas, EUA
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile

Europa (12 regiões)

ZonaLocalização
europe-west1Bélgica
europe-west2Londres, Reino Unido
europe-west3Frankfurt, Alemanha
europe-west4Países Baixos
europe-west6Zurique, Suíça
europe-west8Milão, Itália
europe-west9Paris, França
europe-west10Berlim, Alemanha
europe-west12Turim, Itália
europe-north1Finlândia
europe-central2Varsóvia, Polônia
europe-southwest1Madrid, Espanha

Ásia-Pacífico (14 regiões)

ZonaLocalização
asia-east1Taiwan
asia-east2Hong Kong
asia-northeast1Tóquio, Japão
asia-northeast2Osaka, Japão
asia-northeast3Seul, Coreia do Sul
asia-south1Mumbai, Índia
asia-south2Deli, Índia
asia-southeast1Singapura
asia-southeast2Jacarta, Indonésia
australia-southeast1Sydney, Austrália
australia-southeast2Melbourne, Austrália

Médio Oriente e África (3 regiões)

ZonaLocalização
me-central1Doha, Catar
me-central2Dammam, Arábia Saudita
me-west1Tel Aviv, Israel

Configuração do Endpoint

Ao criar um endpoint:

ConfigurandoDescriçãoPadrão
RegiãoRegião de implantação-
Instâncias MínimasNúmero mínimo de instâncias em execução0
Instâncias MáximasLimite máximo de escalonamento10

Opções de Escalabilidade

ConfigurandoComportamento
Mín = 0Escala para zero quando ocioso (econômico)
Mín > 0Sempre ativo para evitar inicializações a frio
MáxLimite superior para picos de tráfego

Inicializações a Frio

Com instâncias mínimas = 0, a primeira requisição após o período de inatividade aciona uma inicialização a frio (2-5 segundos). Defina min > 0 para aplicações sensíveis à latência.

Gerenciar Endpoints

Visualize e gerencie seus endpoints:

Detalhes do Endpoint

CampoDescrição
URLEndpoint HTTPS para requisições
RegiãoRegião de implantação
StatusEm execução, Parado, Em implantação
InstânciasContagem de instâncias atual/máxima

URL do Endpoint

Cada endpoint possui uma URL única:

https://model-abc123-us-central1.a.run.app

Clique no botão de copiar para copiar a URL.

Gerenciamento do Ciclo de Vida

Controle o estado do seu endpoint:

AçãoDescrição
IniciarRetomar um endpoint parado
PararPausar o endpoint (sem cobrança)
ExcluirRemover endpoint permanentemente

Parar Endpoint

Pare um endpoint para pausar a cobrança:

  1. Abrir menu de ações do endpoint
  2. Clique em Parar
  3. Confirmar ação

Endpoints parados:

  • Não aceitam requisições
  • Não geram cobranças
  • Pode ser reiniciado a qualquer momento

Excluir Endpoint

Remover permanentemente um endpoint:

  1. Abrir menu de ações do endpoint
  2. Clique em Excluir
  3. Confirmar exclusão

Ação Permanente

A exclusão é imediata e permanente. Você sempre pode criar um novo endpoint.

Utilizando Endpoints

Autenticação

Inclua sua chave API nas requisições:

Authorization: Bearer YOUR_API_KEY

Exemplo de Requisição

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Formato da Resposta

O mesmo que inferência compartilhada com campos específicos da tarefa.

Preços

Endpoints dedicados são cobrados com base em:

ComponenteTaxa
CPUPor vCPU-segundo
MemóriaPor GB-segundo
RequisiçõesPor milhão de requisições

Otimização de Custos

  • Use o scale-to-zero para endpoints de desenvolvimento
  • Defina o número máximo de instâncias apropriado
  • Monitore o uso no painel de Monitoramento

FAQ

Quantos endpoints posso criar?

Não há limite rígido. Cada modelo pode ter endpoints em várias regiões. O total de endpoints depende do seu plano.

Posso alterar a região após a implantação?

Não, as regiões são fixas. Para alterar as regiões:

  1. Exclua o endpoint existente
  2. Crie um novo endpoint na região desejada

Como gerencio a implantação multi-região?

Para cobertura global:

  1. Implante em várias regiões
  2. Use um balanceador de carga ou roteamento DNS
  3. Encaminhe os usuários para o endpoint mais próximo

Qual é o tempo de inicialização a frio?

O cold start varia de acordo com o tamanho do modelo:

ModeloCold Start
YOLO26n~2 segundos
YOLO26m~3 segundos
YOLO26x~5 segundos

Defina min instances > 0 para eliminar cold starts.

Posso usar domínios personalizados?

Domínios personalizados estarão disponíveis em breve. Atualmente, os endpoints utilizam URLs geradas pela plataforma.



📅 Criado há 20 dias ✏️ Atualizado há 14 dias
glenn-jocher

Comentários