Ir para o conteúdo

Endpoints Dedicados

Ultralytics Platform permite a implantação de modelos YOLO em endpoints dedicados em 43 regiões globais. Cada endpoint é um serviço de locatário único com autoescalonamento, uma URL de endpoint única e monitoramento independente.

Ultralytics Platform: Aba de Implantação do Modelo com Mapa de Região e Tabela

Criar Endpoint

Da Aba de Implantação

Implemente um modelo a partir do seu Deploy separador:

  1. Navegue até o seu modelo
  2. Clique na aba Implantar
  3. Selecione uma região na tabela de regiões (ordenada pela latência a partir da sua localização)
  4. Clique em Implantar na linha da região

O nome da implantação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa).

Da Página de Implantações

Crie uma implantação a partir do global Deploy página na barra lateral:

  1. Clique em Nova Implantação
  2. Selecione um modelo no seletor de modelos
  3. Selecione uma região no mapa ou na tabela
  4. Opcionalmente, personalize o nome e os recursos da implantação
  5. Clique em Implantar Modelo

Plataforma Ultralytics Diálogo de Nova Implantação Com Seletor de Modelo e Mapa de Região

Ciclo de Vida da Implantação

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Seleção de Região

Escolha entre 43 regiões em todo o mundo. O mapa e a tabela interativos de regiões mostram:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Regiões implantadas: Destacadas com um selo "Implantado"
  • Regiões em implantação: Indicador de pulso animado
  • Destaque bidirecional: Passar o mouse sobre o mapa destaca a linha da tabela e vice-versa

Plataforma Ultralytics Aba Implantação Tabela de Latência por Região Classificada por Latência

A tabela de regiões no modelo Deploy guia inclui:

ColunaDescrição
LocalizaçãoCidade e país com ícone de bandeira
ZonaIdentificador da região
LatênciaTempo de ping medido (mediana de 3 pings)
DistânciaDistância da sua localização em km
AçõesBotão Deploy ou selo de status "Deployed"

Novo Diálogo de Implantação

O New Deployment diálogo (do global Deploy página) mostra uma tabela de região mais simples com apenas as colunas Localização, Latência e Selecionar.

Escolha com Sabedoria

Selecione a região mais próxima dos seus usuários para obter a menor latência. Use o botão Rescan para medir novamente a latência a partir da sua localização atual.

Regiões Disponíveis

ZonaLocalização
us-central1Iowa, EUA
us-east1Carolina do Sul, EUA
us-east4Virgínia do Norte, EUA
us-east5Columbus, EUA
us-south1Dallas, EUA
us-west1Oregon, EUA
us-west2Los Angeles, EUA
us-west3Salt Lake City, EUA
us-west4Las Vegas, EUA
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
northamerica-south1Queretaro, Mexico
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile
ZonaLocalização
europe-west1St. Ghislain, Bélgica
europe-west2Londres, Reino Unido
europe-west3Frankfurt, Alemanha
europe-west4Eemshaven, Países Baixos
europe-west6Zurique, Suíça
europe-west8Milão, Itália
europe-west9Paris, França
europe-west10Berlim, Alemanha
europe-west12Turim, Itália
europe-north1Hamina, Finlândia
europa-norte2Estocolmo, Suécia
europe-central2Varsóvia, Polônia
europe-southwest1Madrid, Espanha
ZonaLocalização
asia-east1Changhua, Taiwan
asia-east2Kowloon, Hong Kong
asia-northeast1Tóquio, Japão
asia-northeast2Osaka, Japão
asia-northeast3Seul, Coreia do Sul
asia-south1Mumbai, Índia
asia-south2Deli, Índia
asia-southeast1Jurong West, Singapura
asia-southeast2Jacarta, Indonésia
asia-southeast3Bangkok, Tailândia
australia-southeast1Sydney, Austrália
australia-southeast2Melbourne, Austrália
ZonaLocalização
africa-south1Joanesburgo, África do Sul
me-central1Doha, Catar
me-central2Dammam, Arábia Saudita
me-west1Tel Aviv, Israel

Configuração do Endpoint

Novo Diálogo de Implantação

O New Deployment o diálogo fornece:

ConfigurandoDescriçãoPadrão
ModeloSelecione entre os modelos concluídos-
RegiãoRegião de implantação-
Nome da ImplantaçãoGerado automaticamente, editável-
Núcleos de CPUAlocação de CPU (1-8)1
Memória (GB)Alocação de memória (1-32 GB)2

Plataforma Ultralytics Diálogo de Nova Implantação Painel de Recursos Expandido

As configurações de recursos estão disponíveis na seção recolhível Recursos. As implantações usam escala para zero por padrão (instâncias mínimas = 0, instâncias máximas = 1) — você só paga pelo tempo de inferência ativo.

Nomes Gerados Automaticamente

O nome da implantação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa). Se você implantar o mesmo modelo na mesma região novamente, um sufixo numérico será adicionado (por exemplo, yolo11n-iowa-2).

Separador Deploy (Implementação Rápida)

Ao implantar a partir do modelo Deploy separador, os endpoints são criados com recursos predefinidos (1 CPU, 2 GB de memória) com escalonamento para zero ativado. O nome da implementação é gerado automaticamente.

Gerenciar Endpoints

Modos de Visualização

A lista de implantações suporta três modos de visualização:

ModoDescrição
CartõesCartões de detalhes completos com logs, exemplos de código, painel de previsão
CompactoGrade de cartões menores com métricas chave
TabelaTabela de Dados com colunas classificáveis e pesquisa

Plataforma Ultralytics Aba Implantação Visualização de Cartões de Implantações Ativas

Cartão de Implementação (Vista de Cartões)

Cada cartão de implantação na visualização de cartões exibe:

  • Cabeçalho: Nome, bandeira da região, selo de status, botões de iniciar/parar/excluir
  • URL do Endpoint: URL copiável com link para a documentação da API
  • Métricas: Contagem de requisições (24h), latência P95, taxa de erro
  • Verificação de saúde: Indicador de saúde em tempo real com latência e atualização manual
  • Separadores: Logs, Code, e Predict

O Logs o separador mostra entradas de registo recentes com filtragem por severidade (Todos \/ Erros). O Code o separador mostra exemplos de código prontos a usar em Python, JavaScript e cURL com o seu URL de endpoint real e chave de API. O Predict guia fornece um painel de previsão embutido para testar diretamente na implantação.

Status de Implantação

StatusDescrição
CriandoA implantação está sendo configurada
ImplementandoO contêiner está iniciando
ProntoO endpoint está ativo e aceitando requisições
A pararO endpoint está sendo desligado
ParadoO endpoint está pausado (sem cobrança)
FalhouImplantação falhou (ver mensagem de erro)

URL do Endpoint

Cada endpoint possui uma URL única, por exemplo:

https://predict-abc123.run.app

Ultralytics Platform: Cartão de Implantação - URL do Endpoint com Botão de Copiar

Clique no botão de copiar para copiar a URL. Clique no ícone de documentação para visualizar a documentação da API gerada automaticamente para o endpoint.

Gerenciamento do Ciclo de Vida

Controle o estado do seu endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AçãoDescrição
IniciarRetomar um endpoint parado
PararPausar o endpoint (sem cobrança)
ExcluirRemover endpoint permanentemente

Parar Endpoint

Pare um endpoint para pausar a cobrança:

  1. Clique no ícone de pausa no cartão de implantação
  2. O status do endpoint muda para "Parando" e depois "Parado"

Endpoints parados:

  • Não aceitam requisições
  • Não geram cobranças
  • Pode ser reiniciado a qualquer momento

Excluir Endpoint

Remover permanentemente um endpoint:

  1. Clique no ícone de exclusão (lixeira) no cartão de implantação
  2. Confirmar exclusão na caixa de diálogo

Ação Permanente

A exclusão é imediata e permanente. Você sempre pode criar um novo endpoint.

Utilizando Endpoints

Autenticação

Cada implantação é criada com uma chave de API da sua conta. Inclua-a nas requisições:

Authorization: Bearer YOUR_API_KEY

O prefixo da chave de API é exibido no rodapé do cartão de implantação para identificação. Gere chaves em Chaves de API.

Sem Limites de Taxa

Endpoints dedicados não estão sujeitos aos limites de taxa da API da Plataforma. As requisições vão diretamente para o seu serviço dedicado, então a taxa de transferência é limitada apenas pela CPU, memória e configuração de escalonamento do seu endpoint. Esta é uma vantagem fundamental em relação à inferência compartilhada, que é limitada a 20 requisições/min por chave de API.

Exemplo de Requisição

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Parâmetros da Requisição

ParâmetroTipoPadrãoDescrição
filearquivo-Arquivo de imagem (obrigatório)
conffloat0.25Limite mínimo de confiança
ioufloat0.7Limite de IoU da NMS
imgszint640Tamanho da imagem de entrada
normalizestring-Retornar coordenadas normalizadas

Formato da Resposta

O mesmo que inferência compartilhada com campos específicos da tarefa.

Preços

Endpoints dedicados são cobrados com base em:

ComponenteTaxa
CPUPor vCPU-segundo
MemóriaPor GB-segundo
RequisiçõesPor milhão de requisições

Otimização de Custos

FAQ

Quantos endpoints posso criar?

Os limites de endpoint dependem do plano:

  • Gratuito: Até 3 implantações
  • Pro: Até 10 implantações
  • Empresarial: Implantações ilimitadas

Cada modelo ainda pode ser implantado em várias regiões dentro da sua cota de plano.

Posso alterar a região após a implantação?

Não, as regiões são fixas. Para alterar as regiões:

  1. Exclua o endpoint existente
  2. Crie um novo endpoint na região desejada

Como gerencio a implantação multi-região?

Para cobertura global:

  1. Implante em várias regiões
  2. Use um balanceador de carga ou roteamento DNS
  3. Encaminhe os usuários para o endpoint mais próximo

Qual é o tempo de inicialização a frio?

O tempo de inicialização a frio depende do tamanho do modelo e se o contêiner já está em cache na região. Intervalos típicos:

CenárioCold Start
Contêiner em cache~5-15 segundos
Primeiro deploy/região~15-45 segundos

A verificação de integridade utiliza um tempo limite de 55 segundos para acomodar inicializações a frio no pior cenário.

Posso usar domínios personalizados?

Domínios personalizados estarão disponíveis em breve. Atualmente, os endpoints utilizam URLs geradas pela plataforma.



📅 Criado há 2 meses ✏️ Atualizado há 24 dias
glenn-jochersergiuwaxmann

Comentários