Ir para o conteúdo

Endpoints Dedicados

Ultralytics permite a implementação de YOLO em terminais dedicados em 43 regiões globais. Cada terminal é um serviço de locatário único com autoescala, um URL de terminal exclusivo e monitoramento independente.

Guia Implantação do modelo Ultralytics com mapa regional e tabela

Criar Endpoint

Na guia Implantação

Implemente um modelo a partir do seu Deploy tab:

  1. Navegue até o seu modelo
  2. Clique na aba Implantar
  3. Selecione uma região na tabela de regiões (classificadas por latência a partir da sua localização)
  4. Clique em Implementar na linha da região

O nome da implementação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa).

Na página Implantações

Crie uma implementação a partir do global Deploy página na barra lateral:

  1. Clique em Nova implementação
  2. Selecione um modelo no seletor de modelos
  3. Selecione uma região no mapa ou na tabela
  4. Opcionalmente, personalize o nome da implementação e os recursos
  5. Clique em Implantar modelo

Ultralytics Nova caixa de diálogo de implementação com seletor de modelo e mapa da região

Ciclo de vida da implementação

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Seleção de Região

Escolha entre 43 regiões em todo o mundo. O mapa interativo da região e a tabela mostram:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Regiões implementadas: destacadas com um selo «Implementado»
  • Regiões de implantação: Indicador de pulso animado
  • Destaque bidirecional: passar o cursor sobre o mapa destaca a linha da tabela e vice-versa.

Ultralytics Separador Implementação Tabela de latência da região ordenada por latência

A tabela de regiões no modelo Deploy A guia inclui:

ColunaDescrição
LocalizaçãoCidade e país com ícone de bandeira
ZonaIdentificador da região
LatênciaTempo de ping medido (mediana de 3 pings)
DistânciaDistância da sua localização em km
AçõesBotão Implantar ou selo de status "Implantado"

Caixa de diálogo Nova implementação

O New Deployment diálogo (da global Deploy página) mostra uma tabela de regiões mais simples, com apenas as colunas Localização, Latência e Seleção.

Escolha com Sabedoria

Selecione a região mais próxima dos seus utilizadores para obter a menor latência. Use o botão Rescan para medir novamente a latência a partir da sua localização atual.

Regiões Disponíveis

ZonaLocalização
us-central1Iowa, EUA
us-east1Carolina do Sul, EUA
us-east4Virgínia do Norte, EUA
us-east5Columbus, EUA
us-south1Dallas, EUA
us-west1Oregon, EUA
us-west2Los Angeles, EUA
us-west3Salt Lake City, EUA
us-west4Las Vegas, EUA
northamerica-northeast1Montreal, Canadá
northamerica-northeast2Toronto, Canadá
norteamérica-sul1Querétaro, México
southamerica-east1São Paulo, Brasil
southamerica-west1Santiago, Chile
ZonaLocalização
europe-west1St. Ghislain, Bélgica
europe-west2Londres, Reino Unido
europe-west3Frankfurt, Alemanha
europe-west4Eemshaven, Países Baixos
europe-west6Zurique, Suíça
europe-west8Milão, Itália
europe-west9Paris, França
europe-west10Berlim, Alemanha
europe-west12Turim, Itália
europe-north1Hamina, Finlândia
europa-norte2Estocolmo, Suécia
europe-central2Varsóvia, Polônia
europe-southwest1Madrid, Espanha
ZonaLocalização
asia-east1Changhua, Taiwan
asia-east2Kowloon, Hong Kong
asia-northeast1Tóquio, Japão
asia-northeast2Osaka, Japão
asia-northeast3Seul, Coreia do Sul
asia-south1Mumbai, Índia
asia-south2Deli, Índia
asia-southeast1Jurong West, Singapura
asia-southeast2Jacarta, Indonésia
ásia-sudeste3Bangkok, Tailândia
australia-southeast1Sydney, Austrália
australia-southeast2Melbourne, Austrália
ZonaLocalização
África-sul1Joanesburgo, África do Sul
me-central1Doha, Catar
me-central2Dammam, Arábia Saudita
me-west1Tel Aviv, Israel

Configuração do Endpoint

Caixa de diálogo Nova implementação

O New Deployment O diálogo fornece:

ConfigurandoDescriçãoPadrão
ModeloSelecione entre os modelos concluídos-
RegiãoRegião de implantação-
Nome da implementaçãoGerado automaticamente, editável-
CPUCPU (1-8)1
Memória (GB)Alocação de memória (1-32 GB)2

Ultralytics Novo painel de recursos da caixa de diálogo de implementação expandido

As definições de recursos estão disponíveis na secção Recursos, que pode ser recolhida. As implementações utilizam a escala para zero por predefinição (instâncias mínimas = 0, instâncias máximas = 1) — só paga pelo tempo de inferência ativo.

Nomes gerados automaticamente

O nome da implantação é gerado automaticamente a partir do nome do modelo e da cidade da região (por exemplo, yolo11n-iowa). Se implementar o mesmo modelo na mesma região novamente, um sufixo numérico será adicionado (por exemplo, yolo11n-iowa-2).

Guia Implantação (Implantação rápida)

Ao implementar a partir do modelo Deploy Na guia, os pontos finais são criados com recursos padrão (1 CPU, 2 GB de memória) com a escala para zero ativada. O nome da implementação é gerado automaticamente.

Gerenciar Endpoints

Modos de visualização

A lista de implementações suporta três modos de visualização:

ModoDescrição
CartõesCartões detalhados com registos, exemplos de código, painel de previsão
CompactoGrelha de cartões mais pequenos com métricas-chave
TabelaTabela de dados com colunas classificáveis e pesquisa

Ultralytics Separador Implementações Implementações ativas Visualização de cartões

Cartão de implementação (visualização de cartões)

Cada cartão de implementação na visualização de cartões mostra:

  • Cabeçalho: Nome, bandeira da região, emblema de estado, botões iniciar/parar/eliminar
  • URL do ponto final: URL copiável com link para a documentação da API
  • Métricas: Número de solicitações (24 horas), latência P95, taxa de erros
  • Verificação de saúde: Indicador de saúde em tempo real com latência e atualização manual
  • Abas: Logs, Code, e Predict

O Logs A guia exibe entradas recentes do registo com filtragem por gravidade (Todas / Erros). A Code A guia mostra exemplos de código prontos para uso em Python, JavaScript e cURL com o URL do seu endpoint real e a chave da API. O Predict A guia fornece um painel de previsão embutido para testes diretamente na implementação.

Estados de implementação

StatusDescrição
CriandoA implementação está a ser configurada
ImplementaçãoO contentor está a começar
ProntoO terminal está ativo e a aceitar pedidos
PararO terminal está a ser desligado
ParouO terminal está em pausa (sem cobrança)
FalhaA implementação falhou (ver mensagem de erro)

URL do Endpoint

Cada ponto final tem um URL exclusivo, por exemplo:

https://predict-abc123.run.app

Ultralytics Implantação Cartão URL do terminal com botão Copiar

Clique no botão Copiar para copiar o URL. Clique no ícone Docs para visualizar a documentação da API gerada automaticamente para o endpoint.

Gerenciamento do Ciclo de Vida

Controle o estado do seu endpoint:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
AçãoDescrição
IniciarRetomar um endpoint parado
PararPausar o endpoint (sem cobrança)
ExcluirRemover endpoint permanentemente

Parar Endpoint

Pare um endpoint para pausar a cobrança:

  1. Clique no ícone de pausa no cartão de implementação
  2. O estado do terminal muda para «A parar» e, em seguida, para «Parado».

Endpoints parados:

  • Não aceitam requisições
  • Não geram cobranças
  • Pode ser reiniciado a qualquer momento

Excluir Endpoint

Remover permanentemente um endpoint:

  1. Clique no ícone de eliminação (lixo) no cartão de implementação.
  2. Confirme a eliminação na caixa de diálogo

Ação Permanente

A exclusão é imediata e permanente. Você sempre pode criar um novo endpoint.

Utilizando Endpoints

Autenticação

Cada implementação é criada com uma chave API da sua conta. Inclua-a nas solicitações:

Authorization: Bearer YOUR_API_KEY

O prefixo da chave API é exibido no rodapé do cartão de implementação para identificação. Gere chaves a partir de Chaves API.

Sem limites de taxa

Os pontos finais dedicados não estão sujeitos aos limites de taxa da API da plataforma. As solicitações vão diretamente para o seu serviço dedicado, portanto, a taxa de transferência é limitada apenas pela CPU, memória e configuração de dimensionamento do seu ponto final. Essa é uma vantagem importante em relação à inferência partilhada, que tem uma taxa limitada a 20 solicitações/minuto por chave API.

Exemplo de Requisição

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Parâmetros da solicitação

ParâmetroTipoPadrãoDescrição
filearquivo-Ficheiro de imagem (obrigatório)
conffloat0.25Limite mínimo de confiança
ioufloat0.7Limite de IoU da NMS
imgszint640Tamanho da imagem de entrada
normalizestring-Retornar coordenadas normalizadas

Formato da Resposta

O mesmo que inferência compartilhada com campos específicos da tarefa.

Preços

Endpoints dedicados são cobrados com base em:

ComponenteTaxa
CPUPor vCPU-segundo
MemóriaPor GB-segundo
RequisiçõesPor milhão de requisições

Otimização de Custos

FAQ

Quantos endpoints posso criar?

Os limites dos terminais dependem do plano:

  • Gratuito: até 3 implementações
  • Prós: Até 10 implementações
  • Empresa: Implementações ilimitadas

Cada modelo ainda pode ser implementado em várias regiões dentro da sua quota do plano.

Posso alterar a região após a implantação?

Não, as regiões são fixas. Para alterar as regiões:

  1. Exclua o endpoint existente
  2. Crie um novo endpoint na região desejada

Como gerencio a implantação multi-região?

Para cobertura global:

  1. Implante em várias regiões
  2. Use um balanceador de carga ou roteamento DNS
  3. Encaminhe os usuários para o endpoint mais próximo

Qual é o tempo de inicialização a frio?

O tempo de inicialização a frio depende do tamanho do modelo e se o contentor já está armazenado em cache na região. Intervalos típicos:

CenárioCold Start
Contentor em cache~5-15 segundos
Primeira implementação/região~15-45 segundos

A verificação de integridade usa um tempo limite de 55 segundos para acomodar as piores situações de inicialização a frio.

Posso usar domínios personalizados?

Domínios personalizados estarão disponíveis em breve. Atualmente, os endpoints utilizam URLs geradas pela plataforma.



📅 Criado há 1 mês ✏️ Atualizado há 4 dias
glenn-jochersergiuwaxmann

Comentários