Passer au contenu

Points de terminaison dédiés

Ultralytics Platform permet le déploiement de modèles YOLO vers des points de terminaison dédiés dans 43 régions mondiales. Chaque point de terminaison est un service mono-locataire avec auto-mise à l'échelle, URL personnalisées et surveillance indépendante.

Créer un point de terminaison

Déployer un modèle vers un point de terminaison dédié :

  1. Accédez à votre modèle
  2. Cliquez sur l'onglet Déployer
  3. Sélectionnez une région sur la carte
  4. Cliquez sur Déployer

Sélection de la région

Choisissez parmi 43 régions du monde entier :

La carte interactive affiche :

  • Épingles de région : Cliquez pour sélectionner
  • Indicateurs de latence: Codés par couleur selon la distance
    • Green: <100ms
    • Jaune : 100-200 ms
    • Rouge : > 200 ms

Tableau des régions

Afficher toutes les régions avec les détails :

ColonneDescription
RégionIdentifiant de la région
EmplacementVille/pays
LatenceTemps de ping mesuré
StatutDisponible/déployé

Choisissez judicieusement

Sélectionnez la région la plus proche de vos utilisateurs pour une latence minimale. Envisagez un déploiement dans plusieurs régions pour une couverture mondiale.

Régions disponibles

Amériques (14 régions)

ZoneEmplacement
us-central1Iowa, États-Unis
us-east1Caroline du Sud, États-Unis
us-east4Virginie, États-Unis
us-east5Ohio, États-Unis
us-west1Oregon, États-Unis
us-west2Los Angeles, États-Unis
us-west3Salt Lake City, États-Unis
us-west4Las Vegas, États-Unis
us-south1Dallas, États-Unis
northamerica-northeast1Montréal, Canada
northamerica-northeast2Toronto, Canada
southamerica-east1São Paulo, Brésil
southamerica-west1Santiago, Chili

Europe (12 régions)

ZoneEmplacement
europe-west1Belgique
europe-west2Londres, Royaume-Uni
europe-west3Francfort, Allemagne
europe-west4Pays-Bas
europe-west6Zurich, Suisse
europe-west8Milan, Italie
europe-west9Paris, France
europe-west10Berlin, Allemagne
europe-west12Turin, Italie
europe-north1Finlande
europe-central2Varsovie, Pologne
europe-southwest1Madrid, Espagne

Asie-Pacifique (14 régions)

ZoneEmplacement
asia-east1Taïwan
asia-east2Hong Kong
asia-northeast1Tokyo, Japon
asia-northeast2Osaka, Japon
asia-northeast3Séoul, Corée du Sud
asia-south1Mumbai, Inde
asia-south2Delhi, Inde
asia-southeast1Singapour
asia-southeast2Jakarta, Indonésie
australia-southeast1Sydney, Australie
australia-southeast2Melbourne, Australie

Moyen-Orient et Afrique (3 régions)

ZoneEmplacement
me-central1Doha, Qatar
me-central2Dammam, Arabie Saoudite
me-west1Tel Aviv, Israël

Configuration du point de terminaison

Lors de la création d'un point de terminaison :

ParamètreDescriptionPar défaut
RégionRégion de déploiement-
Instances minimalesNombre minimal d'instances en cours d'exécution0
Instances maximalesLimite maximale de mise à l'échelle10

Options de mise à l'échelle

ParamètreComportement
Min = 0Mise à l'échelle à zéro en cas d'inactivité (économique)
Min > 0Toujours actif pour éviter les démarrages à froid
MaxLimite supérieure pour les pics de trafic

Démarrages à froid

Lorsque le nombre minimal d'instances est égal à 0, la première requête après une période d'inactivité déclenche un démarrage à froid (2-5 secondes). Définissez un minimum > 0 pour les applications sensibles à la latence.

Gérer les points de terminaison

Visualisez et gérez vos points de terminaison :

Détails du point de terminaison

ChampDescription
URLPoint de terminaison HTTPS pour les requêtes
RégionRégion de déploiement
StatutEn cours d'exécution, Arrêté, En déploiement
InstancesNombre d'instances actuel/maximal

URL du point de terminaison

Chaque point de terminaison possède une URL unique :

https://model-abc123-us-central1.a.run.app

Cliquez sur le bouton de copie pour copier l'URL.

Gestion du cycle de vie

Contrôlez l'état de votre point de terminaison :

ActionDescription
DémarrerRedémarrer un point de terminaison arrêté
ArrêterMettre le point de terminaison en pause (pas de facturation)
SupprimerSupprimer définitivement le point de terminaison

Arrêter le point de terminaison

Arrêtez un point de terminaison pour suspendre la facturation :

  1. Ouvrir le menu des actions du point de terminaison
  2. Cliquez sur Arrêter
  3. Confirmer l'action

Points de terminaison arrêtés :

  • N'acceptent pas les requêtes
  • N'engendrez pas de frais
  • Peut être redémarré à tout moment

Supprimer le point de terminaison

Supprimer définitivement un point de terminaison :

  1. Ouvrir le menu des actions du point de terminaison
  2. Cliquez sur Supprimer
  3. Confirmer la suppression

Action permanente

La suppression est immédiate et permanente. Vous pouvez toujours créer un nouveau point de terminaison.

Utilisation des points de terminaison

Authentification

Inclure votre clé API dans les requêtes :

Authorization: Bearer YOUR_API_KEY

Exemple de requête

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Format de réponse

Identique à l'inférence partagée avec des champs spécifiques à la tâche.

Tarification

Les points de terminaison dédiés sont facturés en fonction de :

ComposantTarif
CPUPar vCPU-seconde
MémoirePar Go-seconde
RequêtesPar million de requêtes

Optimisation des coûts

  • Utilisez la mise à l'échelle à zéro pour les points de terminaison de développement
  • Définissez un nombre maximal d'instances approprié
  • Surveillez l'utilisation dans le tableau de bord Monitoring

FAQ

Combien de points de terminaison puis-je créer ?

Il n'y a pas de limite stricte. Chaque modèle peut avoir des points de terminaison dans plusieurs régions. Le nombre total de points de terminaison dépend de votre forfait.

Puis-je modifier la région après le déploiement ?

Non, les régions sont fixes. Pour modifier les régions :

  1. Supprimez le point de terminaison existant
  2. Créez un nouveau point de terminaison dans la région souhaitée

Comment gérer le déploiement multi-régions ?

Pour une couverture mondiale :

  1. Déployer dans plusieurs régions
  2. Utilisez un équilibreur de charge ou le routage DNS
  3. Dirigez les utilisateurs vers le point de terminaison le plus proche

Quel est le temps de démarrage à froid ?

Le démarrage à froid varie en fonction de la taille du modèle :

ModèleDémarrage à froid
YOLO26n~2 secondes
YOLO26m~3 secondes
YOLO26x~5 secondes

Définissez un nombre minimal d'instances > 0 pour éliminer les démarrages à froid.

Puis-je utiliser des noms de domaine personnalisés ?

Les domaines personnalisés seront bientôt disponibles. Actuellement, les points de terminaison utilisent des URL générées par la plateforme.



📅 Créé il y a 20 jours ✏️ Mis à jour il y a 14 jours
glenn-jocher

Commentaires