Passer au contenu

Terminaux dédiés

Ultralytics permet le déploiement de YOLO vers des points de terminaison dédiés dans 43 régions du monde. Chaque point de terminaison est un service à locataire unique avec mise à l'échelle automatique, URL personnalisées et surveillance indépendante.

Créer un point de terminaison

Déployer un modèle sur un point de terminaison dédié :

  1. Accédez à votre modèle
  2. Cliquez sur l'onglet Déployer.
  3. Sélectionnez une région sur la carte
  4. Cliquez sur Déployer

Sélection de la région

Choisissez parmi 43 régions dans le monde entier :

La carte interactive montre :

  • Épingles de région: cliquez pour sélectionner
  • Indicateurs de latence: Code couleur en fonction de la distance
    • Green: <100ms
    • Jaune : 100-200 ms
    • Rouge : >200 ms

Tableau régional

Voir toutes les régions avec détails :

ColonneDescription
RégionIdentifiant de région
EmplacementVille/pays
LatenceTemps de ping mesuré
StatutDisponible/déployé

Faites le bon choix

Sélectionnez la région la plus proche de vos utilisateurs pour bénéficier d'une latence minimale. Envisagez un déploiement dans plusieurs régions pour bénéficier d'une couverture mondiale.

Régions disponibles

Amériques (15 régions)

RégionEmplacement
us-central1Iowa, États-Unis
us-est1Caroline du Sud, États-Unis
us-est4Virginie, États-Unis
us-est5Columbus, États-Unis
sud-est des États-UnisDallas, États-Unis
us-ouest1Oregon, États-Unis
us-ouest2Los Angeles, États-Unis
us-ouest3Salt Lake City, États-Unis
us-ouest4Las Vegas, États-Unis
Amérique du Nord - Nord-Est 1Montréal, Canada
Amérique du Nord - Nord-Est 2Toronto, Canada
Amérique du Sud-Est 1São Paulo, Brésil
Amérique du Sud - Ouest 1Santiago, Chili

Europe (12 régions)

RégionEmplacement
europe-central2Varsovie, Pologne
europe-nord1Finlande
europe-sud-ouest1Madrid, Espagne
europe-ouest1Belgique
europe-ouest2Londres, Royaume-Uni
europe-ouest3Francfort, Allemagne
europe-ouest4Pays-Bas
europe-ouest6Zurich, Suisse
europe-ouest8Milan, Italie
europe-ouest9Paris, France
europe-ouest10Berlin, Allemagne
europe-ouest12Turin, Italie

Asie-Pacifique (16 régions)

RégionEmplacement
asie-est1Taïwan
Asie-Est 2Hong Kong
Asie-Nord-Est1Tokyo, Japon
Asie-Nord-Est2Osaka, Japon
Asie-Nord-Est3Séoul, Corée
Asie-Sud 1Mumbai, Inde
Asie-Sud 2Delhi, Inde
Asie-Sud-Est1Singapour
Asie-Sud-Est 2Jakarta, Indonésie
australie-sud-est1Sydney, Australie
australie-sud-est2Melbourne, Australie
moi-central1Doha, Qatar
moi-central2Dammam, Arabie saoudite
moi-ouest1Tel Aviv, Israël

Configuration des terminaux

Lors de la création d'un point de terminaison :

ParamètreDescriptionPar défaut
RégionRégion de déploiement-
Min InstancesNombre minimum d'instances en cours d'exécution0
Nombre maximal d'instancesLimite maximale de mise à l'échelle10

Options de mise à l'échelle

ParamètreComportement
Min = 0Réduire à zéro en cas d'inactivité (rentable)
Min > 0Toujours allumé pour éviter les démarrages à froid
MaxLimite supérieure pour les pics de trafic

Démarrages à froid

Avec min instances = 0, la première requête après une période d'inactivité déclenche un démarrage à froid (2 à 5 secondes). Définissez min > 0 pour les applications sensibles à la latence.

Gérer les terminaux

Affichez et gérez vos terminaux :

Détails du point final

ChampDescription
URLPoint de terminaison HTTPS pour les requêtes
RégionRégion déployée
StatutEn cours d'exécution, Arrêté, En cours de déploiement
ExemplesNombre d'instances actuel/maximal

URL du point de terminaison

Chaque point de terminaison dispose d'une URL unique :

https://model-abc123-us-central1.a.run.app

Cliquez sur le bouton Copier pour copier l'URL.

Gestion du cycle de vie

Contrôlez l'état de vos terminaux :

ActionDescription
CommencerReprendre un point de terminaison arrêté
ArrêtezSuspendre le point de terminaison (pas de facturation)
SupprimerSupprimer définitivement le point de terminaison

Point d'arrêt

Arrêter un terminal pour suspendre la facturation :

  1. Ouvrir le menu des actions sur les points de terminaison
  2. Cliquez sur Arrêter
  3. Confirmer l'action

Points finaux arrêtés :

  • N'acceptez pas les demandes
  • Ne pas encourir de frais
  • Peut être redémarré à tout moment

Supprimer le point de terminaison

Supprimer définitivement un terminal :

  1. Ouvrir le menu des actions sur les points de terminaison
  2. Cliquez sur Supprimer
  3. Confirmer la suppression

Action permanente

La suppression est immédiate et définitive. Vous pouvez toujours créer un nouveau point de terminaison.

Utilisation des points de terminaison

Authentification

Incluez votre clé API dans les requêtes :

Authorization: Bearer YOUR_API_KEY

Exemple de demande

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Format de réponse

Identique à l'inférence partagée avec des champs spécifiques à la tâche.

Tarification

Facture dédiée aux terminaux basée sur :

ComposantTaux
CPUPar vCPU-seconde
MémoirePar Go-seconde
DemandesPar million de requêtes

Optimisation des coûts

  • Utilisez l'échelle zéro pour les points finaux de développement
  • Définir le nombre maximal d'instances approprié
  • Surveillez l'utilisation dans le tableau de bord de surveillance.

FAQ

Combien de points finaux puis-je créer ?

Il n'y a pas de limite stricte. Chaque modèle peut avoir des points de terminaison dans plusieurs régions. Le nombre total de points de terminaison dépend de votre forfait.

Puis-je changer de région après le déploiement ?

Non, les régions sont fixes. Pour changer de région :

  1. Supprimer le point de terminaison existant
  2. Créer un nouveau point de terminaison dans la région souhaitée

Comment gérer un déploiement multirégional ?

Pour une couverture mondiale :

  1. Déployer dans plusieurs régions
  2. Utilisez un équilibreur de charge ou un routage DNS.
  3. Diriger les utilisateurs vers le point d'arrivée le plus proche

Quelle est l'heure de démarrage à froid ?

Le démarrage à froid varie selon la taille du modèle :

ModèleDémarrage à froid
YOLO11n~2 secondes
YOLO11m~3 secondes
YOLO11x~5 secondes

Définissez le nombre minimum d'instances > 0 pour éliminer les démarrages à froid.

Puis-je utiliser des domaines personnalisés ?

Les domaines personnalisés seront bientôt disponibles. Actuellement, les points de terminaison utilisent des URL générées par la plateforme.



📅 Créé il y a 0 jour ✏️ Mis à jour il y a 0 jour
glenn-jocher

Commentaires