Points de terminaison dédiés
Ultralytics Platform permet le déploiement de modèles YOLO vers des points de terminaison dédiés dans 43 régions mondiales. Chaque point de terminaison est un service mono-locataire avec auto-mise à l'échelle, URL personnalisées et surveillance indépendante.
Créer un point de terminaison
Déployer un modèle vers un point de terminaison dédié :
- Accédez à votre modèle
- Cliquez sur l'onglet Déployer
- Sélectionnez une région sur la carte
- Cliquez sur Déployer
Sélection de la région
Choisissez parmi 43 régions du monde entier :
La carte interactive affiche :
- Épingles de région : Cliquez pour sélectionner
- Indicateurs de latence: Codés par couleur selon la distance
- Green: <100ms
- Jaune : 100-200 ms
- Rouge : > 200 ms
Tableau des régions
Afficher toutes les régions avec les détails :
| Colonne | Description |
|---|---|
| Région | Identifiant de la région |
| Emplacement | Ville/pays |
| Latence | Temps de ping mesuré |
| Statut | Disponible/déployé |
Choisissez judicieusement
Sélectionnez la région la plus proche de vos utilisateurs pour une latence minimale. Envisagez un déploiement dans plusieurs régions pour une couverture mondiale.
Régions disponibles
Amériques (14 régions)
| Zone | Emplacement |
|---|---|
| us-central1 | Iowa, États-Unis |
| us-east1 | Caroline du Sud, États-Unis |
| us-east4 | Virginie, États-Unis |
| us-east5 | Ohio, États-Unis |
| us-west1 | Oregon, États-Unis |
| us-west2 | Los Angeles, États-Unis |
| us-west3 | Salt Lake City, États-Unis |
| us-west4 | Las Vegas, États-Unis |
| us-south1 | Dallas, États-Unis |
| northamerica-northeast1 | Montréal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| southamerica-east1 | São Paulo, Brésil |
| southamerica-west1 | Santiago, Chili |
Europe (12 régions)
| Zone | Emplacement |
|---|---|
| europe-west1 | Belgique |
| europe-west2 | Londres, Royaume-Uni |
| europe-west3 | Francfort, Allemagne |
| europe-west4 | Pays-Bas |
| europe-west6 | Zurich, Suisse |
| europe-west8 | Milan, Italie |
| europe-west9 | Paris, France |
| europe-west10 | Berlin, Allemagne |
| europe-west12 | Turin, Italie |
| europe-north1 | Finlande |
| europe-central2 | Varsovie, Pologne |
| europe-southwest1 | Madrid, Espagne |
Asie-Pacifique (14 régions)
| Zone | Emplacement |
|---|---|
| asia-east1 | Taïwan |
| asia-east2 | Hong Kong |
| asia-northeast1 | Tokyo, Japon |
| asia-northeast2 | Osaka, Japon |
| asia-northeast3 | Séoul, Corée du Sud |
| asia-south1 | Mumbai, Inde |
| asia-south2 | Delhi, Inde |
| asia-southeast1 | Singapour |
| asia-southeast2 | Jakarta, Indonésie |
| australia-southeast1 | Sydney, Australie |
| australia-southeast2 | Melbourne, Australie |
Moyen-Orient et Afrique (3 régions)
| Zone | Emplacement |
|---|---|
| me-central1 | Doha, Qatar |
| me-central2 | Dammam, Arabie Saoudite |
| me-west1 | Tel Aviv, Israël |
Configuration du point de terminaison
Lors de la création d'un point de terminaison :
| Paramètre | Description | Par défaut |
|---|---|---|
| Région | Région de déploiement | - |
| Instances minimales | Nombre minimal d'instances en cours d'exécution | 0 |
| Instances maximales | Limite maximale de mise à l'échelle | 10 |
Options de mise à l'échelle
| Paramètre | Comportement |
|---|---|
| Min = 0 | Mise à l'échelle à zéro en cas d'inactivité (économique) |
| Min > 0 | Toujours actif pour éviter les démarrages à froid |
| Max | Limite supérieure pour les pics de trafic |
Démarrages à froid
Lorsque le nombre minimal d'instances est égal à 0, la première requête après une période d'inactivité déclenche un démarrage à froid (2-5 secondes). Définissez un minimum > 0 pour les applications sensibles à la latence.
Gérer les points de terminaison
Visualisez et gérez vos points de terminaison :
Détails du point de terminaison
| Champ | Description |
|---|---|
| URL | Point de terminaison HTTPS pour les requêtes |
| Région | Région de déploiement |
| Statut | En cours d'exécution, Arrêté, En déploiement |
| Instances | Nombre d'instances actuel/maximal |
URL du point de terminaison
Chaque point de terminaison possède une URL unique :
https://model-abc123-us-central1.a.run.app
Cliquez sur le bouton de copie pour copier l'URL.
Gestion du cycle de vie
Contrôlez l'état de votre point de terminaison :
| Action | Description |
|---|---|
| Démarrer | Redémarrer un point de terminaison arrêté |
| Arrêter | Mettre le point de terminaison en pause (pas de facturation) |
| Supprimer | Supprimer définitivement le point de terminaison |
Arrêter le point de terminaison
Arrêtez un point de terminaison pour suspendre la facturation :
- Ouvrir le menu des actions du point de terminaison
- Cliquez sur Arrêter
- Confirmer l'action
Points de terminaison arrêtés :
- N'acceptent pas les requêtes
- N'engendrez pas de frais
- Peut être redémarré à tout moment
Supprimer le point de terminaison
Supprimer définitivement un point de terminaison :
- Ouvrir le menu des actions du point de terminaison
- Cliquez sur Supprimer
- Confirmer la suppression
Action permanente
La suppression est immédiate et permanente. Vous pouvez toujours créer un nouveau point de terminaison.
Utilisation des points de terminaison
Authentification
Inclure votre clé API dans les requêtes :
Authorization: Bearer YOUR_API_KEY
Exemple de requête
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Format de réponse
Identique à l'inférence partagée avec des champs spécifiques à la tâche.
Tarification
Les points de terminaison dédiés sont facturés en fonction de :
| Composant | Tarif |
|---|---|
| CPU | Par vCPU-seconde |
| Mémoire | Par Go-seconde |
| Requêtes | Par million de requêtes |
Optimisation des coûts
- Utilisez la mise à l'échelle à zéro pour les points de terminaison de développement
- Définissez un nombre maximal d'instances approprié
- Surveillez l'utilisation dans le tableau de bord Monitoring
FAQ
Combien de points de terminaison puis-je créer ?
Il n'y a pas de limite stricte. Chaque modèle peut avoir des points de terminaison dans plusieurs régions. Le nombre total de points de terminaison dépend de votre forfait.
Puis-je modifier la région après le déploiement ?
Non, les régions sont fixes. Pour modifier les régions :
- Supprimez le point de terminaison existant
- Créez un nouveau point de terminaison dans la région souhaitée
Comment gérer le déploiement multi-régions ?
Pour une couverture mondiale :
- Déployer dans plusieurs régions
- Utilisez un équilibreur de charge ou le routage DNS
- Dirigez les utilisateurs vers le point de terminaison le plus proche
Quel est le temps de démarrage à froid ?
Le démarrage à froid varie en fonction de la taille du modèle :
| Modèle | Démarrage à froid |
|---|---|
| YOLO26n | ~2 secondes |
| YOLO26m | ~3 secondes |
| YOLO26x | ~5 secondes |
Définissez un nombre minimal d'instances > 0 pour éliminer les démarrages à froid.
Puis-je utiliser des noms de domaine personnalisés ?
Les domaines personnalisés seront bientôt disponibles. Actuellement, les points de terminaison utilisent des URL générées par la plateforme.