Terminaux dédiés
Ultralytics permet le déploiement de YOLO vers des points de terminaison dédiés dans 43 régions du monde. Chaque point de terminaison est un service à locataire unique avec mise à l'échelle automatique, URL personnalisées et surveillance indépendante.
Créer un point de terminaison
Déployer un modèle sur un point de terminaison dédié :
- Accédez à votre modèle
- Cliquez sur l'onglet Déployer.
- Sélectionnez une région sur la carte
- Cliquez sur Déployer
Sélection de la région
Choisissez parmi 43 régions dans le monde entier :
La carte interactive montre :
- Épingles de région: cliquez pour sélectionner
- Indicateurs de latence: Code couleur en fonction de la distance
- Green: <100ms
- Jaune : 100-200 ms
- Rouge : >200 ms
Tableau régional
Voir toutes les régions avec détails :
| Colonne | Description |
|---|---|
| Région | Identifiant de région |
| Emplacement | Ville/pays |
| Latence | Temps de ping mesuré |
| Statut | Disponible/déployé |
Faites le bon choix
Sélectionnez la région la plus proche de vos utilisateurs pour bénéficier d'une latence minimale. Envisagez un déploiement dans plusieurs régions pour bénéficier d'une couverture mondiale.
Régions disponibles
Amériques (15 régions)
| Région | Emplacement |
|---|---|
| us-central1 | Iowa, États-Unis |
| us-est1 | Caroline du Sud, États-Unis |
| us-est4 | Virginie, États-Unis |
| us-est5 | Columbus, États-Unis |
| sud-est des États-Unis | Dallas, États-Unis |
| us-ouest1 | Oregon, États-Unis |
| us-ouest2 | Los Angeles, États-Unis |
| us-ouest3 | Salt Lake City, États-Unis |
| us-ouest4 | Las Vegas, États-Unis |
| Amérique du Nord - Nord-Est 1 | Montréal, Canada |
| Amérique du Nord - Nord-Est 2 | Toronto, Canada |
| Amérique du Sud-Est 1 | São Paulo, Brésil |
| Amérique du Sud - Ouest 1 | Santiago, Chili |
Europe (12 régions)
| Région | Emplacement |
|---|---|
| europe-central2 | Varsovie, Pologne |
| europe-nord1 | Finlande |
| europe-sud-ouest1 | Madrid, Espagne |
| europe-ouest1 | Belgique |
| europe-ouest2 | Londres, Royaume-Uni |
| europe-ouest3 | Francfort, Allemagne |
| europe-ouest4 | Pays-Bas |
| europe-ouest6 | Zurich, Suisse |
| europe-ouest8 | Milan, Italie |
| europe-ouest9 | Paris, France |
| europe-ouest10 | Berlin, Allemagne |
| europe-ouest12 | Turin, Italie |
Asie-Pacifique (16 régions)
| Région | Emplacement |
|---|---|
| asie-est1 | Taïwan |
| Asie-Est 2 | Hong Kong |
| Asie-Nord-Est1 | Tokyo, Japon |
| Asie-Nord-Est2 | Osaka, Japon |
| Asie-Nord-Est3 | Séoul, Corée |
| Asie-Sud 1 | Mumbai, Inde |
| Asie-Sud 2 | Delhi, Inde |
| Asie-Sud-Est1 | Singapour |
| Asie-Sud-Est 2 | Jakarta, Indonésie |
| australie-sud-est1 | Sydney, Australie |
| australie-sud-est2 | Melbourne, Australie |
| moi-central1 | Doha, Qatar |
| moi-central2 | Dammam, Arabie saoudite |
| moi-ouest1 | Tel Aviv, Israël |
Configuration des terminaux
Lors de la création d'un point de terminaison :
| Paramètre | Description | Par défaut |
|---|---|---|
| Région | Région de déploiement | - |
| Min Instances | Nombre minimum d'instances en cours d'exécution | 0 |
| Nombre maximal d'instances | Limite maximale de mise à l'échelle | 10 |
Options de mise à l'échelle
| Paramètre | Comportement |
|---|---|
| Min = 0 | Réduire à zéro en cas d'inactivité (rentable) |
| Min > 0 | Toujours allumé pour éviter les démarrages à froid |
| Max | Limite supérieure pour les pics de trafic |
Démarrages à froid
Avec min instances = 0, la première requête après une période d'inactivité déclenche un démarrage à froid (2 à 5 secondes). Définissez min > 0 pour les applications sensibles à la latence.
Gérer les terminaux
Affichez et gérez vos terminaux :
Détails du point final
| Champ | Description |
|---|---|
| URL | Point de terminaison HTTPS pour les requêtes |
| Région | Région déployée |
| Statut | En cours d'exécution, Arrêté, En cours de déploiement |
| Exemples | Nombre d'instances actuel/maximal |
URL du point de terminaison
Chaque point de terminaison dispose d'une URL unique :
https://model-abc123-us-central1.a.run.app
Cliquez sur le bouton Copier pour copier l'URL.
Gestion du cycle de vie
Contrôlez l'état de vos terminaux :
| Action | Description |
|---|---|
| Commencer | Reprendre un point de terminaison arrêté |
| Arrêtez | Suspendre le point de terminaison (pas de facturation) |
| Supprimer | Supprimer définitivement le point de terminaison |
Point d'arrêt
Arrêter un terminal pour suspendre la facturation :
- Ouvrir le menu des actions sur les points de terminaison
- Cliquez sur Arrêter
- Confirmer l'action
Points finaux arrêtés :
- N'acceptez pas les demandes
- Ne pas encourir de frais
- Peut être redémarré à tout moment
Supprimer le point de terminaison
Supprimer définitivement un terminal :
- Ouvrir le menu des actions sur les points de terminaison
- Cliquez sur Supprimer
- Confirmer la suppression
Action permanente
La suppression est immédiate et définitive. Vous pouvez toujours créer un nouveau point de terminaison.
Utilisation des points de terminaison
Authentification
Incluez votre clé API dans les requêtes :
Authorization: Bearer YOUR_API_KEY
Exemple de demande
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Format de réponse
Identique à l'inférence partagée avec des champs spécifiques à la tâche.
Tarification
Facture dédiée aux terminaux basée sur :
| Composant | Taux |
|---|---|
| CPU | Par vCPU-seconde |
| Mémoire | Par Go-seconde |
| Demandes | Par million de requêtes |
Optimisation des coûts
- Utilisez l'échelle zéro pour les points finaux de développement
- Définir le nombre maximal d'instances approprié
- Surveillez l'utilisation dans le tableau de bord de surveillance.
FAQ
Combien de points finaux puis-je créer ?
Il n'y a pas de limite stricte. Chaque modèle peut avoir des points de terminaison dans plusieurs régions. Le nombre total de points de terminaison dépend de votre forfait.
Puis-je changer de région après le déploiement ?
Non, les régions sont fixes. Pour changer de région :
- Supprimer le point de terminaison existant
- Créer un nouveau point de terminaison dans la région souhaitée
Comment gérer un déploiement multirégional ?
Pour une couverture mondiale :
- Déployer dans plusieurs régions
- Utilisez un équilibreur de charge ou un routage DNS.
- Diriger les utilisateurs vers le point d'arrivée le plus proche
Quelle est l'heure de démarrage à froid ?
Le démarrage à froid varie selon la taille du modèle :
| Modèle | Démarrage à froid |
|---|---|
| YOLO11n | ~2 secondes |
| YOLO11m | ~3 secondes |
| YOLO11x | ~5 secondes |
Définissez le nombre minimum d'instances > 0 pour éliminer les démarrages à froid.
Puis-je utiliser des domaines personnalisés ?
Les domaines personnalisés seront bientôt disponibles. Actuellement, les points de terminaison utilisent des URL générées par la plateforme.