Link to this sectionTerminaux dédiés#
Ultralytics Platform permet le déploiement de modèles YOLO vers des points de terminaison dédiés dans 43 régions mondiales. Chaque point de terminaison est un service à locataire unique avec une mise à l'échelle vers zéro, une URL de point de terminaison unique et un suivi indépendant.

Link to this sectionCréer un point de terminaison#
Link to this sectionDepuis l'onglet Déployer#
Déploie un modèle depuis son onglet Deploy :
- Accède à ton modèle
- Clique sur l'onglet Deploy
- Sélectionne une région sur la carte interactive du monde — les régions sont codées par couleur selon la latence depuis ton emplacement sur un dégradé du vert au rouge (les régions les plus rapides sont vertes, les plus lentes sont rouges)
- Clique sur Deploy sur la ligne de la région
Le nom du déploiement est généré automatiquement à partir du nom du modèle et de la ville de la région (par ex., yolo26n-iowa).
Link to this sectionDepuis la page Déploiements#
Crée un déploiement depuis la page globale Deploy dans la barre latérale :
- Clique sur New Deployment
- Sélectionne un modèle dans le sélecteur de modèle
- Sélectionne une région sur la carte ou dans le tableau
- Vérifie le nom de déploiement généré automatiquement (modifiable) et les ressources par défaut
- Clique sur Deploy Model

Link to this sectionCycle de vie du déploiement#
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteLink to this sectionSélection de la région#
Choisis parmi 43 régions dans le monde. La carte interactive et le tableau des régions montrent :
- Repères de région : Codés par couleur selon la latence sur un dégradé du vert au rouge (les régions les plus rapides sont vertes, les plus lentes sont rouges)
- Régions déployées : Mises en évidence avec un badge "Deployed"
- Régions en cours de déploiement : Indicateur à impulsion animé
- Mise en évidence bidirectionnelle : Le survol sur la carte met en évidence la ligne du tableau, et vice versa

Le tableau des régions sur l'onglet Deploy du modèle inclut :
| Colonne | Description |
|---|---|
| Location | Ville et pays avec une icône de drapeau |
| Zone | Identifiant de la région |
| Latence | Temps de ping mesuré (médiane de 3 pings) |
| Distance | Distance depuis ton emplacement en km |
| Actions | Bouton Déployer ou badge d'état "Deployed" |
La boîte de dialogue New Deployment (depuis la page globale Deploy) affiche un tableau des régions plus simple avec uniquement les colonnes Location, Latency et Select.
Sélectionne la région la plus proche de tes utilisateurs pour une latence minimale. Utilise le bouton Rescan pour remesurer la latence depuis ton emplacement actuel.
Link to this sectionRégions disponibles#
| Zone | Emplacement |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | Caroline du Sud, USA |
| us-east4 | Virginie du Nord, USA |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| northamerica-northeast1 | Montréal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| northamerica-south1 | Queretaro, Mexique |
| southamerica-east1 | São Paulo, Brésil |
| southamerica-west1 | Santiago, Chili |
Link to this sectionConfiguration de l'endpoint#
Link to this sectionBoîte de dialogue Nouveau déploiement#
La boîte de dialogue New Deployment fournit :
| Paramètre | Description | Défaut |
|---|---|---|
| Modèle | Sélectionne parmi les modèles terminés | - |
| Région | Région du déploiement | - |
| Nom du déploiement | Généré automatiquement, modifiable | - |
| Cœurs CPU | Défaut fixe | 1 |
| Mémoire (Go) | Défaut fixe | 2 |

Les déploiements utilisent des valeurs par défaut fixes de 1 CPU, 2 GiB de mémoire, minInstances = 0 et maxInstances = 1. Ils passent à zéro en cas d'inactivité, tu ne paies donc que pour le temps d'inférence actif.
Le nom du déploiement est généré automatiquement à partir du nom du modèle et de la ville de la région (par exemple, yolo26n-iowa). Si tu déploies à nouveau le même modèle dans la même région, un suffixe numérique est ajouté (par exemple, yolo26n-iowa-2).
Link to this sectionOnglet Déploiement (Déploiement rapide)#
Lors d'un déploiement depuis l'onglet Deploy du modèle, les endpoints sont créés avec des ressources par défaut (1 CPU, 2 Go de mémoire) avec la mise à l'échelle à zéro activée. Le nom du déploiement est généré automatiquement.
Link to this sectionGérer les endpoints#
Link to this sectionModes d'affichage#
La liste des déploiements prend en charge trois modes d'affichage :
| Mode | Description |
|---|---|
| Cartes | Cartes détaillées avec journaux, exemples de code, panneau de prédiction |
| Compact | Grille de cartes plus petites avec des mesures clés |
| Tableau | Tableau de données (DataTable) avec colonnes triables et recherche |

Link to this sectionCarte de déploiement (Vue cartes)#
Chaque carte de déploiement dans la vue cartes affiche :
- En-tête : Nom, drapeau de la région, badge de statut, boutons démarrer/arrêter/supprimer
- URL de l'endpoint : URL copiable avec lien vers la documentation de l'API
- Métriques : Nombre de requêtes (24h), latence P95, taux d'erreur
- Contrôle de santé : Indicateur de santé en direct avec latence et rafraîchissement manuel
- Onglets :
Logs,CodeetPredict
L'onglet Logs affiche les entrées de journal récentes avec filtrage par gravité (Tous / Erreurs). L'onglet Code montre des exemples de code prêts à l'emploi en Python, JavaScript et cURL avec ton URL d'endpoint réelle et ta clé API. L'onglet Predict fournit un panneau de prédiction intégré pour effectuer des tests directement sur le déploiement.
Link to this sectionStatuts du déploiement#
| Statut | Description |
|---|---|
| Création | Le déploiement est en cours de configuration |
| Déploiement | Le conteneur est en cours de démarrage |
| Prêt | L'endpoint est actif et accepte les requêtes |
| Arrêt en cours | L'endpoint est en cours d'extinction |
| Arrêté | L'endpoint est en pause (pas de facturation) |
| Échoué | Le déploiement a échoué (voir le message d'erreur) |
Link to this sectionURL de l'endpoint#
Chaque endpoint possède une URL unique, par exemple :
https://predict-abc123.run.app

Clique sur le bouton de copie pour copier l'URL. Clique sur l'icône de documentation pour voir la documentation API générée automatiquement pour l'endpoint.
Link to this sectionGestion du cycle de vie#
Contrôle l'état de ton endpoint :
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Action | Description |
|---|---|
| Démarrer | Relancer un endpoint arrêté |
| Arrêter | Mettre l'endpoint en pause (pas de facturation) |
| Delete | Supprimer définitivement l'endpoint |
Link to this sectionArrêter l'endpoint#
Arrête un endpoint pour suspendre la facturation :
- Clique sur l'icône de pause sur la carte de déploiement
- Le statut de l'endpoint passe à "Arrêt en cours" puis "Arrêté"
Endpoints arrêtés :
- N'acceptent pas les requêtes
- N'engendrent pas de frais
- Peuvent être redémarrés à tout moment
Link to this sectionSupprimer l'endpoint#
Supprimer définitivement un endpoint :
- Clique sur l'icône de suppression (corbeille) sur la carte de déploiement
- Confirme la suppression dans la boîte de dialogue
La suppression est immédiate et irréversible. Tu peux toujours créer un nouvel endpoint.
Link to this sectionUtiliser les endpoints#
Link to this sectionAuthentification#
Chaque déploiement est créé avec une clé API liée à ton compte. Inclus-la dans tes requêtes :
Authorization: Bearer YOUR_API_KEYLe préfixe de la clé API est affiché dans le pied de page de la carte de déploiement pour identification. Génère des clés depuis API Keys.
Link to this sectionPas de limites de débit#
Les requêtes envoyées directement à l'URL de ton endpoint dédié ne sont pas soumises aux limites de débit de la Platform API — le débit est limité uniquement par le CPU, la mémoire et la configuration de mise à l'échelle de ton endpoint. (Les requêtes transmises via la Platform API, telles que le testeur intégré au navigateur, utilisent toujours la limite standard de 20 requêtes/min pour la prédiction.) C'est un avantage clé par rapport à l'inférence partagée, qui est limitée à 20 requêtes/min par clé API.
Link to this sectionExemple de requête#
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Link to this sectionParamètres de requête#
| Paramètre | Type | Défaut | Plage | Description |
|---|---|---|---|---|
file | fichier | - | - | Fichier image ou vidéo (obligatoire) |
conf | flottant | 0.25 | 0,01 – 1,0 | Seuil de confiance minimum |
iou | flottant | 0.7 | 0,0 – 0,95 | Seuil IoU NMS |
imgsz | entier | 640 | 32 – 1280 | Taille de l'image d'entrée en pixels |
normalize | bool | false | - | Retourne les coordonnées des boîtes englobantes entre 0 et 1 |
decimals | entier | 5 | 0 – 10 | Précision décimale pour les valeurs de coordonnées |
source | cha'ne de caract'res | - | - | URL d'image ou chaîne base64 (alternative au file) |
Les endpoints dédiés acceptent à la fois les images et les vidéos via le paramètre file.
- Formats d'image (jusqu'à 100 Mo) : AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Formats vidéo (jusqu'à 100 Mo) : ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Chaque image vidéo est traitée individuellement et les résultats sont renvoyés par image. Tu peux aussi passer une URL d'image publique ou une image encodée en base64 via le paramètre source au lieu de file.
Link to this sectionFormat de réponse#
Identique à l'inférence partagée avec des champs spécifiques à la tâche.
Link to this sectionTarification#
Les endpoints dédiés de base sont gratuits sur tous les plans. Les configurations à plus hautes ressources (plus de vCPU, plus de mémoire, démarrage à chaud) proposeront une tarification à l'usage à l'avenir.
- Utilise le passage à l'échelle vers zéro (par défaut) pour que les endpoints ne s'exécutent que lorsqu'ils reçoivent des requêtes
- Définit le nombre maximum d'instances approprié pour ton trafic
- Surveille l'utilisation dans le tableau de bord Monitoring
Link to this sectionFAQ#
Link to this sectionCombien d'endpoints puis-je créer ?#
Les limites des endpoints dépendent du plan :
- Gratuit : Jusqu'à 3 déploiements
- Pro : Jusqu'à 10 déploiements
- Enterprise : Déploiements illimités
Chaque modèle peut toujours être déployé dans plusieurs régions en fonction de ton quota de plan.
Link to this sectionPuis-je changer de région après le déploiement ?#
Non, les régions sont fixes. Pour changer de région :
- Supprime l'endpoint existant
- Crée un nouvel endpoint dans la région souhaitée
Link to this sectionComment gérer le déploiement multi-région ?#
Pour une couverture mondiale :
- Déploie dans plusieurs régions
- Utilise un équilibreur de charge ou un routage DNS
- Route les utilisateurs vers l'endpoint le plus proche
Link to this sectionQuel est le temps de démarrage à froid ?#
Le temps de démarrage à froid dépend de la taille du modèle et du fait que le conteneur soit déjà en cache dans la région. Plages typiques :
| Scénario | Démarrage à froid |
|---|---|
| Conteneur mis en cache | ~5-15 secondes |
| Premier déploiement/région | ~15-45 secondes |
La vérification de santé utilise un délai d'attente de 55 secondes pour accommoder les pires cas de démarrage à froid.
Link to this sectionPuis-je utiliser des domaines personnalisés ?#
Les domaines personnalisés arrivent bientôt. Actuellement, les endpoints utilisent des URL générées par la plateforme.