Link to this sectionSurveillance#
Ultralytics Platform fournit une surveillance pour tes endpoints déployés. Suis les métriques de tes requêtes, consulte les journaux et vérifie l'état de santé grâce à un sondage automatique.

Link to this sectionTableau de bord des déploiements#
La page Deploy dans la barre latérale sert de tableau de bord de surveillance pour tous tes déploiements. Elle combine la carte du monde, les métriques globales et la gestion des déploiements en une seule vue. Consulte Dedicated Endpoints pour créer et gérer tes déploiements.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this sectionCartes de synthèse#
Quatre cartes de synthèse en haut de la page affichent :

| Métrique | Description |
|---|---|
| Nombre total de requêtes (24h) | Requêtes sur tous les endpoints |
| Déploiements actifs | Endpoints en cours d'exécution |
| Taux d'erreur (24h) | Pourcentage de requêtes ayant échoué |
| Latence P95 (24h) | 95e centile du temps de réponse |
La carte du taux d'erreur se met en surbrillance rouge lorsque le taux dépasse 5 %. Vérifie l'onglet Logs sur les déploiements individuels pour diagnostiquer les erreurs.
Link to this sectionCarte du monde#
La carte du monde interactive montre :
- Épingles de région pour les 43 régions disponibles
- Épingles vertes pour les régions déployées
- Épingles bleues animées pour les régions avec des déploiements actifs en cours
- La taille des épingles varie en fonction de l'état du déploiement et de la latence

Link to this sectionListe des déploiements#
Sous les cartes de synthèse, la liste des déploiements montre tous les endpoints de tes projets. Utilise le sélecteur de mode de vue pour basculer entre :
| Vue | Description |
|---|---|
| Cartes | Des cartes de détail complètes avec des onglets pour les métriques, les journaux, le code et la prédiction |
| Compact | Une grille de cartes plus petites (1-4 colonnes) avec des métriques clés |
| Tableau | Un DataTable avec des colonnes triables : Nom, Région, État, Requêtes, P95, Erreurs |
Le tableau de bord interroge l'état des déploiements toutes les 15 secondes. Lorsque les déploiements sont dans un état transitoire (creating, deploying ou stopping), l'interrogation passe à toutes les 3 secondes. Les graphiques de métriques se rafraîchissent toutes les 60 secondes. Clique sur le bouton de rafraîchissement pour des mises à jour immédiates.
Link to this sectionMétriques par déploiement#
Chaque carte de déploiement (en vue cartes) affiche des métriques en temps réel :
Link to this sectionLigne de métriques#
| Métrique | Description |
|---|---|
| Requêtes | Nombre de requêtes (24h) avec icône |
| Latence P95 | 95e centile du temps de réponse |
| Taux d'erreur | Pourcentage de requêtes ayant échoué |
Les métriques sont récupérées depuis l'API sparkline et se rafraîchissent toutes les 60 secondes.
Link to this sectionVérification de santé#
Les déploiements en cours d'exécution affichent un indicateur de santé :
| Indicateur | Signification |
|---|---|
| Cœur vert | Sain — affiche la latence de réponse |
| Cœur rouge | Non sain — affiche un message d'erreur |
| Icône tournante | Vérification de santé en cours |
Les vérifications de santé réessaient automatiquement toutes les 20 secondes si l'état est non sain. Clique sur l'icône de rafraîchissement pour déclencher manuellement une vérification. La vérification utilise un délai d'attente de 55 secondes pour accommoder les démarrages à froid sur les endpoints à échelle zéro.

La vérification de santé utilise un délai d'attente de 55 secondes pour prendre en compte les démarrages à froid sur les endpoints à échelle zéro (jusqu'à environ 45 secondes dans le pire des cas). Une fois l'endpoint réchauffé, les vérifications se terminent en quelques millisecondes.
Link to this sectionJournaux#
Chaque carte de déploiement comprend un onglet Logs pour visualiser les entrées récentes :

Link to this sectionEntrées de journal#
Chaque entrée de journal montre :
| Champ | Description |
|---|---|
| Gravité | Barre codée par couleur (voir ci-dessous) |
| Horodatage | Heure de la requête (format local) |
| Message | Contenu du journal |
| Informations HTTP | Code de statut et latence (si applicable) |
Filtre les journaux par gravité en utilisant les boutons de filtre :
| Niveau | Couleur | Description |
|---|---|---|
| DEBUG | Gris | Messages de débogage |
| INFO | Bleu | Requêtes normales |
| WARNING | Jaune | Problèmes non critiques |
| ERROR | Rouge | Requêtes échouées |
| CRITICAL | Rouge foncé | Défaillances critiques |
L'interface affiche les 20 entrées les plus récentes. L'API utilise par défaut 50 entrées par requête (max 200).
Lors de l'investigation des erreurs : clique d'abord sur Errors pour filtrer vers les entrées ERROR et WARNING, puis examine les horodatages et les codes de statut HTTP. Copie les journaux dans le presse-papiers pour les partager avec ton équipe.
Link to this sectionExemples de code#
Chaque carte de déploiement comprend un onglet Code montrant du code API prêt à l'emploi avec ton URL d'endpoint réelle et ta clé API :
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Lors de la visualisation de l'onglet Code sur la plateforme, ton URL d'endpoint et ta clé API sont automatiquement renseignées. Copie le code et exécute-le directement. Consulte API Keys pour générer une clé.
Link to this sectionInférence de déploiement#
L'onglet Predict sur chaque carte de déploiement fournit un panneau de prédiction intégré — la même interface que l'onglet Predict du modèle, mais qui exécute l'inférence via le point de terminaison de déploiement au lieu du service partagé. C'est utile pour tester un point de terminaison déployé directement depuis le navigateur. Consulte Inference pour les détails des paramètres et les formats de réponse.
Link to this sectionPoints de terminaison API#
Link to this sectionAperçu de la surveillance#
GET /api/monitoringRenvoie des métriques agrégées pour tous les déploiements possédés par l'utilisateur authentifié. Sensible à l'espace de travail via le paramètre de requête optionnel owner.
Link to this sectionMétriques de déploiement#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hRenvoie les données de sparkline et les métriques de résumé pour un déploiement spécifique. Intervalle de rafraîchissement : 60 secondes.
| Paramètre | Type | Description |
|---|---|---|
sparkline | bool | Inclure les données de sparkline |
range | cha'ne de caract'res | Plage de temps : 1h, 6h, 24h, 7d ou 30d |
Link to this sectionJournaux de déploiement#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGRenvoie les entrées de journal récentes avec un filtre de sévérité optionnel et une pagination.
| Paramètre | Type | Description |
|---|---|---|
limit | entier | Nombre maximal d'entrées à renvoyer (par défaut : 50, max : 200) |
severity | cha'ne de caract'res | Filtre de sévérité séparé par des virgules |
pageToken | cha'ne de caract'res | Jeton de pagination de la réponse précédente |
Link to this sectionSanté du déploiement#
GET /api/deployments/{deploymentId}/healthRenvoie l'état de santé avec la latence de réponse.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionOptimisation des performances#
Utilise les données de surveillance pour optimiser tes déploiements :
Si la latence est trop élevée :
- Vérifie le nombre d'instances (besoin potentiel d'en ajouter)
- Vérifie si la taille du modèle est appropriée
- Envisage une région plus proche
- Vérifie les tailles d'image envoyées
Passe de imgsz=1280 à imgsz=640 pour une accélération d'environ 4x avec une perte de précision minime pour la plupart des cas d'utilisation. Déploie dans une région plus proche de tes utilisateurs pour une latence réseau plus faible.
Link to this sectionFAQ#
Link to this sectionCombien de temps les données sont-elles conservées ?#
| Type de données | Rétention |
|---|---|
| Metrics | 30 jours |
| Journaux | 7 jours |
Link to this sectionPuis-je configurer une surveillance externe ?#
Oui, les URL des points de terminaison fonctionnent avec des outils de surveillance externes :
- Surveillance de disponibilité (Pingdom, UptimeRobot)
- Outils APM (Datadog, New Relic)
- Vérifications de santé personnalisées via le point de terminaison
/health
Link to this sectionQuelle est la précision des chiffres de latence ?#
Les métriques de latence mesurent :
- P50 : Temps de réponse médian
- P95 : 95e percentile
- P99 : 99e percentile
Ceux-ci représentent le temps de traitement côté serveur, sans inclure la latence réseau vers tes utilisateurs.
Link to this sectionPourquoi mes métriques sont-elles retardées ?#
Les métriques ont un délai d'environ 2 minutes dû à :
- Pipeline d'agrégation des métriques
- Fenêtres d'agrégation
- Mise en cache du tableau de bord
Pour un débogage en temps réel, vérifie les journaux qui sont quasi instantanés.
Link to this sectionPuis-je surveiller plusieurs points de terminaison ensemble ?#
Oui, la page de déploiements affiche tous les points de terminaison avec des cartes d'aperçu agrégées. Utilise la vue tableau pour comparer les performances entre les déploiements.