Meet YOLO26: next-gen vision AI.

Link to this sectionSurveillance#

Ultralytics Platform fournit une surveillance pour tes endpoints déployés. Suis les métriques de tes requêtes, consulte les journaux et vérifie l'état de santé grâce à un sondage automatique.

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionTableau de bord des déploiements#

La page Deploy dans la barre latérale sert de tableau de bord de surveillance pour tous tes déploiements. Elle combine la carte du monde, les métriques globales et la gestion des déploiements en une seule vue. Consulte Dedicated Endpoints pour créer et gérer tes déploiements.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionCartes de synthèse#

Quatre cartes de synthèse en haut de la page affichent :

Ultralytics Platform Deploy Page Four Overview Cards

MétriqueDescription
Nombre total de requêtes (24h)Requêtes sur tous les endpoints
Déploiements actifsEndpoints en cours d'exécution
Taux d'erreur (24h)Pourcentage de requêtes ayant échoué
Latence P95 (24h)95e centile du temps de réponse
Alerte de taux d'erreur

La carte du taux d'erreur se met en surbrillance rouge lorsque le taux dépasse 5 %. Vérifie l'onglet Logs sur les déploiements individuels pour diagnostiquer les erreurs.

Link to this sectionCarte du monde#

La carte du monde interactive montre :

  • Épingles de région pour les 43 régions disponibles
  • Épingles vertes pour les régions déployées
  • Épingles bleues animées pour les régions avec des déploiements actifs en cours
  • La taille des épingles varie en fonction de l'état du déploiement et de la latence

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionListe des déploiements#

Sous les cartes de synthèse, la liste des déploiements montre tous les endpoints de tes projets. Utilise le sélecteur de mode de vue pour basculer entre :

VueDescription
CartesDes cartes de détail complètes avec des onglets pour les métriques, les journaux, le code et la prédiction
CompactUne grille de cartes plus petites (1-4 colonnes) avec des métriques clés
TableauUn DataTable avec des colonnes triables : Nom, Région, État, Requêtes, P95, Erreurs
Mises à jour en temps réel

Le tableau de bord interroge l'état des déploiements toutes les 15 secondes. Lorsque les déploiements sont dans un état transitoire (creating, deploying ou stopping), l'interrogation passe à toutes les 3 secondes. Les graphiques de métriques se rafraîchissent toutes les 60 secondes. Clique sur le bouton de rafraîchissement pour des mises à jour immédiates.

Link to this sectionMétriques par déploiement#

Chaque carte de déploiement (en vue cartes) affiche des métriques en temps réel :

Link to this sectionLigne de métriques#

MétriqueDescription
RequêtesNombre de requêtes (24h) avec icône
Latence P9595e centile du temps de réponse
Taux d'erreurPourcentage de requêtes ayant échoué

Les métriques sont récupérées depuis l'API sparkline et se rafraîchissent toutes les 60 secondes.

Link to this sectionVérification de santé#

Les déploiements en cours d'exécution affichent un indicateur de santé :

IndicateurSignification
Cœur vertSain — affiche la latence de réponse
Cœur rougeNon sain — affiche un message d'erreur
Icône tournanteVérification de santé en cours

Les vérifications de santé réessaient automatiquement toutes les 20 secondes si l'état est non sain. Clique sur l'icône de rafraîchissement pour déclencher manuellement une vérification. La vérification utilise un délai d'attente de 55 secondes pour accommoder les démarrages à froid sur les endpoints à échelle zéro.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

Tolérance au démarrage à froid

La vérification de santé utilise un délai d'attente de 55 secondes pour prendre en compte les démarrages à froid sur les endpoints à échelle zéro (jusqu'à environ 45 secondes dans le pire des cas). Une fois l'endpoint réchauffé, les vérifications se terminent en quelques millisecondes.

Link to this sectionJournaux#

Chaque carte de déploiement comprend un onglet Logs pour visualiser les entrées récentes :

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionEntrées de journal#

Chaque entrée de journal montre :

ChampDescription
GravitéBarre codée par couleur (voir ci-dessous)
HorodatageHeure de la requête (format local)
MessageContenu du journal
Informations HTTPCode de statut et latence (si applicable)

Filtre les journaux par gravité en utilisant les boutons de filtre :

NiveauCouleurDescription
DEBUGGrisMessages de débogage
INFOBleuRequêtes normales
WARNINGJauneProblèmes non critiques
ERRORRougeRequêtes échouées
CRITICALRouge foncéDéfaillances critiques

L'interface affiche les 20 entrées les plus récentes. L'API utilise par défaut 50 entrées par requête (max 200).

Flux de travail de débogage

Lors de l'investigation des erreurs : clique d'abord sur Errors pour filtrer vers les entrées ERROR et WARNING, puis examine les horodatages et les codes de statut HTTP. Copie les journaux dans le presse-papiers pour les partager avec ton équipe.

Link to this sectionExemples de code#

Chaque carte de déploiement comprend un onglet Code montrant du code API prêt à l'emploi avec ton URL d'endpoint réelle et ta clé API :

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Identifiants pré-remplis

Lors de la visualisation de l'onglet Code sur la plateforme, ton URL d'endpoint et ta clé API sont automatiquement renseignées. Copie le code et exécute-le directement. Consulte API Keys pour générer une clé.

Link to this sectionInférence de déploiement#

L'onglet Predict sur chaque carte de déploiement fournit un panneau de prédiction intégré — la même interface que l'onglet Predict du modèle, mais qui exécute l'inférence via le point de terminaison de déploiement au lieu du service partagé. C'est utile pour tester un point de terminaison déployé directement depuis le navigateur. Consulte Inference pour les détails des paramètres et les formats de réponse.

Link to this sectionPoints de terminaison API#

Link to this sectionAperçu de la surveillance#

GET /api/monitoring

Renvoie des métriques agrégées pour tous les déploiements possédés par l'utilisateur authentifié. Sensible à l'espace de travail via le paramètre de requête optionnel owner.

Link to this sectionMétriques de déploiement#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Renvoie les données de sparkline et les métriques de résumé pour un déploiement spécifique. Intervalle de rafraîchissement : 60 secondes.

ParamètreTypeDescription
sparklineboolInclure les données de sparkline
rangecha'ne de caract'resPlage de temps : 1h, 6h, 24h, 7d ou 30d

Link to this sectionJournaux de déploiement#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Renvoie les entrées de journal récentes avec un filtre de sévérité optionnel et une pagination.

ParamètreTypeDescription
limitentierNombre maximal d'entrées à renvoyer (par défaut : 50, max : 200)
severitycha'ne de caract'resFiltre de sévérité séparé par des virgules
pageTokencha'ne de caract'resJeton de pagination de la réponse précédente

Link to this sectionSanté du déploiement#

GET /api/deployments/{deploymentId}/health

Renvoie l'état de santé avec la latence de réponse.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionOptimisation des performances#

Utilise les données de surveillance pour optimiser tes déploiements :

Si la latence est trop élevée :

  1. Vérifie le nombre d'instances (besoin potentiel d'en ajouter)
  2. Vérifie si la taille du modèle est appropriée
  3. Envisage une région plus proche
  4. Vérifie les tailles d'image envoyées
Réduction de la latence

Passe de imgsz=1280 à imgsz=640 pour une accélération d'environ 4x avec une perte de précision minime pour la plupart des cas d'utilisation. Déploie dans une région plus proche de tes utilisateurs pour une latence réseau plus faible.

Link to this sectionFAQ#

Link to this sectionCombien de temps les données sont-elles conservées ?#

Type de donnéesRétention
Metrics30 jours
Journaux7 jours

Link to this sectionPuis-je configurer une surveillance externe ?#

Oui, les URL des points de terminaison fonctionnent avec des outils de surveillance externes :

  • Surveillance de disponibilité (Pingdom, UptimeRobot)
  • Outils APM (Datadog, New Relic)
  • Vérifications de santé personnalisées via le point de terminaison /health

Link to this sectionQuelle est la précision des chiffres de latence ?#

Les métriques de latence mesurent :

  • P50 : Temps de réponse médian
  • P95 : 95e percentile
  • P99 : 99e percentile

Ceux-ci représentent le temps de traitement côté serveur, sans inclure la latence réseau vers tes utilisateurs.

Link to this sectionPourquoi mes métriques sont-elles retardées ?#

Les métriques ont un délai d'environ 2 minutes dû à :

  • Pipeline d'agrégation des métriques
  • Fenêtres d'agrégation
  • Mise en cache du tableau de bord

Pour un débogage en temps réel, vérifie les journaux qui sont quasi instantanés.

Link to this sectionPuis-je surveiller plusieurs points de terminaison ensemble ?#

Oui, la page de déploiements affiche tous les points de terminaison avec des cartes d'aperçu agrégées. Utilise la vue tableau pour comparer les performances entre les déploiements.

Commentaires