Passer au contenu

Surveillance

La plateforme Ultralytics offre une surveillance complète pour les points de terminaison déployés. track les métriques de requête, visualisez les journaux et analysez les performances en temps réel.

Tableau de bord de surveillance

Accédez au tableau de bord de surveillance global depuis la barre latérale :

  1. Cliquez sur Surveillance dans la barre latérale
  2. Visualiser tous les déploiements en un coup d'œil
  3. Cliquez sur les points de terminaison individuels pour obtenir des détails

Cartes d'aperçu

MétriqueDescription
Requêtes totalesRequêtes sur tous les points de terminaison (24h)
Déploiements actifsPoints de terminaison en cours d'exécution
Taux d'erreurPourcentage de requêtes échouées
Latence moyenneTemps de réponse moyen

Tableau des déploiements

Consulter tous les déploiements et leurs métriques clés :

ColonneDescription
ModèleNom du modèle avec lien
RégionRégion de déploiement avec drapeau
StatutIndicateur d'état (En cours/Arrêté)
RequêtesNombre de requêtes (24h)
LatenceTemps de réponse P50
ErreursNombre d'erreurs (24h)
SparklineVisualisation de la tendance du trafic

Mises à jour en temps réel

Le tableau de bord s'actualise toutes les 30 secondes. Cliquez sur « Actualiser » pour obtenir des mises à jour immédiates.

Métriques des points de terminaison

Consulter les métriques détaillées pour chaque point de terminaison :

  1. Accédez à l'onglet Déploiement de votre modèle
  2. Cliquez sur un point de terminaison
  3. Consulter le panneau des métriques

Métriques disponibles

MétriqueDescriptionUnité
Nombre de requêtesNombre total de requêtes au fil du tempsnombre
Latence des requêtesDistribution du temps de réponsems
Taux d'erreurPourcentage de requêtes échouées%
Nombre d'instancesInstances de conteneurs activesnombre
Utilisation du CPUUtilisation du processeur%
Utilisation de la mémoireConsommation de RAMMo

Plages temporelles

Sélectionner la plage horaire pour les métriques :

PlageDescription
1hDernière heure
6hDernières 6 heures
24hDernières 24 heures (par défaut)
7d7 derniers jours

Graphiques de métriques

Les graphiques interactifs affichent :

  • Graphiques linéaires pour les tendances au fil du temps
  • Survoler pour les valeurs exactes
  • Zoomer pour analyser des périodes spécifiques

Journaux

Afficher les journaux de requêtes pour le débogage :

Entrées de journal

Chaque entrée de journal affiche :

ChampDescription
HorodatageHeure de la requête
GravitéINFO, WARNING, ERROR
MessageContenu du journal
ID de requêteIdentifiant unique

Niveaux de gravité

Filtrer les journaux par gravité :

NiveauCouleurDescription
INFOBleuRequêtes normales
AVERTISSEMENTJauneProblèmes non critiques
ERREURRougeRequêtes échouées

Filtrage des journaux

Filtrer les journaux pour trouver des problèmes :

  1. Sélectionner le niveau de gravité
  2. Rechercher par mot-clé
  3. Filtrer par plage horaire

Alertes

Configurer des alertes pour les problèmes de point de terminaison (bientôt disponible) :

Type d'alerteDéclencheur
Taux d'erreur élevéTaux d'erreur > seuil
Latence élevéeLatence P95 > seuil
Aucune requêteZéro requête pour la période
Mise à l'échelleInstances à capacité maximale

Optimisation des performances

Utilisez les données de surveillance pour optimiser :

Latence élevée

Si la latence est trop élevée :

  1. Vérifiez le nombre d'instances (il pourrait être nécessaire d'en ajouter)
  2. Vérifiez que la taille du modèle est appropriée
  3. Envisagez une région plus proche
  4. Vérifiez la taille des images envoyées

Taux d'erreur élevé

Si des erreurs se produisent :

  1. Examinez les journaux d'erreurs pour plus de détails
  2. Vérifiez le format de la requête
  3. Vérifiez que la clé API est valide
  4. Vérifiez les limites de débit

Problèmes de mise à l'échelle

Si vous atteignez la capacité maximale :

  1. Augmentez le nombre maximal d'instances
  2. Définissez le nombre minimal d'instances > 0
  3. Envisagez plusieurs régions
  4. Optimisez le traitement par lots des requêtes

Exporter les données

Exportez les données de surveillance pour analyse :

  1. Sélectionnez la plage horaire
  2. Cliquer sur Exporter
  3. Téléchargez le fichier CSV

L'exportation comprend :

  • Horodatage
  • Nombre de requêtes
  • Métriques de latence
  • Nombre d'erreurs
  • Métriques d'instance

FAQ

Combien de temps les données sont-elles conservées ?

Type de donnéesRétention
Métriques30 jours
Journaux7 jours
Alertes90 jours

Puis-je configurer une surveillance externe ?

Oui, les URL des points de terminaison fonctionnent avec des outils de surveillance externes :

  • Surveillance de la disponibilité (Pingdom, UptimeRobot)
  • Outils APM (Datadog, New Relic)
  • Vérifications de l'état personnalisées

Quelle est la précision des chiffres de latence ?

Les métriques de latence mesurent :

  • P50 : Temps de réponse médian
  • P95 : 95e centile
  • P99 : 99e centile

Celles-ci représentent le temps de traitement côté serveur, sans inclure la latence réseau vers vos utilisateurs.

Pourquoi mes métriques sont-elles retardées ?

Les métriques présentent un délai d'environ 2 minutes en raison de :

  • Pipeline d'agrégation des métriques
  • Fenêtres d'agrégation
  • Mise en cache du tableau de bord

Pour le débogage en temps réel, consultez les journaux qui sont quasi instantanés.

Puis-je surveiller plusieurs points de terminaison simultanément ?

Oui, le tableau de bord de surveillance global affiche tous les points de terminaison. Utilisez le tableau pour comparer les performances entre les déploiements.



📅 Créé il y a 20 jours ✏️ Mis à jour il y a 20 jours
glenn-jocher

Commentaires