Passer au contenu

Surveillance

Ultralytics assure une surveillance complète des terminaux déployés. Suivez les métriques des requêtes, consultez les journaux et analysez les performances en temps réel.

Tableau de bord de surveillance

Accédez au tableau de bord de surveillance global depuis la barre latérale :

  1. Cliquez sur Surveillance dans la barre latérale.
  2. Voir tous les déploiements en un coup d'œil
  3. Cliquez sur chaque point final pour plus de détails.

Cartes récapitulatives

MétriqueDescription
Total des demandesDemandes sur tous les points de terminaison (24 h)
Déploiements actifsTerminaux actuellement en cours d'exécution
Taux d'erreurPourcentage de requêtes ayant échoué
Latence moyenneTemps de réponse moyen

Tableau des déploiements

Afficher tous les déploiements avec les indicateurs clés :

ColonneDescription
ModèleNom du modèle avec lien
RégionRégion déployée avec drapeau
StatutIndicateur de fonctionnement/arrêt
DemandesNombre de demandes (24 h)
LatenceTemps de réponse P50
ErreursNombre d'erreurs (24 h)
SparklineVisualisation des tendances du trafic

Mises à jour en temps réel

Le tableau de bord effectue un sondage toutes les 30 secondes. Cliquez sur « Actualiser » pour obtenir des mises à jour immédiates.

Mesures des points finaux

Afficher les mesures détaillées pour chaque point de terminaison :

  1. Accédez à l'onglet Déployer de votre modèle.
  2. Cliquez sur un point final
  3. Afficher le panneau des mesures

Mesures disponibles

MétriqueDescriptionUnité
Nombre de demandesNombre total de demandes au fil du tempscompter
Latence des requêtesRépartition des temps de réponsems
Taux d'erreurPourcentage de requêtes échouées%
Nombre d'instancesInstances de conteneur activescompter
CPUUtilisation du processeur%
Utilisation de la mémoireConsommation de RAMMB

Plages horaires

Sélectionnez la période pour les indicateurs :

PlageDescription
1hDernière heure
6h6 dernières heures
24hDernières 24 heures (par défaut)
7dLes 7 derniers jours

Tableaux métriques

Les graphiques interactifs montrent :

  • Graphiques linéaires illustrant les tendances au fil du temps
  • Survolez pour obtenir les valeurs exactes
  • Zoom pour analyser des périodes spécifiques

Bûches

Afficher les journaux de requêtes pour le débogage :

Entrées du journal

Chaque entrée du journal indique :

ChampDescription
HorodatageHeure de la demande
GravitéINFO, AVERTISSEMENT, ERREUR
MessageContenu du journal
Identifiant de la demandeIdentifiant unique

Niveaux de gravité

Filtrer les journaux par gravité :

NiveauCouleurDescription
INFOBleuDemandes normales
AVERTISSEMENTJauneProblèmes non critiques
ERREURRougeDemandes échouées

Filtrage des journaux

Filtrer les journaux pour trouver les problèmes :

  1. Sélectionnez le niveau de gravité
  2. Recherche par mot-clé
  3. Filtrer par plage horaire

Alertes

Configurer des alertes pour les problèmes liés aux terminaux (bientôt disponible) :

Type d'alerteDéclencheur
Taux d'erreur élevéTaux d'erreur > seuil
Latence élevéeLatence P95 > seuil
Aucune demandeAucune demande pour la période
Mise à l'échelleInstances à capacité maximale

Optimisation des performances

Utilisez les données de surveillance pour optimiser :

Latence élevée

Si la latence est trop élevée :

  1. Vérifier le nombre d'instances (il en faut peut-être davantage)
  2. Vérifiez que la taille du modèle est appropriée.
  3. Envisager une région plus proche
  4. Vérifier la taille des images envoyées

Taux d'erreur élevé

Si des erreurs se produisent :

  1. Consultez les journaux d'erreurs pour plus de détails.
  2. Vérifier le format de la demande
  3. Vérifier que la clé API est valide
  4. Vérifier les limites de débit

Problèmes d'échelle

Si capacité atteinte :

  1. Augmenter le nombre maximal d'instances
  2. Définir le nombre minimum d'instances > 0
  3. Envisager plusieurs régions
  4. Optimiser le regroupement des requêtes

Exporter les données

Exporter les données de surveillance pour analyse :

  1. Sélectionnez la période
  2. Cliquez sur Exporter
  3. Télécharger le fichier CSV

L'exportation comprend :

  • Horodatage
  • Nombre de demandes
  • Mesures de latence
  • Nombre d'erreurs
  • Mesures d'instance

FAQ

Combien de temps les données sont-elles conservées ?

Type de donnéesRétention
Métriques30 jours
Bûches7 jours
Alertes90 jours

Puis-je configurer une surveillance externe ?

Oui, les URL des points de terminaison fonctionnent avec les outils de surveillance externes :

  • Surveillance de la disponibilité (Pingdom, UptimeRobot)
  • Outils APM (Datadog, New Relic)
  • Contrôles de santé personnalisés

Quelle est la précision des chiffres relatifs à la latence ?

Mesure des indicateurs de latence :

  • P50: temps de réponse médian
  • P95: 95e centile
  • P99: 99e centile

Il s'agit du temps de traitement côté serveur, sans compter la latence réseau pour vos utilisateurs.

Pourquoi mes mesures sont-elles retardées ?

Les mesures ont un retard d'environ 2 minutes pour les raisons suivantes :

  • Pipeline d'agrégation des métriques
  • Fenêtres d'agrégation
  • Mise en cache du tableau de bord

Pour un débogage en temps réel, consultez les journaux qui sont quasi instantanés.

Puis-je surveiller plusieurs terminaux à la fois ?

Oui, le tableau de bord de surveillance global affiche tous les points de terminaison. Utilisez le tableau pour comparer les performances entre les différents déploiements.



📅 Créé il y a 0 jour ✏️ Mis à jour il y a 0 jour
glenn-jocher

Commentaires