Surveillance
Ultralytics assure une surveillance complète des terminaux déployés. Suivez les métriques des requêtes, consultez les journaux et analysez les performances en temps réel.
Tableau de bord de surveillance
Accédez au tableau de bord de surveillance global depuis la barre latérale :
- Cliquez sur Surveillance dans la barre latérale.
- Voir tous les déploiements en un coup d'œil
- Cliquez sur chaque point final pour plus de détails.
Cartes récapitulatives
| Métrique | Description |
|---|---|
| Total des demandes | Demandes sur tous les points de terminaison (24 h) |
| Déploiements actifs | Terminaux actuellement en cours d'exécution |
| Taux d'erreur | Pourcentage de requêtes ayant échoué |
| Latence moyenne | Temps de réponse moyen |
Tableau des déploiements
Afficher tous les déploiements avec les indicateurs clés :
| Colonne | Description |
|---|---|
| Modèle | Nom du modèle avec lien |
| Région | Région déployée avec drapeau |
| Statut | Indicateur de fonctionnement/arrêt |
| Demandes | Nombre de demandes (24 h) |
| Latence | Temps de réponse P50 |
| Erreurs | Nombre d'erreurs (24 h) |
| Sparkline | Visualisation des tendances du trafic |
Mises à jour en temps réel
Le tableau de bord effectue un sondage toutes les 30 secondes. Cliquez sur « Actualiser » pour obtenir des mises à jour immédiates.
Mesures des points finaux
Afficher les mesures détaillées pour chaque point de terminaison :
- Accédez à l'onglet Déployer de votre modèle.
- Cliquez sur un point final
- Afficher le panneau des mesures
Mesures disponibles
| Métrique | Description | Unité |
|---|---|---|
| Nombre de demandes | Nombre total de demandes au fil du temps | compter |
| Latence des requêtes | Répartition des temps de réponse | ms |
| Taux d'erreur | Pourcentage de requêtes échouées | % |
| Nombre d'instances | Instances de conteneur actives | compter |
| CPU | Utilisation du processeur | % |
| Utilisation de la mémoire | Consommation de RAM | MB |
Plages horaires
Sélectionnez la période pour les indicateurs :
| Plage | Description |
|---|---|
| 1h | Dernière heure |
| 6h | 6 dernières heures |
| 24h | Dernières 24 heures (par défaut) |
| 7d | Les 7 derniers jours |
Tableaux métriques
Les graphiques interactifs montrent :
- Graphiques linéaires illustrant les tendances au fil du temps
- Survolez pour obtenir les valeurs exactes
- Zoom pour analyser des périodes spécifiques
Bûches
Afficher les journaux de requêtes pour le débogage :
Entrées du journal
Chaque entrée du journal indique :
| Champ | Description |
|---|---|
| Horodatage | Heure de la demande |
| Gravité | INFO, AVERTISSEMENT, ERREUR |
| Message | Contenu du journal |
| Identifiant de la demande | Identifiant unique |
Niveaux de gravité
Filtrer les journaux par gravité :
| Niveau | Couleur | Description |
|---|---|---|
| INFO | Bleu | Demandes normales |
| AVERTISSEMENT | Jaune | Problèmes non critiques |
| ERREUR | Rouge | Demandes échouées |
Filtrage des journaux
Filtrer les journaux pour trouver les problèmes :
- Sélectionnez le niveau de gravité
- Recherche par mot-clé
- Filtrer par plage horaire
Alertes
Configurer des alertes pour les problèmes liés aux terminaux (bientôt disponible) :
| Type d'alerte | Déclencheur |
|---|---|
| Taux d'erreur élevé | Taux d'erreur > seuil |
| Latence élevée | Latence P95 > seuil |
| Aucune demande | Aucune demande pour la période |
| Mise à l'échelle | Instances à capacité maximale |
Optimisation des performances
Utilisez les données de surveillance pour optimiser :
Latence élevée
Si la latence est trop élevée :
- Vérifier le nombre d'instances (il en faut peut-être davantage)
- Vérifiez que la taille du modèle est appropriée.
- Envisager une région plus proche
- Vérifier la taille des images envoyées
Taux d'erreur élevé
Si des erreurs se produisent :
- Consultez les journaux d'erreurs pour plus de détails.
- Vérifier le format de la demande
- Vérifier que la clé API est valide
- Vérifier les limites de débit
Problèmes d'échelle
Si capacité atteinte :
- Augmenter le nombre maximal d'instances
- Définir le nombre minimum d'instances > 0
- Envisager plusieurs régions
- Optimiser le regroupement des requêtes
Exporter les données
Exporter les données de surveillance pour analyse :
- Sélectionnez la période
- Cliquez sur Exporter
- Télécharger le fichier CSV
L'exportation comprend :
- Horodatage
- Nombre de demandes
- Mesures de latence
- Nombre d'erreurs
- Mesures d'instance
FAQ
Combien de temps les données sont-elles conservées ?
| Type de données | Rétention |
|---|---|
| Métriques | 30 jours |
| Bûches | 7 jours |
| Alertes | 90 jours |
Puis-je configurer une surveillance externe ?
Oui, les URL des points de terminaison fonctionnent avec les outils de surveillance externes :
- Surveillance de la disponibilité (Pingdom, UptimeRobot)
- Outils APM (Datadog, New Relic)
- Contrôles de santé personnalisés
Quelle est la précision des chiffres relatifs à la latence ?
Mesure des indicateurs de latence :
- P50: temps de réponse médian
- P95: 95e centile
- P99: 99e centile
Il s'agit du temps de traitement côté serveur, sans compter la latence réseau pour vos utilisateurs.
Pourquoi mes mesures sont-elles retardées ?
Les mesures ont un retard d'environ 2 minutes pour les raisons suivantes :
- Pipeline d'agrégation des métriques
- Fenêtres d'agrégation
- Mise en cache du tableau de bord
Pour un débogage en temps réel, consultez les journaux qui sont quasi instantanés.
Puis-je surveiller plusieurs terminaux à la fois ?
Oui, le tableau de bord de surveillance global affiche tous les points de terminaison. Utilisez le tableau pour comparer les performances entre les différents déploiements.