Surveillance
La plateforme Ultralytics offre une surveillance complète pour les points de terminaison déployés. track les métriques de requête, visualisez les journaux et analysez les performances en temps réel.
Tableau de bord de surveillance
Accédez au tableau de bord de surveillance global depuis la barre latérale :
- Cliquez sur Surveillance dans la barre latérale
- Visualiser tous les déploiements en un coup d'œil
- Cliquez sur les points de terminaison individuels pour obtenir des détails
Cartes d'aperçu
| Métrique | Description |
|---|---|
| Requêtes totales | Requêtes sur tous les points de terminaison (24h) |
| Déploiements actifs | Points de terminaison en cours d'exécution |
| Taux d'erreur | Pourcentage de requêtes échouées |
| Latence moyenne | Temps de réponse moyen |
Tableau des déploiements
Consulter tous les déploiements et leurs métriques clés :
| Colonne | Description |
|---|---|
| Modèle | Nom du modèle avec lien |
| Région | Région de déploiement avec drapeau |
| Statut | Indicateur d'état (En cours/Arrêté) |
| Requêtes | Nombre de requêtes (24h) |
| Latence | Temps de réponse P50 |
| Erreurs | Nombre d'erreurs (24h) |
| Sparkline | Visualisation de la tendance du trafic |
Mises à jour en temps réel
Le tableau de bord s'actualise toutes les 30 secondes. Cliquez sur « Actualiser » pour obtenir des mises à jour immédiates.
Métriques des points de terminaison
Consulter les métriques détaillées pour chaque point de terminaison :
- Accédez à l'onglet Déploiement de votre modèle
- Cliquez sur un point de terminaison
- Consulter le panneau des métriques
Métriques disponibles
| Métrique | Description | Unité |
|---|---|---|
| Nombre de requêtes | Nombre total de requêtes au fil du temps | nombre |
| Latence des requêtes | Distribution du temps de réponse | ms |
| Taux d'erreur | Pourcentage de requêtes échouées | % |
| Nombre d'instances | Instances de conteneurs actives | nombre |
| Utilisation du CPU | Utilisation du processeur | % |
| Utilisation de la mémoire | Consommation de RAM | Mo |
Plages temporelles
Sélectionner la plage horaire pour les métriques :
| Plage | Description |
|---|---|
| 1h | Dernière heure |
| 6h | Dernières 6 heures |
| 24h | Dernières 24 heures (par défaut) |
| 7d | 7 derniers jours |
Graphiques de métriques
Les graphiques interactifs affichent :
- Graphiques linéaires pour les tendances au fil du temps
- Survoler pour les valeurs exactes
- Zoomer pour analyser des périodes spécifiques
Journaux
Afficher les journaux de requêtes pour le débogage :
Entrées de journal
Chaque entrée de journal affiche :
| Champ | Description |
|---|---|
| Horodatage | Heure de la requête |
| Gravité | INFO, WARNING, ERROR |
| Message | Contenu du journal |
| ID de requête | Identifiant unique |
Niveaux de gravité
Filtrer les journaux par gravité :
| Niveau | Couleur | Description |
|---|---|---|
| INFO | Bleu | Requêtes normales |
| AVERTISSEMENT | Jaune | Problèmes non critiques |
| ERREUR | Rouge | Requêtes échouées |
Filtrage des journaux
Filtrer les journaux pour trouver des problèmes :
- Sélectionner le niveau de gravité
- Rechercher par mot-clé
- Filtrer par plage horaire
Alertes
Configurer des alertes pour les problèmes de point de terminaison (bientôt disponible) :
| Type d'alerte | Déclencheur |
|---|---|
| Taux d'erreur élevé | Taux d'erreur > seuil |
| Latence élevée | Latence P95 > seuil |
| Aucune requête | Zéro requête pour la période |
| Mise à l'échelle | Instances à capacité maximale |
Optimisation des performances
Utilisez les données de surveillance pour optimiser :
Latence élevée
Si la latence est trop élevée :
- Vérifiez le nombre d'instances (il pourrait être nécessaire d'en ajouter)
- Vérifiez que la taille du modèle est appropriée
- Envisagez une région plus proche
- Vérifiez la taille des images envoyées
Taux d'erreur élevé
Si des erreurs se produisent :
- Examinez les journaux d'erreurs pour plus de détails
- Vérifiez le format de la requête
- Vérifiez que la clé API est valide
- Vérifiez les limites de débit
Problèmes de mise à l'échelle
Si vous atteignez la capacité maximale :
- Augmentez le nombre maximal d'instances
- Définissez le nombre minimal d'instances > 0
- Envisagez plusieurs régions
- Optimisez le traitement par lots des requêtes
Exporter les données
Exportez les données de surveillance pour analyse :
- Sélectionnez la plage horaire
- Cliquer sur Exporter
- Téléchargez le fichier CSV
L'exportation comprend :
- Horodatage
- Nombre de requêtes
- Métriques de latence
- Nombre d'erreurs
- Métriques d'instance
FAQ
Combien de temps les données sont-elles conservées ?
| Type de données | Rétention |
|---|---|
| Métriques | 30 jours |
| Journaux | 7 jours |
| Alertes | 90 jours |
Puis-je configurer une surveillance externe ?
Oui, les URL des points de terminaison fonctionnent avec des outils de surveillance externes :
- Surveillance de la disponibilité (Pingdom, UptimeRobot)
- Outils APM (Datadog, New Relic)
- Vérifications de l'état personnalisées
Quelle est la précision des chiffres de latence ?
Les métriques de latence mesurent :
- P50 : Temps de réponse médian
- P95 : 95e centile
- P99 : 99e centile
Celles-ci représentent le temps de traitement côté serveur, sans inclure la latence réseau vers vos utilisateurs.
Pourquoi mes métriques sont-elles retardées ?
Les métriques présentent un délai d'environ 2 minutes en raison de :
- Pipeline d'agrégation des métriques
- Fenêtres d'agrégation
- Mise en cache du tableau de bord
Pour le débogage en temps réel, consultez les journaux qui sont quasi instantanés.
Puis-je surveiller plusieurs points de terminaison simultanément ?
Oui, le tableau de bord de surveillance global affiche tous les points de terminaison. Utilisez le tableau pour comparer les performances entre les déploiements.