Monitoring
Ultralytics Platform bietet umfassendes Monitoring für bereitgestellte Endpunkte. track Anforderungsmetriken, sehen Sie Logs ein und analysieren Sie die Performance in Echtzeit.
Überwachungs-Dashboard
Greifen Sie über die Seitenleiste auf das globale Monitoring-Dashboard zu:
- Klicken Sie in der Seitenleiste auf Monitoring
- Alle Bereitstellungen auf einen Blick anzeigen
- Klicken Sie auf einzelne Endpunkte für Details
Übersichtskarten
| Metrik | Beschreibung |
|---|---|
| Gesamtanfragen | Anfragen über alle Endpunkte (24h) |
| Aktive Bereitstellungen | Aktuell laufende Endpunkte |
| Fehlerrate | Prozentsatz fehlgeschlagener Anfragen |
| Durchschnittliche Latenz | Mittlere Antwortzeit |
Bereitstellungstabelle
Alle Deployments mit Schlüsselmetriken anzeigen:
| Spalte | Beschreibung |
|---|---|
| Modell | Modellname mit Link |
| Region | Bereitgestellte Region mit Flagge |
| Status | Statusanzeige (läuft/gestoppt) |
| Anfragen | Anzahl der Anfragen (24h) |
| Latenz | P50-Antwortzeit |
| Fehler | Anzahl der Fehler (24h) |
| Sparkline | Visualisierung des Traffic-Trends |
Echtzeit-Updates
Das Dashboard aktualisiert sich alle 30 Sekunden. Klicken Sie auf „Aktualisieren“ für sofortige Updates.
Endpunkt-Metriken
Detaillierte Metriken für einzelne Endpunkte anzeigen:
- Navigieren Sie zum Bereitstellen-Tab Ihres Modells
- Klicken Sie auf einen Endpunkt
- Das Metriken-Panel anzeigen
Verfügbare Metriken
| Metrik | Beschreibung | Einheit |
|---|---|---|
| Anzahl der Anfragen | Gesamtzahl der Anfragen im Zeitverlauf | Anzahl |
| Anfrage-Latenz | Verteilung der Antwortzeiten | ms |
| Fehlerrate | Prozentsatz fehlgeschlagener Anfragen | % |
| Anzahl der Instanzen | Aktive Container-Instanzen | Anzahl |
| CPU-Auslastung | Prozessornutzung | % |
| Speichernutzung | RAM-Verbrauch | MB |
Zeitbereiche
Zeitbereich für Metriken auswählen:
| Bereich | Beschreibung |
|---|---|
| 1h | Letzte Stunde |
| 6h | Letzte 6 Stunden |
| 24h | Letzte 24 Stunden (Standard) |
| 7d | Letzte 7 Tage |
Metrik-Diagramme
Interaktive Diagramme zeigen:
- Liniendiagramme für Trends im Zeitverlauf
- Hovern für genaue Werte
- Zoomen zur Analyse spezifischer Zeiträume
Logs
Anfrageprotokolle zur Fehlerbehebung anzeigen:
Log-Einträge
Jeder Protokolleintrag zeigt:
| Feld | Beschreibung |
|---|---|
| Zeitstempel | Anfragezeit |
| Schweregrad | INFO, WARNING, ERROR |
| Nachricht | Protokollinhalt |
| Anfrage-ID | Eindeutige Kennung |
Schweregrade
Logs nach Schweregrad filtern:
| Level | Farbe | Beschreibung |
|---|---|---|
| INFO | Blau | Normale Anfragen |
| WARNUNG | Gelb | Nicht-kritische Probleme |
| FEHLER | Rot | Fehlgeschlagene Anfragen |
Log-Filterung
Logs filtern, um Probleme zu finden:
- Schweregrad auswählen
- Nach Stichwort suchen
- Nach Zeitraum filtern
Alarme
Benachrichtigungen für Endpoint-Probleme einrichten (demnächst verfügbar):
| Benachrichtigungstyp | Auslöser |
|---|---|
| Hohe Fehlerrate | Fehlerrate > Schwellenwert |
| Hohe Latenz | P95 Latenz > Schwellenwert |
| Keine Anfragen | Null Anfragen für den Zeitraum |
| Skalierung | Instanzen bei maximaler Kapazität |
Leistungsoptimierung
Überwachungsdaten zur Optimierung nutzen:
Hohe Latenz
Wenn die Latenz zu hoch ist:
- Instanzenanzahl prüfen (ggf. erhöhen)
- Modellgröße auf Angemessenheit überprüfen
- Nähere Region in Betracht ziehen
- Gesendete Bildgrößen prüfen
Hohe Fehlerrate
Wenn Fehler auftreten:
- Fehlerprotokolle auf Details überprüfen
- Anfrageformat prüfen
- API-Schlüssel auf Gültigkeit überprüfen
- Ratenbegrenzungen prüfen
Skalierungsprobleme
Wenn die Kapazitätsgrenze erreicht ist:
- Maximale Instanzenanzahl erhöhen
- Minimale Instanzenanzahl > 0 setzen
- Mehrere Regionen in Betracht ziehen
- Anfrage-Batching optimieren
Daten exportieren
Überwachungsdaten zur Analyse exportieren:
- Zeitbereich auswählen
- Klicken Sie auf Exportieren
- CSV-Datei herunterladen
Export beinhaltet:
- Zeitstempel
- Anzahl der Anfragen
- Latenzmetriken
- Fehleranzahl
- Instanzmetriken
FAQ
Wie lange werden Daten aufbewahrt?
| Datentyp | Aufbewahrung |
|---|---|
| Metriken | 30 Tage |
| Logs | 7 Tage |
| Alarme | 90 Tage |
Kann ich externes Monitoring einrichten?
Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:
- Uptime-Monitoring (Pingdom, UptimeRobot)
- APM-Tools (Datadog, New Relic)
- Benutzerdefinierte Health Checks
Wie genau sind die Latenzwerte?
Latenzmetriken messen:
- P50: Mediane Antwortzeit
- P95: 95. Perzentil
- P99: 99. Perzentil
Diese Werte repräsentieren die serverseitige Verarbeitungszeit, exklusive der Netzwerklatenz zu Ihren Benutzern.
Warum sind meine Metriken verzögert?
Metriken weisen eine Verzögerung von ca. 2 Minuten auf aufgrund von:
- Metrik-Aggregationspipeline
- Aggregationsfenster
- Dashboard-Caching
Für Echtzeit-Debugging prüfen Sie die Protokolle, die nahezu sofort verfügbar sind.
Kann ich mehrere Endpunkte gleichzeitig überwachen?
Ja, das globale Überwachungs-Dashboard zeigt alle Endpunkte an. Verwenden Sie die Tabelle, um die Leistung über verschiedene Bereitstellungen hinweg zu vergleichen.