Überwachung
Ultralytics bietet umfassende Überwachung für bereitgestellte Endpunkte. Verfolgen Sie Anforderungsmetriken, zeigen Sie Protokolle an und analysieren Sie die Leistung in Echtzeit.
Überwachungs-Dashboard
Greifen Sie über die Seitenleiste auf das globale Überwachungs-Dashboard zu:
- Klicken Sie in der Seitenleiste auf „Überwachung “.
- Alle Bereitstellungen auf einen Blick anzeigen
- Klicken Sie auf einzelne Endpunkte, um Details anzuzeigen.
Übersichtskarten
| Metrik | Beschreibung |
|---|---|
| Gesamtzahl der Anfragen | Anfragen über alle Endpunkte hinweg (24 Stunden) |
| Aktive Bereitstellungen | Derzeit ausgeführte Endpunkte |
| Fehlerquote | Prozentualer Anteil fehlgeschlagener Anfragen |
| Durchschnittliche Latenz | Durchschnittliche Reaktionszeit |
Bereitstellungstabelle
Alle Bereitstellungen mit wichtigen Kennzahlen anzeigen:
| Spalte | Beschreibung |
|---|---|
| Modell | Modellname mit Link |
| Region | Eingesetzte Region mit Flagge |
| Status | Anzeige für Betrieb/Stopp |
| Anfragen | Anzahl der Anfragen (24 Stunden) |
| Latenz | P50-Reaktionszeit |
| Fehler | Fehleranzahl (24h) |
| Sparkline | Visualisierung von Verkehrstrends |
Echtzeit-Updates
Das Dashboard wird alle 30 Sekunden aktualisiert. Klicken Sie auf „Aktualisieren“, um sofortige Updates zu erhalten.
Endpunktmetriken
Detaillierte Metriken für einzelne Endpunkte anzeigen:
- Navigieren Sie zur Registerkarte „Bereitstellen“ Ihres Modells.
- Klicken Sie auf einen Endpunkt
- Das Metrik-Fenster anzeigen
Verfügbare Metriken
| Metrik | Beschreibung | Einheit |
|---|---|---|
| Anzahl der Anfragen | Gesamtzahl der Anfragen im Zeitverlauf | Zählung |
| Anforderungslatenz | Verteilung der Reaktionszeiten | ms |
| Fehlerquote | Prozentsatz fehlgeschlagener Anfragen | % |
| Anzahl der Instanzen | Aktive Containerinstanzen | Zählung |
| CPU | Prozessorauslastung | % |
| Speichernutzung | RAM-Verbrauch | MB |
Zeitbereiche
Zeitbereich für Metriken auswählen:
| Bereich | Beschreibung |
|---|---|
| 1h | Letzte Stunde |
| 6h | Letzte 6 Stunden |
| 24h | Letzte 24 Stunden (Standard) |
| 7d | Letzte 7 Tage |
Metrische Tabellen
Interaktive Diagramme zeigen:
- Liniendiagramme für Trends im Zeitverlauf
- Für genaue Werte mit der Maus darüberfahren
- Zoom zur Analyse bestimmter Zeiträume
Protokolle
Anforderungsprotokolle zur Fehlerbehebung anzeigen:
Protokolleinträge
Jeder Protokolleintrag zeigt:
| Feld | Beschreibung |
|---|---|
| Zeitstempel | Anforderungszeit |
| Schweregrad | INFO, WARNUNG, FEHLER |
| Nachricht | Protokollinhalt |
| Anforderungs-ID | Eindeutige Kennung |
Schweregrade
Protokolle nach Schweregrad filtern:
| Stufe | Farbe | Beschreibung |
|---|---|---|
| INFO | Blau | Normale Anfragen |
| WARNUNG | Gelb | Unkritische Probleme |
| FEHLER | Rot | Fehlgeschlagene Anfragen |
Protokollfilterung
Filter Protokolle, um Probleme zu finden:
- Schweregrad auswählen
- Suche nach Stichwort
- Nach Zeitbereich filtern
Warnmeldungen
Benachrichtigungen für Endpunktprobleme einrichten (in Kürze verfügbar):
| Alarmtyp | Auslöser |
|---|---|
| Hohe Fehlerquote | Fehlerquote > Schwellenwert |
| Hohe Latenz | P95-Latenz > Schwellenwert |
| Keine Anfragen | Keine Anfragen für den Zeitraum |
| Skalierung | Instanzen bei maximaler Kapazität |
Leistungsoptimierung
Verwenden Sie Überwachungsdaten zur Optimierung:
Hohe Latenz
Wenn die Latenz zu hoch ist:
- Anzahl der Instanzen überprüfen (möglicherweise sind mehr erforderlich)
- Überprüfen Sie, ob die Modellgröße angemessen ist.
- Nähere Region in Betracht ziehen
- Überprüfen Sie die Größe der gesendeten Bilder.
Hohe Fehlerquote
Wenn Fehler auftreten:
- Überprüfen Sie die Fehlerprotokolle auf Details.
- Überprüfen Sie das Anfrageformat
- Überprüfen Sie, ob der API-Schlüssel gültig ist.
- Ratenlimits überprüfen
Skalierungsprobleme
Bei Erreichen der Kapazität:
- Maximale Instanzen erhöhen
- Mindestanzahl an Instanzen > 0 festlegen
- Mehrere Regionen berücksichtigen
- Optimieren Sie die Stapelverarbeitung von Anfragen
Daten exportieren
Exportieren Sie Überwachungsdaten zur Analyse:
- Zeitbereich auswählen
- Klicken Sie auf „Exportieren“.
- CSV-Datei herunterladen
Der Export umfasst:
- Zeitstempel
- Anzahl der Anfragen
- Latenzmetriken
- Fehleranzahl
- Instanzmetriken
FAQ
Wie lange werden Daten gespeichert?
| Datentyp | Kundenbindung |
|---|---|
| Metriken | 30 Tage |
| Protokolle | 7 Tage |
| Warnmeldungen | 90 Tage |
Kann ich eine externe Überwachung einrichten?
Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:
- Verfügbarkeitsüberwachung (Pingdom, UptimeRobot)
- APM-Tools (Datadog, New Relic)
- Benutzerdefinierte Gesundheitschecks
Wie genau sind die Latenzwerte?
Latenzmetriken messen:
- P50: Mediane Reaktionszeit
- P95: 95. Perzentil
- P99: 99. Perzentil
Diese Werte beziehen sich auf die serverseitige Verarbeitungszeit, ohne Berücksichtigung der Netzwerklatenz für Ihre Benutzer.
Warum sind meine Metriken verzögert?
Die Metriken haben eine Verzögerung von ca. 2 Minuten aufgrund von:
- Metrik-Aggregationspipeline
- Aggregationsfenster
- Dashboard-Caching
Für Echtzeit-Debugging überprüfen Sie die Protokolle, die nahezu sofort verfügbar sind.
Kann ich mehrere Endpunkte gleichzeitig überwachen?
Ja, das globale Überwachungs-Dashboard zeigt alle Endpunkte an. Verwenden Sie die Tabelle, um die Leistung verschiedener Bereitstellungen zu vergleichen.