Zum Inhalt springen

Monitoring

Ultralytics Platform bietet umfassendes Monitoring für bereitgestellte Endpunkte. track Anforderungsmetriken, sehen Sie Logs ein und analysieren Sie die Performance in Echtzeit.

Überwachungs-Dashboard

Greifen Sie über die Seitenleiste auf das globale Monitoring-Dashboard zu:

  1. Klicken Sie in der Seitenleiste auf Monitoring
  2. Alle Bereitstellungen auf einen Blick anzeigen
  3. Klicken Sie auf einzelne Endpunkte für Details

Übersichtskarten

MetrikBeschreibung
GesamtanfragenAnfragen über alle Endpunkte (24h)
Aktive BereitstellungenAktuell laufende Endpunkte
FehlerrateProzentsatz fehlgeschlagener Anfragen
Durchschnittliche LatenzMittlere Antwortzeit

Bereitstellungstabelle

Alle Deployments mit Schlüsselmetriken anzeigen:

SpalteBeschreibung
ModellModellname mit Link
RegionBereitgestellte Region mit Flagge
StatusStatusanzeige (läuft/gestoppt)
AnfragenAnzahl der Anfragen (24h)
LatenzP50-Antwortzeit
FehlerAnzahl der Fehler (24h)
SparklineVisualisierung des Traffic-Trends

Echtzeit-Updates

Das Dashboard aktualisiert sich alle 30 Sekunden. Klicken Sie auf „Aktualisieren“ für sofortige Updates.

Endpunkt-Metriken

Detaillierte Metriken für einzelne Endpunkte anzeigen:

  1. Navigieren Sie zum Bereitstellen-Tab Ihres Modells
  2. Klicken Sie auf einen Endpunkt
  3. Das Metriken-Panel anzeigen

Verfügbare Metriken

MetrikBeschreibungEinheit
Anzahl der AnfragenGesamtzahl der Anfragen im ZeitverlaufAnzahl
Anfrage-LatenzVerteilung der Antwortzeitenms
FehlerrateProzentsatz fehlgeschlagener Anfragen%
Anzahl der InstanzenAktive Container-InstanzenAnzahl
CPU-AuslastungProzessornutzung%
SpeichernutzungRAM-VerbrauchMB

Zeitbereiche

Zeitbereich für Metriken auswählen:

BereichBeschreibung
1hLetzte Stunde
6hLetzte 6 Stunden
24hLetzte 24 Stunden (Standard)
7dLetzte 7 Tage

Metrik-Diagramme

Interaktive Diagramme zeigen:

  • Liniendiagramme für Trends im Zeitverlauf
  • Hovern für genaue Werte
  • Zoomen zur Analyse spezifischer Zeiträume

Logs

Anfrageprotokolle zur Fehlerbehebung anzeigen:

Log-Einträge

Jeder Protokolleintrag zeigt:

FeldBeschreibung
ZeitstempelAnfragezeit
SchweregradINFO, WARNING, ERROR
NachrichtProtokollinhalt
Anfrage-IDEindeutige Kennung

Schweregrade

Logs nach Schweregrad filtern:

LevelFarbeBeschreibung
INFOBlauNormale Anfragen
WARNUNGGelbNicht-kritische Probleme
FEHLERRotFehlgeschlagene Anfragen

Log-Filterung

Logs filtern, um Probleme zu finden:

  1. Schweregrad auswählen
  2. Nach Stichwort suchen
  3. Nach Zeitraum filtern

Alarme

Benachrichtigungen für Endpoint-Probleme einrichten (demnächst verfügbar):

BenachrichtigungstypAuslöser
Hohe FehlerrateFehlerrate > Schwellenwert
Hohe LatenzP95 Latenz > Schwellenwert
Keine AnfragenNull Anfragen für den Zeitraum
SkalierungInstanzen bei maximaler Kapazität

Leistungsoptimierung

Überwachungsdaten zur Optimierung nutzen:

Hohe Latenz

Wenn die Latenz zu hoch ist:

  1. Instanzenanzahl prüfen (ggf. erhöhen)
  2. Modellgröße auf Angemessenheit überprüfen
  3. Nähere Region in Betracht ziehen
  4. Gesendete Bildgrößen prüfen

Hohe Fehlerrate

Wenn Fehler auftreten:

  1. Fehlerprotokolle auf Details überprüfen
  2. Anfrageformat prüfen
  3. API-Schlüssel auf Gültigkeit überprüfen
  4. Ratenbegrenzungen prüfen

Skalierungsprobleme

Wenn die Kapazitätsgrenze erreicht ist:

  1. Maximale Instanzenanzahl erhöhen
  2. Minimale Instanzenanzahl > 0 setzen
  3. Mehrere Regionen in Betracht ziehen
  4. Anfrage-Batching optimieren

Daten exportieren

Überwachungsdaten zur Analyse exportieren:

  1. Zeitbereich auswählen
  2. Klicken Sie auf Exportieren
  3. CSV-Datei herunterladen

Export beinhaltet:

  • Zeitstempel
  • Anzahl der Anfragen
  • Latenzmetriken
  • Fehleranzahl
  • Instanzmetriken

FAQ

Wie lange werden Daten aufbewahrt?

DatentypAufbewahrung
Metriken30 Tage
Logs7 Tage
Alarme90 Tage

Kann ich externes Monitoring einrichten?

Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:

  • Uptime-Monitoring (Pingdom, UptimeRobot)
  • APM-Tools (Datadog, New Relic)
  • Benutzerdefinierte Health Checks

Wie genau sind die Latenzwerte?

Latenzmetriken messen:

  • P50: Mediane Antwortzeit
  • P95: 95. Perzentil
  • P99: 99. Perzentil

Diese Werte repräsentieren die serverseitige Verarbeitungszeit, exklusive der Netzwerklatenz zu Ihren Benutzern.

Warum sind meine Metriken verzögert?

Metriken weisen eine Verzögerung von ca. 2 Minuten auf aufgrund von:

  • Metrik-Aggregationspipeline
  • Aggregationsfenster
  • Dashboard-Caching

Für Echtzeit-Debugging prüfen Sie die Protokolle, die nahezu sofort verfügbar sind.

Kann ich mehrere Endpunkte gleichzeitig überwachen?

Ja, das globale Überwachungs-Dashboard zeigt alle Endpunkte an. Verwenden Sie die Tabelle, um die Leistung über verschiedene Bereitstellungen hinweg zu vergleichen.



📅 Erstellt vor 20 Tagen ✏️ Aktualisiert vor 20 Tagen
glenn-jocher

Kommentare