Zum Inhalt springen

Überwachung

Ultralytics bietet umfassende Überwachung für bereitgestellte Endpunkte. Verfolgen Sie Anforderungsmetriken, zeigen Sie Protokolle an und analysieren Sie die Leistung in Echtzeit.

Überwachungs-Dashboard

Greifen Sie über die Seitenleiste auf das globale Überwachungs-Dashboard zu:

  1. Klicken Sie in der Seitenleiste auf „Überwachung “.
  2. Alle Bereitstellungen auf einen Blick anzeigen
  3. Klicken Sie auf einzelne Endpunkte, um Details anzuzeigen.

Übersichtskarten

MetrikBeschreibung
Gesamtzahl der AnfragenAnfragen über alle Endpunkte hinweg (24 Stunden)
Aktive BereitstellungenDerzeit ausgeführte Endpunkte
FehlerquoteProzentualer Anteil fehlgeschlagener Anfragen
Durchschnittliche LatenzDurchschnittliche Reaktionszeit

Bereitstellungstabelle

Alle Bereitstellungen mit wichtigen Kennzahlen anzeigen:

SpalteBeschreibung
ModellModellname mit Link
RegionEingesetzte Region mit Flagge
StatusAnzeige für Betrieb/Stopp
AnfragenAnzahl der Anfragen (24 Stunden)
LatenzP50-Reaktionszeit
FehlerFehleranzahl (24h)
SparklineVisualisierung von Verkehrstrends

Echtzeit-Updates

Das Dashboard wird alle 30 Sekunden aktualisiert. Klicken Sie auf „Aktualisieren“, um sofortige Updates zu erhalten.

Endpunktmetriken

Detaillierte Metriken für einzelne Endpunkte anzeigen:

  1. Navigieren Sie zur Registerkarte „Bereitstellen“ Ihres Modells.
  2. Klicken Sie auf einen Endpunkt
  3. Das Metrik-Fenster anzeigen

Verfügbare Metriken

MetrikBeschreibungEinheit
Anzahl der AnfragenGesamtzahl der Anfragen im ZeitverlaufZählung
AnforderungslatenzVerteilung der Reaktionszeitenms
FehlerquoteProzentsatz fehlgeschlagener Anfragen%
Anzahl der InstanzenAktive ContainerinstanzenZählung
CPUProzessorauslastung%
SpeichernutzungRAM-VerbrauchMB

Zeitbereiche

Zeitbereich für Metriken auswählen:

BereichBeschreibung
1hLetzte Stunde
6hLetzte 6 Stunden
24hLetzte 24 Stunden (Standard)
7dLetzte 7 Tage

Metrische Tabellen

Interaktive Diagramme zeigen:

  • Liniendiagramme für Trends im Zeitverlauf
  • Für genaue Werte mit der Maus darüberfahren
  • Zoom zur Analyse bestimmter Zeiträume

Protokolle

Anforderungsprotokolle zur Fehlerbehebung anzeigen:

Protokolleinträge

Jeder Protokolleintrag zeigt:

FeldBeschreibung
ZeitstempelAnforderungszeit
SchweregradINFO, WARNUNG, FEHLER
NachrichtProtokollinhalt
Anforderungs-IDEindeutige Kennung

Schweregrade

Protokolle nach Schweregrad filtern:

StufeFarbeBeschreibung
INFOBlauNormale Anfragen
WARNUNGGelbUnkritische Probleme
FEHLERRotFehlgeschlagene Anfragen

Protokollfilterung

Filter Protokolle, um Probleme zu finden:

  1. Schweregrad auswählen
  2. Suche nach Stichwort
  3. Nach Zeitbereich filtern

Warnmeldungen

Benachrichtigungen für Endpunktprobleme einrichten (in Kürze verfügbar):

AlarmtypAuslöser
Hohe FehlerquoteFehlerquote > Schwellenwert
Hohe LatenzP95-Latenz > Schwellenwert
Keine AnfragenKeine Anfragen für den Zeitraum
SkalierungInstanzen bei maximaler Kapazität

Leistungsoptimierung

Verwenden Sie Überwachungsdaten zur Optimierung:

Hohe Latenz

Wenn die Latenz zu hoch ist:

  1. Anzahl der Instanzen überprüfen (möglicherweise sind mehr erforderlich)
  2. Überprüfen Sie, ob die Modellgröße angemessen ist.
  3. Nähere Region in Betracht ziehen
  4. Überprüfen Sie die Größe der gesendeten Bilder.

Hohe Fehlerquote

Wenn Fehler auftreten:

  1. Überprüfen Sie die Fehlerprotokolle auf Details.
  2. Überprüfen Sie das Anfrageformat
  3. Überprüfen Sie, ob der API-Schlüssel gültig ist.
  4. Ratenlimits überprüfen

Skalierungsprobleme

Bei Erreichen der Kapazität:

  1. Maximale Instanzen erhöhen
  2. Mindestanzahl an Instanzen > 0 festlegen
  3. Mehrere Regionen berücksichtigen
  4. Optimieren Sie die Stapelverarbeitung von Anfragen

Daten exportieren

Exportieren Sie Überwachungsdaten zur Analyse:

  1. Zeitbereich auswählen
  2. Klicken Sie auf „Exportieren“.
  3. CSV-Datei herunterladen

Der Export umfasst:

  • Zeitstempel
  • Anzahl der Anfragen
  • Latenzmetriken
  • Fehleranzahl
  • Instanzmetriken

FAQ

Wie lange werden Daten gespeichert?

DatentypKundenbindung
Metriken30 Tage
Protokolle7 Tage
Warnmeldungen90 Tage

Kann ich eine externe Überwachung einrichten?

Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:

  • Verfügbarkeitsüberwachung (Pingdom, UptimeRobot)
  • APM-Tools (Datadog, New Relic)
  • Benutzerdefinierte Gesundheitschecks

Wie genau sind die Latenzwerte?

Latenzmetriken messen:

  • P50: Mediane Reaktionszeit
  • P95: 95. Perzentil
  • P99: 99. Perzentil

Diese Werte beziehen sich auf die serverseitige Verarbeitungszeit, ohne Berücksichtigung der Netzwerklatenz für Ihre Benutzer.

Warum sind meine Metriken verzögert?

Die Metriken haben eine Verzögerung von ca. 2 Minuten aufgrund von:

  • Metrik-Aggregationspipeline
  • Aggregationsfenster
  • Dashboard-Caching

Für Echtzeit-Debugging überprüfen Sie die Protokolle, die nahezu sofort verfügbar sind.

Kann ich mehrere Endpunkte gleichzeitig überwachen?

Ja, das globale Überwachungs-Dashboard zeigt alle Endpunkte an. Verwenden Sie die Tabelle, um die Leistung verschiedener Bereitstellungen zu vergleichen.



📅 Erstellt vor 0 Tagen ✏️ Aktualisiert vor 0 Tagen
glenn-jocher

Kommentare