Link to this sectionÜberwachung#

Q: Wie lange werden Daten aufbewahrt?

| Datentyp | Aufbewahrung | | ------------ | ------------ | | Metriken | 30 Tage | | Logs | 7 Tage |

Q: Wie genau sind die Latenzzahlen?

Latenzmetriken messen: P50: Median der Antwortzeit; P95: 95. Perzentil; P99: 99. Perzentil. Diese stellen die serverseitige Verarbeitungszeit dar, ohne die Netzwerklatenz zu deinen Benutzern.

Die Ultralytics Platform bietet eine Überwachung für bereitgestellte Endpunkte. Verfolge Anfragemetriken, sieh dir Logs an und prüfe den Gesundheitsstatus mit automatischer Abfrage.

Übersichtskarten und Weltkarte der Ultralytics Platform Deploy-Seite

Link to this sectionBereitstellungs-Dashboard#

Die Deploy-Seite in der Seitenleiste dient als Überwachungs-Dashboard für alle deine Bereitstellungen. Sie kombiniert die Weltkarte, Übersichtskennzahlen und das Bereitstellungsmanagement in einer Ansicht. Siehe Dedicated Endpoints zum Erstellen und Verwalten von Bereitstellungen.

graph TB
    subgraph Dashboard
        Map[World Map]:::proc --- Cards[Overview Cards]:::proc
        Cards --- List[Deployments List]:::decide
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]:::out
        Health[Health Check]:::out
        Logs[Logs Tab]:::out
        Code[Code Tab]:::out
        Predict[Predict Tab]:::out
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    classDef proc fill:#2196F3,color:#fff
    classDef decide fill:#FF9800,color:#fff
    classDef out fill:#9C27B0,color:#fff

Link to this sectionÜbersichtskarten#

Vier Zusammenfassungskarten oben auf der Seite zeigen:

Vier Übersichtskarten der Ultralytics Platform Deploy-Seite

Metrik	Beschreibung
Gesamtanfragen (24h)	Anfragen über alle Endpunkte hinweg
Aktive Bereitstellungen	Aktuell laufende Endpunkte
Fehlerrate (24h)	Prozentsatz der fehlgeschlagenen Anfragen
P95 Latenz (24h)	Antwortzeit des 95. Perzentils

Fehlerraten-Warnung

Die Fehlerraten-Karte leuchtet rot auf, wenn die Rate 5 % überschreitet. Überprüfe den Logs-Tab bei einzelnen Bereitstellungen, um Fehler zu diagnostizieren.

Link to this sectionWeltkarte#

Die interaktive Weltkarte zeigt:

Regions-Pins für alle 43 verfügbaren Regionen
Grüne Pins für bereitgestellte Regionen
Animierte blaue Pins für Regionen mit laufenden Bereitstellungen
Pin-Größe variiert je nach Bereitstellungsstatus und Latenz

Weltkarte der Ultralytics Platform Deploy-Seite mit bereitgestellten Regionen

Link to this sectionBereitstellungsliste#

Unter den Übersichtskarten zeigt die Bereitstellungsliste alle Endpunkte deiner Projekte. Nutze den Ansichtsmodus-Umschalter, um zwischen folgenden Optionen zu wechseln:

Ansicht	Beschreibung
Karten	Vollständige Detailkarten mit Metriken, Logs, Code- und Predict-Tabs
Kompakt	Raster aus kleineren Karten (1-4 Spalten) mit Schlüsselmetriken
Tabelle	Datentabelle mit sortierbaren Spalten: Name, Region, Status, Anfragen, P95, Fehler

Echtzeit-Updates

Das Dashboard fragt alle 15 Sekunden nach Updates zum Bereitstellungsstatus. Wenn sich Bereitstellungen in einem Übergangszustand befinden (creating, deploying oder stopping), erhöht sich die Abfragefrequenz auf alle 3 Sekunden. Metrik-Charts werden alle 60 Sekunden aktualisiert. Klicke auf den Aktualisierungs-Button für sofortige Updates.

Link to this sectionMetriken pro Bereitstellung#

Jede Bereitstellungskarte (in der Kartenansicht) zeigt Echtzeitmetriken:

Link to this sectionMetrik-Zeile#

Metrik	Beschreibung
Anfragen	Anfrageanzahl (24h) mit Icon
P95 Latenz	Antwortzeit des 95. Perzentils
Fehlerrate	Prozentsatz der fehlgeschlagenen Anfragen

Metriken werden vom Sparkline-API-Endpunkt abgerufen und alle 60 Sekunden aktualisiert.

Link to this sectionGesundheitsprüfung#

Laufende Bereitstellungen zeigen einen Gesundheitscheck-Indikator:

Indikator	Bedeutung
Grünes Herz	Gesund — zeigt Antwortlatenz
Rotes Herz	Ungesund — zeigt Fehlermeldung
Drehendes Icon	Gesundheitscheck läuft

Gesundheitschecks wiederholen sich automatisch alle 20 Sekunden, wenn ein ungesunder Status vorliegt. Klicke auf das Aktualisierungs-Icon, um manuell einen Gesundheitscheck auszulösen. Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten zu berücksichtigen.

Gesundheitscheck der Ultralytics Platform Deployment-Karte, gesund mit Latenz

Kaltstart-Toleranz

Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten (bis zu ~45 Sekunden im schlimmsten Fall) zu berücksichtigen. Sobald der Endpunkt aufgewärmt ist, schließen Gesundheitschecks in Millisekunden ab.

Link to this sectionLogs#

Jede Bereitstellungskarte enthält einen Logs-Tab zur Ansicht aktueller Log-Einträge:

Logs-Tab der Ultralytics Platform Deployment-Karte mit Schweregrad-Filter

Link to this sectionLog-Einträge#

Jeder Log-Eintrag zeigt:

Feld	Beschreibung
Schweregrad	Farbcodierter Balken (siehe unten)
Zeitstempel	Anfragezeit (lokales Format)
Nachricht	Log-Inhalt
HTTP-Info	Statuscode und Latenz (falls zutreffend)

Filtere Logs nach Schweregrad mithilfe der Filter-Buttons:

Ebene	Farbe	Beschreibung
DEBUG	Grau	Debug-Nachrichten
INFO	Blau	Normale Anfragen
WARNING	Gelb	Nicht-kritische Probleme
ERROR	Rot	Fehlgeschlagene Anfragen
CRITICAL	Dunkelrot	Kritische Fehler

Die UI zeigt die 20 aktuellsten Einträge. Die API verwendet standardmäßig 50 Einträge pro Anfrage (maximal 200).

Debugging-Workflow

Bei der Untersuchung von Fehlern: Klicke zuerst auf Errors, um nach ERROR- und WARNING-Einträgen zu filtern, und prüfe dann die Zeitstempel sowie HTTP-Statuscodes. Kopiere die Logs in die Zwischenablage, um sie mit deinem Team zu teilen.

Link to this sectionCode-Beispiele#

Jede Bereitstellungskarte enthält einen Code-Tab, der gebrauchsfertigen API-Code mit deiner tatsächlichen Endpunkt-URL und deinem API-Key anzeigt:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Automatisch ausgefüllte Anmeldedaten

Wenn du den Code-Tab auf der Plattform aufrufst, werden deine tatsächliche Endpunkt-URL und dein API-Key automatisch eingetragen. Kopiere den Code und führe ihn direkt aus. Siehe API Keys, um einen Key zu generieren.

Link to this sectionDeployment-Predict#

Der Predict-Tab auf jeder Deployment-Karte bietet ein Inline-Vorhersagepanel – dieselbe Schnittstelle wie der Predict-Tab des Modells, führt jedoch die Inferenz über den Deployment-Endpunkt anstatt über den gemeinsam genutzten Dienst aus. Dies ist nützlich, um einen bereitgestellten Endpunkt direkt vom Browser aus zu testen. Siehe Inference für Parameterdetails und Antwortformate.

Link to this sectionAPI-Endpunkte#

Link to this sectionÜberblick über die Überwachung#

GET /api/monitoring

Gibt aggregierte Metriken für alle Deployments zurück, die dem authentifizierten Benutzer gehören. Arbeitsbereich-fähig über den optionalen owner-Abfrageparameter.

Link to this sectionDeployment-Metriken#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Gibt Sparkline-Daten und zusammenfassende Metriken für ein spezifisches Deployment zurück. Aktualisierungsintervall: 60 Sekunden.

Parameter	Typ	Beschreibung
`sparkline`	bool	Sparkline-Daten einschließen
`range`	string	Zeitbereich: `1h`, `6h`, `24h`, `7d` oder `30d`

Link to this sectionDeployment-Logs#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Gibt aktuelle Log-Einträge mit optionalem Schweregradfilter und Paginierung zurück.

Parameter	Typ	Beschreibung
`limit`	int	Maximale Anzahl zurückzugebender Einträge (Standard: 50, Maximum: 200)
`severity`	string	Kommagetrennter Schweregradfilter
`pageToken`	string	Pagination-Token von der vorherigen Antwort

Link to this sectionDeployment-Status#

GET /api/deployments/{deploymentId}/health

Gibt den Status der Gesundheitsprüfung mit Antwortlatenz zurück.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionLeistungsoptimierung#

Verwende Überwachungsdaten, um deine Deployments zu optimieren:

Wenn die Latenz zu hoch ist:

Überprüfe die Instanzanzahl (eventuell sind mehr erforderlich)
Verifiziere, dass die Modellgröße angemessen ist
Erwäge eine nähere Region
Überprüfe die gesendeten Bildgrößen

Latenz reduzieren

Wechsle von imgsz=1280 zu imgsz=640 für eine ca. 4x Geschwindigkeitssteigerung bei minimalem Genauigkeitsverlust für die meisten Anwendungsfälle. Stelle für eine geringere Netzwerklatenz in einer Region bereit, die näher bei deinen Benutzern liegt.

Link to this sectionFAQ#

Link to this sectionWie lange werden Daten aufbewahrt?#

Datentyp	Aufbewahrung
Metriken	30 Tage
Logs	7 Tage

Link to this sectionKann ich eine externe Überwachung einrichten?#

Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:

Uptime-Überwachung (Pingdom, UptimeRobot)
APM-Tools (Datadog, New Relic)
Benutzerdefinierte Gesundheitsprüfungen über den /health-Endpunkt

Link to this sectionWie genau sind die Latenzzahlen?#

Latenzmetriken messen:

P50: Median der Antwortzeit
P95: 95. Perzentil
P99: 99. Perzentil

Diese stellen die serverseitige Verarbeitungszeit dar, ohne die Netzwerklatenz zu deinen Benutzern.

Link to this sectionWarum sind meine Metriken verzögert?#

Metriken haben eine Verzögerung von ca. 2 Minuten aufgrund von:

Metriken-Aggregations-Pipeline
Aggregationsfenster
Dashboard-Caching

Für Echtzeit-Debugging überprüfe die Logs, die nahezu sofort verfügbar sind.

Link to this sectionKann ich mehrere Endpunkte zusammen überwachen?#

Ja, die Deployments-Seite zeigt alle Endpunkte mit aggregierten Übersichtskarten. Verwende die Tabellenansicht, um die Leistung über verschiedene Deployments hinweg zu vergleichen.

Mitwirkende

GLglenn-jocher¹¹ SEsergiuwaxmann¹

Erstellt 14. Jan. 2026Aktualisiert vor 4 Tagen