Link to this sectionÜberwachung#
Die Ultralytics Platform bietet eine Überwachung für bereitgestellte Endpunkte. Verfolge Anfragemetriken, sieh dir Logs an und prüfe den Gesundheitsstatus mit automatischer Abfrage.

Link to this sectionBereitstellungs-Dashboard#
Die Deploy-Seite in der Seitenleiste dient als Überwachungs-Dashboard für alle deine Bereitstellungen. Sie kombiniert die Weltkarte, Übersichtskennzahlen und das Bereitstellungsmanagement in einer Ansicht. Siehe Dedicated Endpoints zum Erstellen und Verwalten von Bereitstellungen.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this sectionÜbersichtskarten#
Vier Zusammenfassungskarten oben auf der Seite zeigen:

| Metrik | Beschreibung |
|---|---|
| Gesamtanfragen (24h) | Anfragen über alle Endpunkte hinweg |
| Aktive Bereitstellungen | Aktuell laufende Endpunkte |
| Fehlerrate (24h) | Prozentsatz der fehlgeschlagenen Anfragen |
| P95 Latenz (24h) | Antwortzeit des 95. Perzentils |
Die Fehlerraten-Karte leuchtet rot auf, wenn die Rate 5 % überschreitet. Überprüfe den Logs-Tab bei einzelnen Bereitstellungen, um Fehler zu diagnostizieren.
Link to this sectionWeltkarte#
Die interaktive Weltkarte zeigt:
- Regions-Pins für alle 43 verfügbaren Regionen
- Grüne Pins für bereitgestellte Regionen
- Animierte blaue Pins für Regionen mit laufenden Bereitstellungen
- Pin-Größe variiert je nach Bereitstellungsstatus und Latenz

Link to this sectionBereitstellungsliste#
Unter den Übersichtskarten zeigt die Bereitstellungsliste alle Endpunkte deiner Projekte. Nutze den Ansichtsmodus-Umschalter, um zwischen folgenden Optionen zu wechseln:
| Ansicht | Beschreibung |
|---|---|
| Karten | Vollständige Detailkarten mit Metriken, Logs, Code- und Predict-Tabs |
| Kompakt | Raster aus kleineren Karten (1-4 Spalten) mit Schlüsselmetriken |
| Tabelle | Datentabelle mit sortierbaren Spalten: Name, Region, Status, Anfragen, P95, Fehler |
Das Dashboard fragt alle 15 Sekunden nach Updates zum Bereitstellungsstatus. Wenn sich Bereitstellungen in einem Übergangszustand befinden (creating, deploying oder stopping), erhöht sich die Abfragefrequenz auf alle 3 Sekunden. Metrik-Charts werden alle 60 Sekunden aktualisiert. Klicke auf den Aktualisierungs-Button für sofortige Updates.
Link to this sectionMetriken pro Bereitstellung#
Jede Bereitstellungskarte (in der Kartenansicht) zeigt Echtzeitmetriken:
Link to this sectionMetrik-Zeile#
| Metrik | Beschreibung |
|---|---|
| Anfragen | Anfrageanzahl (24h) mit Icon |
| P95 Latenz | Antwortzeit des 95. Perzentils |
| Fehlerrate | Prozentsatz der fehlgeschlagenen Anfragen |
Metriken werden vom Sparkline-API-Endpunkt abgerufen und alle 60 Sekunden aktualisiert.
Link to this sectionGesundheitsprüfung#
Laufende Bereitstellungen zeigen einen Gesundheitscheck-Indikator:
| Indikator | Bedeutung |
|---|---|
| Grünes Herz | Gesund — zeigt Antwortlatenz |
| Rotes Herz | Ungesund — zeigt Fehlermeldung |
| Drehendes Icon | Gesundheitscheck läuft |
Gesundheitschecks wiederholen sich automatisch alle 20 Sekunden, wenn ein ungesunder Status vorliegt. Klicke auf das Aktualisierungs-Icon, um manuell einen Gesundheitscheck auszulösen. Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten zu berücksichtigen.

Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten (bis zu ~45 Sekunden im schlimmsten Fall) zu berücksichtigen. Sobald der Endpunkt aufgewärmt ist, schließen Gesundheitschecks in Millisekunden ab.
Link to this sectionLogs#
Jede Bereitstellungskarte enthält einen Logs-Tab zur Ansicht aktueller Log-Einträge:

Link to this sectionLog-Einträge#
Jeder Log-Eintrag zeigt:
| Feld | Beschreibung |
|---|---|
| Schweregrad | Farbcodierter Balken (siehe unten) |
| Zeitstempel | Anfragezeit (lokales Format) |
| Nachricht | Log-Inhalt |
| HTTP-Info | Statuscode und Latenz (falls zutreffend) |
Filtere Logs nach Schweregrad mithilfe der Filter-Buttons:
| Ebene | Farbe | Beschreibung |
|---|---|---|
| DEBUG | Grau | Debug-Nachrichten |
| INFO | Blau | Normale Anfragen |
| WARNING | Gelb | Nicht-kritische Probleme |
| ERROR | Rot | Fehlgeschlagene Anfragen |
| CRITICAL | Dunkelrot | Kritische Fehler |
Die UI zeigt die 20 aktuellsten Einträge. Die API verwendet standardmäßig 50 Einträge pro Anfrage (maximal 200).
Bei der Untersuchung von Fehlern: Klicke zuerst auf Errors, um nach ERROR- und WARNING-Einträgen zu filtern, und prüfe dann die Zeitstempel sowie HTTP-Statuscodes. Kopiere die Logs in die Zwischenablage, um sie mit deinem Team zu teilen.
Link to this sectionCode-Beispiele#
Jede Bereitstellungskarte enthält einen Code-Tab, der gebrauchsfertigen API-Code mit deiner tatsächlichen Endpunkt-URL und deinem API-Key anzeigt:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Wenn du den Code-Tab auf der Plattform aufrufst, werden deine tatsächliche Endpunkt-URL und dein API-Key automatisch eingetragen. Kopiere den Code und führe ihn direkt aus. Siehe API Keys, um einen Key zu generieren.
Link to this sectionDeployment-Predict#
Der Predict-Tab auf jeder Deployment-Karte bietet ein Inline-Vorhersagepanel – dieselbe Schnittstelle wie der Predict-Tab des Modells, führt jedoch die Inferenz über den Deployment-Endpunkt anstatt über den gemeinsam genutzten Dienst aus. Dies ist nützlich, um einen bereitgestellten Endpunkt direkt vom Browser aus zu testen. Siehe Inference für Parameterdetails und Antwortformate.
Link to this sectionAPI-Endpunkte#
Link to this sectionÜberblick über die Überwachung#
GET /api/monitoringGibt aggregierte Metriken für alle Deployments zurück, die dem authentifizierten Benutzer gehören. Arbeitsbereich-fähig über den optionalen owner-Abfrageparameter.
Link to this sectionDeployment-Metriken#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hGibt Sparkline-Daten und zusammenfassende Metriken für ein spezifisches Deployment zurück. Aktualisierungsintervall: 60 Sekunden.
| Parameter | Typ | Beschreibung |
|---|---|---|
sparkline | bool | Sparkline-Daten einschließen |
range | string | Zeitbereich: 1h, 6h, 24h, 7d oder 30d |
Link to this sectionDeployment-Logs#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGGibt aktuelle Log-Einträge mit optionalem Schweregradfilter und Paginierung zurück.
| Parameter | Typ | Beschreibung |
|---|---|---|
limit | int | Maximale Anzahl zurückzugebender Einträge (Standard: 50, Maximum: 200) |
severity | string | Kommagetrennter Schweregradfilter |
pageToken | string | Pagination-Token von der vorherigen Antwort |
Link to this sectionDeployment-Status#
GET /api/deployments/{deploymentId}/healthGibt den Status der Gesundheitsprüfung mit Antwortlatenz zurück.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionLeistungsoptimierung#
Verwende Überwachungsdaten, um deine Deployments zu optimieren:
Wenn die Latenz zu hoch ist:
- Überprüfe die Instanzanzahl (eventuell sind mehr erforderlich)
- Verifiziere, dass die Modellgröße angemessen ist
- Erwäge eine nähere Region
- Überprüfe die gesendeten Bildgrößen
Wechsle von imgsz=1280 zu imgsz=640 für eine ca. 4x Geschwindigkeitssteigerung bei minimalem Genauigkeitsverlust für die meisten Anwendungsfälle. Stelle für eine geringere Netzwerklatenz in einer Region bereit, die näher bei deinen Benutzern liegt.
Link to this sectionFAQ#
Link to this sectionWie lange werden Daten aufbewahrt?#
| Datentyp | Aufbewahrung |
|---|---|
| Metriken | 30 Tage |
| Logs | 7 Tage |
Link to this sectionKann ich eine externe Überwachung einrichten?#
Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:
- Uptime-Überwachung (Pingdom, UptimeRobot)
- APM-Tools (Datadog, New Relic)
- Benutzerdefinierte Gesundheitsprüfungen über den
/health-Endpunkt
Link to this sectionWie genau sind die Latenzzahlen?#
Latenzmetriken messen:
- P50: Median der Antwortzeit
- P95: 95. Perzentil
- P99: 99. Perzentil
Diese stellen die serverseitige Verarbeitungszeit dar, ohne die Netzwerklatenz zu deinen Benutzern.
Link to this sectionWarum sind meine Metriken verzögert?#
Metriken haben eine Verzögerung von ca. 2 Minuten aufgrund von:
- Metriken-Aggregations-Pipeline
- Aggregationsfenster
- Dashboard-Caching
Für Echtzeit-Debugging überprüfe die Logs, die nahezu sofort verfügbar sind.
Link to this sectionKann ich mehrere Endpunkte zusammen überwachen?#
Ja, die Deployments-Seite zeigt alle Endpunkte mit aggregierten Übersichtskarten. Verwende die Tabellenansicht, um die Leistung über verschiedene Deployments hinweg zu vergleichen.