Meet YOLO26: next-gen vision AI.

Link to this sectionÜberwachung#

Die Ultralytics Platform bietet eine Überwachung für bereitgestellte Endpunkte. Verfolge Anfragemetriken, sieh dir Logs an und prüfe den Gesundheitsstatus mit automatischer Abfrage.

Übersichtskarten und Weltkarte der Ultralytics Platform Deploy-Seite

Link to this sectionBereitstellungs-Dashboard#

Die Deploy-Seite in der Seitenleiste dient als Überwachungs-Dashboard für alle deine Bereitstellungen. Sie kombiniert die Weltkarte, Übersichtskennzahlen und das Bereitstellungsmanagement in einer Ansicht. Siehe Dedicated Endpoints zum Erstellen und Verwalten von Bereitstellungen.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionÜbersichtskarten#

Vier Zusammenfassungskarten oben auf der Seite zeigen:

Vier Übersichtskarten der Ultralytics Platform Deploy-Seite

MetrikBeschreibung
Gesamtanfragen (24h)Anfragen über alle Endpunkte hinweg
Aktive BereitstellungenAktuell laufende Endpunkte
Fehlerrate (24h)Prozentsatz der fehlgeschlagenen Anfragen
P95 Latenz (24h)Antwortzeit des 95. Perzentils
Fehlerraten-Warnung

Die Fehlerraten-Karte leuchtet rot auf, wenn die Rate 5 % überschreitet. Überprüfe den Logs-Tab bei einzelnen Bereitstellungen, um Fehler zu diagnostizieren.

Link to this sectionWeltkarte#

Die interaktive Weltkarte zeigt:

  • Regions-Pins für alle 43 verfügbaren Regionen
  • Grüne Pins für bereitgestellte Regionen
  • Animierte blaue Pins für Regionen mit laufenden Bereitstellungen
  • Pin-Größe variiert je nach Bereitstellungsstatus und Latenz

Weltkarte der Ultralytics Platform Deploy-Seite mit bereitgestellten Regionen

Link to this sectionBereitstellungsliste#

Unter den Übersichtskarten zeigt die Bereitstellungsliste alle Endpunkte deiner Projekte. Nutze den Ansichtsmodus-Umschalter, um zwischen folgenden Optionen zu wechseln:

AnsichtBeschreibung
KartenVollständige Detailkarten mit Metriken, Logs, Code- und Predict-Tabs
KompaktRaster aus kleineren Karten (1-4 Spalten) mit Schlüsselmetriken
TabelleDatentabelle mit sortierbaren Spalten: Name, Region, Status, Anfragen, P95, Fehler
Echtzeit-Updates

Das Dashboard fragt alle 15 Sekunden nach Updates zum Bereitstellungsstatus. Wenn sich Bereitstellungen in einem Übergangszustand befinden (creating, deploying oder stopping), erhöht sich die Abfragefrequenz auf alle 3 Sekunden. Metrik-Charts werden alle 60 Sekunden aktualisiert. Klicke auf den Aktualisierungs-Button für sofortige Updates.

Link to this sectionMetriken pro Bereitstellung#

Jede Bereitstellungskarte (in der Kartenansicht) zeigt Echtzeitmetriken:

Link to this sectionMetrik-Zeile#

MetrikBeschreibung
AnfragenAnfrageanzahl (24h) mit Icon
P95 LatenzAntwortzeit des 95. Perzentils
FehlerrateProzentsatz der fehlgeschlagenen Anfragen

Metriken werden vom Sparkline-API-Endpunkt abgerufen und alle 60 Sekunden aktualisiert.

Link to this sectionGesundheitsprüfung#

Laufende Bereitstellungen zeigen einen Gesundheitscheck-Indikator:

IndikatorBedeutung
Grünes HerzGesund — zeigt Antwortlatenz
Rotes HerzUngesund — zeigt Fehlermeldung
Drehendes IconGesundheitscheck läuft

Gesundheitschecks wiederholen sich automatisch alle 20 Sekunden, wenn ein ungesunder Status vorliegt. Klicke auf das Aktualisierungs-Icon, um manuell einen Gesundheitscheck auszulösen. Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten zu berücksichtigen.

Gesundheitscheck der Ultralytics Platform Deployment-Karte, gesund mit Latenz

Kaltstart-Toleranz

Der Gesundheitscheck nutzt ein 55-Sekunden-Timeout, um Kaltstarts bei Scale-to-Zero-Endpunkten (bis zu ~45 Sekunden im schlimmsten Fall) zu berücksichtigen. Sobald der Endpunkt aufgewärmt ist, schließen Gesundheitschecks in Millisekunden ab.

Link to this sectionLogs#

Jede Bereitstellungskarte enthält einen Logs-Tab zur Ansicht aktueller Log-Einträge:

Logs-Tab der Ultralytics Platform Deployment-Karte mit Schweregrad-Filter

Link to this sectionLog-Einträge#

Jeder Log-Eintrag zeigt:

FeldBeschreibung
SchweregradFarbcodierter Balken (siehe unten)
ZeitstempelAnfragezeit (lokales Format)
NachrichtLog-Inhalt
HTTP-InfoStatuscode und Latenz (falls zutreffend)

Filtere Logs nach Schweregrad mithilfe der Filter-Buttons:

EbeneFarbeBeschreibung
DEBUGGrauDebug-Nachrichten
INFOBlauNormale Anfragen
WARNINGGelbNicht-kritische Probleme
ERRORRotFehlgeschlagene Anfragen
CRITICALDunkelrotKritische Fehler

Die UI zeigt die 20 aktuellsten Einträge. Die API verwendet standardmäßig 50 Einträge pro Anfrage (maximal 200).

Debugging-Workflow

Bei der Untersuchung von Fehlern: Klicke zuerst auf Errors, um nach ERROR- und WARNING-Einträgen zu filtern, und prüfe dann die Zeitstempel sowie HTTP-Statuscodes. Kopiere die Logs in die Zwischenablage, um sie mit deinem Team zu teilen.

Link to this sectionCode-Beispiele#

Jede Bereitstellungskarte enthält einen Code-Tab, der gebrauchsfertigen API-Code mit deiner tatsächlichen Endpunkt-URL und deinem API-Key anzeigt:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Automatisch ausgefüllte Anmeldedaten

Wenn du den Code-Tab auf der Plattform aufrufst, werden deine tatsächliche Endpunkt-URL und dein API-Key automatisch eingetragen. Kopiere den Code und führe ihn direkt aus. Siehe API Keys, um einen Key zu generieren.

Link to this sectionDeployment-Predict#

Der Predict-Tab auf jeder Deployment-Karte bietet ein Inline-Vorhersagepanel – dieselbe Schnittstelle wie der Predict-Tab des Modells, führt jedoch die Inferenz über den Deployment-Endpunkt anstatt über den gemeinsam genutzten Dienst aus. Dies ist nützlich, um einen bereitgestellten Endpunkt direkt vom Browser aus zu testen. Siehe Inference für Parameterdetails und Antwortformate.

Link to this sectionAPI-Endpunkte#

Link to this sectionÜberblick über die Überwachung#

GET /api/monitoring

Gibt aggregierte Metriken für alle Deployments zurück, die dem authentifizierten Benutzer gehören. Arbeitsbereich-fähig über den optionalen owner-Abfrageparameter.

Link to this sectionDeployment-Metriken#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Gibt Sparkline-Daten und zusammenfassende Metriken für ein spezifisches Deployment zurück. Aktualisierungsintervall: 60 Sekunden.

ParameterTypBeschreibung
sparklineboolSparkline-Daten einschließen
rangestringZeitbereich: 1h, 6h, 24h, 7d oder 30d

Link to this sectionDeployment-Logs#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Gibt aktuelle Log-Einträge mit optionalem Schweregradfilter und Paginierung zurück.

ParameterTypBeschreibung
limitintMaximale Anzahl zurückzugebender Einträge (Standard: 50, Maximum: 200)
severitystringKommagetrennter Schweregradfilter
pageTokenstringPagination-Token von der vorherigen Antwort

Link to this sectionDeployment-Status#

GET /api/deployments/{deploymentId}/health

Gibt den Status der Gesundheitsprüfung mit Antwortlatenz zurück.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionLeistungsoptimierung#

Verwende Überwachungsdaten, um deine Deployments zu optimieren:

Wenn die Latenz zu hoch ist:

  1. Überprüfe die Instanzanzahl (eventuell sind mehr erforderlich)
  2. Verifiziere, dass die Modellgröße angemessen ist
  3. Erwäge eine nähere Region
  4. Überprüfe die gesendeten Bildgrößen
Latenz reduzieren

Wechsle von imgsz=1280 zu imgsz=640 für eine ca. 4x Geschwindigkeitssteigerung bei minimalem Genauigkeitsverlust für die meisten Anwendungsfälle. Stelle für eine geringere Netzwerklatenz in einer Region bereit, die näher bei deinen Benutzern liegt.

Link to this sectionFAQ#

Link to this sectionWie lange werden Daten aufbewahrt?#

DatentypAufbewahrung
Metriken30 Tage
Logs7 Tage

Link to this sectionKann ich eine externe Überwachung einrichten?#

Ja, Endpunkt-URLs funktionieren mit externen Überwachungstools:

  • Uptime-Überwachung (Pingdom, UptimeRobot)
  • APM-Tools (Datadog, New Relic)
  • Benutzerdefinierte Gesundheitsprüfungen über den /health-Endpunkt

Link to this sectionWie genau sind die Latenzzahlen?#

Latenzmetriken messen:

  • P50: Median der Antwortzeit
  • P95: 95. Perzentil
  • P99: 99. Perzentil

Diese stellen die serverseitige Verarbeitungszeit dar, ohne die Netzwerklatenz zu deinen Benutzern.

Link to this sectionWarum sind meine Metriken verzögert?#

Metriken haben eine Verzögerung von ca. 2 Minuten aufgrund von:

  • Metriken-Aggregations-Pipeline
  • Aggregationsfenster
  • Dashboard-Caching

Für Echtzeit-Debugging überprüfe die Logs, die nahezu sofort verfügbar sind.

Link to this sectionKann ich mehrere Endpunkte zusammen überwachen?#

Ja, die Deployments-Seite zeigt alle Endpunkte mit aggregierten Übersichtskarten. Verwende die Tabellenansicht, um die Leistung über verschiedene Deployments hinweg zu vergleichen.

Kommentare