Zum Inhalt springen

Dedizierte Endpunkte

Ultralytics Platform ermöglicht die Bereitstellung von YOLO-Modellen auf dedizierten Endpunkten in 43 globalen Regionen. Jeder Endpunkt ist ein Single-Tenant-Dienst mit Auto-Scaling, benutzerdefinierten URLs und unabhängigem Monitoring.

Endpunkt erstellen

Ein Modell auf einem dedizierten Endpunkt bereitstellen:

  1. Navigieren Sie zu Ihrem Modell
  2. Klicken Sie auf den Tab Bereitstellen
  3. Wählen Sie eine Region auf der Karte aus
  4. Klicken Sie auf Bereitstellen

Regionsauswahl

Wählen Sie aus 43 Regionen weltweit:

Die interaktive Karte zeigt:

  • Regions-Pins: Zum Auswählen klicken
  • Latenzindikatoren: Farbcodiert nach Entfernung
    • Green: <100ms
    • Gelb: 100-200ms
    • Rot: >200ms

Regionentabelle

Alle Regionen mit Details anzeigen:

SpalteBeschreibung
RegionRegionskennung
StandortStadt/Land
LatenzGemessene Ping-Zeit
StatusVerfügbar/Bereitgestellt

Wählen Sie mit Bedacht

Wählen Sie die Region, die Ihren Benutzern am nächsten liegt, um die geringste Latenz zu erzielen. Erwägen Sie die Bereitstellung in mehreren Regionen für eine globale Abdeckung.

Verfügbare Regionen

Amerika (14 Regionen)

ZoneStandort
us-central1Iowa, USA
us-east1South Carolina, USA
us-east4Virginia, USA
us-east5Ohio, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
us-south1Dallas, USA
northamerica-northeast1Montreal, Kanada
northamerica-northeast2Toronto, Kanada
southamerica-east1São Paulo, Brasilien
southamerica-west1Santiago, Chile

Europa (12 Regionen)

ZoneStandort
europe-west1Belgien
europe-west2London, Vereinigtes Königreich
europe-west3Frankfurt, Deutschland
europe-west4Niederlande
europe-west6Zürich, Schweiz
europe-west8Mailand, Italien
europe-west9Paris, Frankreich
europe-west10Berlin, Deutschland
europe-west12Turin, Italien
europe-north1Finnland
europe-central2Warschau, Polen
europe-southwest1Madrid, Spanien

Asien-Pazifik (14 Regionen)

ZoneStandort
asia-east1Taiwan
asia-east2Hongkong
asia-northeast1Tokio, Japan
asia-northeast2Osaka, Japan
asia-northeast3Seoul, Südkorea
asia-south1Mumbai, Indien
asia-south2Delhi, Indien
asia-southeast1Singapur
asia-southeast2Jakarta, Indonesien
australia-southeast1Sydney, Australien
australia-southeast2Melbourne, Australien

Naher Osten und Afrika (3 Regionen)

ZoneStandort
me-central1Doha, Katar
me-central2Dammam, Saudi-Arabien
me-west1Tel Aviv, Israel

Endpunkt-Konfiguration

Beim Erstellen eines Endpunkts:

EinstellungBeschreibungStandard
RegionBereitstellungsregion-
Min. InstanzenMindestanzahl laufender Instanzen0
Max. InstanzenMaximale Skalierungsgrenze10

Skalierungsoptionen

EinstellungVerhalten
Min = 0Skalierung auf null im Leerlauf (kosteneffizient)
Min > 0Immer aktiv, um Kaltstarts zu vermeiden
Max.Obergrenze für Verkehrsspitzen

Kaltstarts

Bei min instances = 0 löst die erste Anfrage nach einer Leerlaufphase einen Kaltstart aus (2-5 Sekunden). Für latenzempfindliche Anwendungen sollte min > 0 eingestellt werden.

Endpunkte verwalten

Endpunkte anzeigen und verwalten:

Endpunkt-Details

FeldBeschreibung
URLHTTPS-Endpunkt für Anfragen
RegionBereitgestellte Region
StatusLäuft, Gestoppt, Bereitstellung läuft
InstanzenAktuelle/maximale Instanzenanzahl

Endpunkt-URL

Jeder Endpunkt hat eine eindeutige URL:

https://model-abc123-us-central1.a.run.app

Klicken Sie auf die Schaltfläche zum Kopieren, um die URL zu kopieren.

Lebenszyklusmanagement

Endpunktstatus steuern:

AktionBeschreibung
StartenEinen gestoppten Endpunkt fortsetzen
StoppenDen Endpunkt pausieren (keine Abrechnung)
LöschenEndpunkt dauerhaft entfernen

Endpunkt stoppen

Einen Endpunkt stoppen, um die Abrechnung zu pausieren:

  1. Endpunkt-Aktionsmenü öffnen
  2. Klicken Sie auf Stoppen
  3. Aktion bestätigen

Gestoppte Endpunkte:

  • Akzeptieren keine Anfragen
  • Verursachen keine Kosten
  • Können jederzeit neu gestartet werden

Endpunkt löschen

Endpunkt dauerhaft entfernen:

  1. Endpunkt-Aktionsmenü öffnen
  2. Klicken Sie auf Löschen
  3. Löschung bestätigen

Dauerhafte Aktion

Die Löschung erfolgt sofort und ist dauerhaft. Sie können jederzeit einen neuen Endpunkt erstellen.

Endpunkte verwenden

Authentifizierung

Ihren API-Schlüssel in Anfragen einfügen:

Authorization: Bearer YOUR_API_KEY

Anfragebeispiel

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Antwortformat

Gleich wie Shared Inference mit aufgabenspezifischen Feldern.

Preise

Dedizierte Endpunkte werden abgerechnet basierend auf:

KomponenteRate
CPUPro vCPU-Sekunde
ArbeitsspeicherPro GB-Sekunde
AnfragenPro Million Anfragen

Kostenoptimierung

  • Verwenden Sie Scale-to-Zero für Entwicklungs-Endpunkte.
  • Angemessene maximale Instanzen festlegen
  • Nutzung im Monitoring-Dashboard überwachen

FAQ

Wie viele Endpunkte kann ich erstellen?

Es gibt keine feste Begrenzung. Jedes Modell kann Endpunkte in mehreren Regionen haben. Die Gesamtzahl der Endpunkte hängt von Ihrem Plan ab.

Kann ich die Region nach der Bereitstellung ändern?

Nein, Regionen sind fest. Um Regionen zu ändern:

  1. Bestehenden Endpunkt löschen
  2. Einen neuen Endpunkt in der gewünschten Region erstellen

Wie gehe ich mit Multi-Region-Bereitstellungen um?

Für globale Abdeckung:

  1. Bereitstellung in mehreren Regionen
  2. Einen Load Balancer oder DNS-Routing verwenden
  3. Benutzer zum nächstgelegenen Endpunkt leiten

Wie hoch ist die Kaltstartzeit?

Der Kaltstart variiert je nach Modellgröße:

ModellKaltstart
YOLO26n~2 Sekunden
YOLO26m~3 Sekunden
YOLO26x~5 Sekunden

Minimale Instanzen > 0 einstellen, um Kaltstarts zu eliminieren.

Kann ich benutzerdefinierte Domains verwenden?

Benutzerdefinierte Domains sind in Kürze verfügbar. Derzeit verwenden Endpunkte plattformgenerierte URLs.



📅 Erstellt vor 20 Tagen ✏️ Aktualisiert vor 14 Tagen
glenn-jocher

Kommentare