Dedizierte Endpunkte
Ultralytics Platform ermöglicht die Bereitstellung von YOLO-Modellen auf dedizierten Endpunkten in 43 globalen Regionen. Jeder Endpunkt ist ein Single-Tenant-Dienst mit Auto-Scaling, benutzerdefinierten URLs und unabhängigem Monitoring.
Endpunkt erstellen
Ein Modell auf einem dedizierten Endpunkt bereitstellen:
- Navigieren Sie zu Ihrem Modell
- Klicken Sie auf den Tab Bereitstellen
- Wählen Sie eine Region auf der Karte aus
- Klicken Sie auf Bereitstellen
Regionsauswahl
Wählen Sie aus 43 Regionen weltweit:
Die interaktive Karte zeigt:
- Regions-Pins: Zum Auswählen klicken
- Latenzindikatoren: Farbcodiert nach Entfernung
- Green: <100ms
- Gelb: 100-200ms
- Rot: >200ms
Regionentabelle
Alle Regionen mit Details anzeigen:
| Spalte | Beschreibung |
|---|---|
| Region | Regionskennung |
| Standort | Stadt/Land |
| Latenz | Gemessene Ping-Zeit |
| Status | Verfügbar/Bereitgestellt |
Wählen Sie mit Bedacht
Wählen Sie die Region, die Ihren Benutzern am nächsten liegt, um die geringste Latenz zu erzielen. Erwägen Sie die Bereitstellung in mehreren Regionen für eine globale Abdeckung.
Verfügbare Regionen
Amerika (14 Regionen)
| Zone | Standort |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | South Carolina, USA |
| us-east4 | Virginia, USA |
| us-east5 | Ohio, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| us-south1 | Dallas, USA |
| northamerica-northeast1 | Montreal, Kanada |
| northamerica-northeast2 | Toronto, Kanada |
| southamerica-east1 | São Paulo, Brasilien |
| southamerica-west1 | Santiago, Chile |
Europa (12 Regionen)
| Zone | Standort |
|---|---|
| europe-west1 | Belgien |
| europe-west2 | London, Vereinigtes Königreich |
| europe-west3 | Frankfurt, Deutschland |
| europe-west4 | Niederlande |
| europe-west6 | Zürich, Schweiz |
| europe-west8 | Mailand, Italien |
| europe-west9 | Paris, Frankreich |
| europe-west10 | Berlin, Deutschland |
| europe-west12 | Turin, Italien |
| europe-north1 | Finnland |
| europe-central2 | Warschau, Polen |
| europe-southwest1 | Madrid, Spanien |
Asien-Pazifik (14 Regionen)
| Zone | Standort |
|---|---|
| asia-east1 | Taiwan |
| asia-east2 | Hongkong |
| asia-northeast1 | Tokio, Japan |
| asia-northeast2 | Osaka, Japan |
| asia-northeast3 | Seoul, Südkorea |
| asia-south1 | Mumbai, Indien |
| asia-south2 | Delhi, Indien |
| asia-southeast1 | Singapur |
| asia-southeast2 | Jakarta, Indonesien |
| australia-southeast1 | Sydney, Australien |
| australia-southeast2 | Melbourne, Australien |
Naher Osten und Afrika (3 Regionen)
| Zone | Standort |
|---|---|
| me-central1 | Doha, Katar |
| me-central2 | Dammam, Saudi-Arabien |
| me-west1 | Tel Aviv, Israel |
Endpunkt-Konfiguration
Beim Erstellen eines Endpunkts:
| Einstellung | Beschreibung | Standard |
|---|---|---|
| Region | Bereitstellungsregion | - |
| Min. Instanzen | Mindestanzahl laufender Instanzen | 0 |
| Max. Instanzen | Maximale Skalierungsgrenze | 10 |
Skalierungsoptionen
| Einstellung | Verhalten |
|---|---|
| Min = 0 | Skalierung auf null im Leerlauf (kosteneffizient) |
| Min > 0 | Immer aktiv, um Kaltstarts zu vermeiden |
| Max. | Obergrenze für Verkehrsspitzen |
Kaltstarts
Bei min instances = 0 löst die erste Anfrage nach einer Leerlaufphase einen Kaltstart aus (2-5 Sekunden). Für latenzempfindliche Anwendungen sollte min > 0 eingestellt werden.
Endpunkte verwalten
Endpunkte anzeigen und verwalten:
Endpunkt-Details
| Feld | Beschreibung |
|---|---|
| URL | HTTPS-Endpunkt für Anfragen |
| Region | Bereitgestellte Region |
| Status | Läuft, Gestoppt, Bereitstellung läuft |
| Instanzen | Aktuelle/maximale Instanzenanzahl |
Endpunkt-URL
Jeder Endpunkt hat eine eindeutige URL:
https://model-abc123-us-central1.a.run.app
Klicken Sie auf die Schaltfläche zum Kopieren, um die URL zu kopieren.
Lebenszyklusmanagement
Endpunktstatus steuern:
| Aktion | Beschreibung |
|---|---|
| Starten | Einen gestoppten Endpunkt fortsetzen |
| Stoppen | Den Endpunkt pausieren (keine Abrechnung) |
| Löschen | Endpunkt dauerhaft entfernen |
Endpunkt stoppen
Einen Endpunkt stoppen, um die Abrechnung zu pausieren:
- Endpunkt-Aktionsmenü öffnen
- Klicken Sie auf Stoppen
- Aktion bestätigen
Gestoppte Endpunkte:
- Akzeptieren keine Anfragen
- Verursachen keine Kosten
- Können jederzeit neu gestartet werden
Endpunkt löschen
Endpunkt dauerhaft entfernen:
- Endpunkt-Aktionsmenü öffnen
- Klicken Sie auf Löschen
- Löschung bestätigen
Dauerhafte Aktion
Die Löschung erfolgt sofort und ist dauerhaft. Sie können jederzeit einen neuen Endpunkt erstellen.
Endpunkte verwenden
Authentifizierung
Ihren API-Schlüssel in Anfragen einfügen:
Authorization: Bearer YOUR_API_KEY
Anfragebeispiel
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Antwortformat
Gleich wie Shared Inference mit aufgabenspezifischen Feldern.
Preise
Dedizierte Endpunkte werden abgerechnet basierend auf:
| Komponente | Rate |
|---|---|
| CPU | Pro vCPU-Sekunde |
| Arbeitsspeicher | Pro GB-Sekunde |
| Anfragen | Pro Million Anfragen |
Kostenoptimierung
- Verwenden Sie Scale-to-Zero für Entwicklungs-Endpunkte.
- Angemessene maximale Instanzen festlegen
- Nutzung im Monitoring-Dashboard überwachen
FAQ
Wie viele Endpunkte kann ich erstellen?
Es gibt keine feste Begrenzung. Jedes Modell kann Endpunkte in mehreren Regionen haben. Die Gesamtzahl der Endpunkte hängt von Ihrem Plan ab.
Kann ich die Region nach der Bereitstellung ändern?
Nein, Regionen sind fest. Um Regionen zu ändern:
- Bestehenden Endpunkt löschen
- Einen neuen Endpunkt in der gewünschten Region erstellen
Wie gehe ich mit Multi-Region-Bereitstellungen um?
Für globale Abdeckung:
- Bereitstellung in mehreren Regionen
- Einen Load Balancer oder DNS-Routing verwenden
- Benutzer zum nächstgelegenen Endpunkt leiten
Wie hoch ist die Kaltstartzeit?
Der Kaltstart variiert je nach Modellgröße:
| Modell | Kaltstart |
|---|---|
| YOLO26n | ~2 Sekunden |
| YOLO26m | ~3 Sekunden |
| YOLO26x | ~5 Sekunden |
Minimale Instanzen > 0 einstellen, um Kaltstarts zu eliminieren.
Kann ich benutzerdefinierte Domains verwenden?
Benutzerdefinierte Domains sind in Kürze verfügbar. Derzeit verwenden Endpunkte plattformgenerierte URLs.