Dedizierte Endpunkte
Ultralytics ermöglicht die Bereitstellung von YOLO auf dedizierten Endpunkten in 43 Regionen weltweit. Jeder Endpunkt ist ein Single-Tenant-Dienst mit automatischer Skalierung, benutzerdefinierten URLs und unabhängiger Überwachung.
Endpunkt erstellen
Ein Modell auf einem dedizierten Endpunkt bereitstellen:
- Navigieren Sie zu Ihrem Modell
- Klicken Sie auf die Registerkarte „Bereitstellen “.
- Wählen Sie eine Region aus der Karte aus.
- Klicken Sie auf „Bereitstellen“
Regionsauswahl
Wählen Sie aus 43 Regionen weltweit:
Die interaktive Karte zeigt:
- Regions-Pins: Zum Auswählen anklicken
- Latenzindikatoren: Farbcodiert nach Entfernung
- Green: <100ms
- Gelb: 100–200 ms
- Rot: >200 ms
Regionstabelle
Alle Regionen mit Details anzeigen:
| Spalte | Beschreibung |
|---|---|
| Region | Regionskennung |
| Standort | Stadt/Land |
| Latenz | Gemessene Ping-Zeit |
| Status | Verfügbar/eingesetzt |
Wählen Sie mit Bedacht
Wählen Sie die Region aus, die Ihren Benutzern am nächsten liegt, um die geringste Latenz zu erzielen. Erwägen Sie die Bereitstellung in mehreren Regionen, um eine globale Abdeckung zu erreichen.
Verfügbare Regionen
Amerika (15 Regionen)
| Region | Standort |
|---|---|
| us-central1 | Iowa, USA |
| us-east1 | South Carolina, USA |
| us-east4 | Virginia, USA |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| Nordamerika-Nordosten1 | Montreal, Kanada |
| Nordamerika-Nordosten2 | Toronto, Kanada |
| Südamerika-Ost1 | São Paulo, Brasilien |
| Südamerika-West1 | Santiago, Chile |
Europa (12 Regionen)
| Region | Standort |
|---|---|
| Europa-Zentral2 | Warschau, Polen |
| Europa-Nord1 | Finnland |
| Europa-Südwesten1 | Madrid, Spanien |
| Europa-West1 | Belgien |
| Europa-West2 | London, Vereinigtes Königreich |
| Europa-West3 | Frankfurt, Deutschland |
| Europa-West4 | Niederlande |
| Europa-West6 | Zürich, Schweiz |
| Europa-West8 | Mailand, Italien |
| Europa-West9 | Paris, Frankreich |
| Europa-West10 | Berlin, Deutschland |
| Europa-West12 | Turin, Italien |
Asien-Pazifik-Raum (16 Regionen)
| Region | Standort |
|---|---|
| Asien-Ost1 | Taiwan |
| Asien-Ost2 | Hongkong |
| Asien-Nordosten1 | Tokio, Japan |
| Asien-Nordosten2 | Osaka, Japan |
| Asien-Nordosten3 | Seoul, Korea |
| Asien-Süd1 | Mumbai, Indien |
| Asien-Süd2 | Delhi, Indien |
| Asien-Südostasien1 | Singapur |
| Asien-Südostasien2 | Jakarta, Indonesien |
| australien-südosten1 | Sydney, Australien |
| australien-südosten2 | Melbourne, Australien |
| me-central1 | Doha, Katar |
| me-central2 | Dammam, Saudi-Arabien |
| me-west1 | Tel Aviv, Israel |
Endpunktkonfiguration
Beim Erstellen eines Endpunkts:
| Einstellung | Beschreibung | Standard |
|---|---|---|
| Region | Bereitstellungsregion | - |
| Minimale Instanzen | Mindestanzahl laufender Instanzen | 0 |
| Maximale Instanzen | Maximale Skalierungsgrenze | 10 |
Skalierungsoptionen
| Einstellung | Verhalten |
|---|---|
| Min = 0 | Bei Leerlauf auf Null skalieren (kostengünstig) |
| Min > 0 | Immer eingeschaltet, keine Kaltstarts |
| Max | Obergrenze für Verkehrsspitzen |
Kaltstarts
Bei min instances = 0 löst die erste Anfrage nach einer Leerlaufphase einen Kaltstart aus (2–5 Sekunden). Setzen Sie min > 0 für latenzempfindliche Anwendungen.
Endpunkte verwalten
Anzeigen und Verwalten Ihrer Endpunkte:
Endpunktdetails
| Feld | Beschreibung |
|---|---|
| URL | HTTPS-Endpunkt für Anfragen |
| Region | Eingesetzte Region |
| Status | Läuft, angehalten, wird bereitgestellt |
| Instanzen | Aktuelle/maximale Instanzanzahl |
Endpunkt-URL
Jeder Endpunkt hat eine eindeutige URL:
https://model-abc123-us-central1.a.run.app
Klicken Sie auf die Schaltfläche „Kopieren“, um die URL zu kopieren.
Lebenszyklusmanagement
Kontrollieren Sie den Status Ihrer Endgeräte:
| Aktion | Beschreibung |
|---|---|
| Start | Einen angehaltenen Endpunkt fortsetzen |
| Halt | Endpunkt pausieren (keine Abrechnung) |
| Löschen | Endpunkt dauerhaft entfernen |
Endpunkt stoppen
Endpunkt stoppen, um die Abrechnung zu unterbrechen:
- Menü „Endpunktaktionen“ öffnen
- Klicken Sie auf „Stopp“.
- Aktion bestätigen
Gestoppte Endpunkte:
- Anfragen nicht annehmen
- Keine Gebühren anfallen lassen
- Kann jederzeit neu gestartet werden
Endpunkt löschen
Endpunkt dauerhaft entfernen:
- Menü „Endpunktaktionen“ öffnen
- Auf „Löschen“ klicken
- Löschen bestätigen
Dauerhafte Maßnahme
Die Löschung erfolgt sofort und dauerhaft. Sie können jederzeit einen neuen Endpunkt erstellen.
Verwendung von Endpunkten
Authentifizierung
Fügen Sie Ihren API-Schlüssel in Anfragen ein:
Authorization: Bearer YOUR_API_KEY
Beispiel anfordern
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
Antwortformat
Wie gemeinsame Inferenz mit aufgabenspezifischen Feldern.
Preisgestaltung
Spezieller Endpunkt-Rechnung basierend auf:
| Komponente | Preis |
|---|---|
| CPU | Pro vCPU-Sekunde |
| Arbeitsspeicher | Pro GB-Sekunde |
| Anfragen | Pro Million Anfragen |
Kostenoptimierung
- Verwenden Sie Scale-to-Zero für Entwicklungsendpunkte.
- Geeignete maximale Instanzen festlegen
- Überwachen Sie die Nutzung im Überwachungs -Dashboard.
FAQ
Wie viele Endpunkte kann ich erstellen?
Es gibt keine feste Begrenzung. Jedes Modell kann Endpunkte in mehreren Regionen haben. Die Gesamtzahl der Endpunkte hängt von Ihrem Tarif ab.
Kann ich die Region nach der Bereitstellung ändern?
Nein, die Regionen sind festgelegt. So ändern Sie die Regionen:
- Löschen Sie den vorhandenen Endpunkt.
- Erstellen Sie einen neuen Endpunkt in der gewünschten Region.
Wie gehe ich mit einer Bereitstellung in mehreren Regionen um?
Für weltweite Abdeckung:
- In mehreren Regionen bereitstellen
- Verwenden Sie einen Load Balancer oder DNS-Routing.
- Benutzer zum nächstgelegenen Endpunkt leiten
Wann ist die Kaltstartzeit?
Der Kaltstart variiert je nach Modellgröße:
| Modell | Kaltstart |
|---|---|
| YOLO11n | ~2 Sekunden |
| YOLO11m | ~3 Sekunden |
| YOLO11x | ~5 Sekunden |
Setzen Sie die Mindestanzahl an Instanzen auf > 0, um Kaltstarts zu vermeiden.
Kann ich benutzerdefinierte Domains verwenden?
Benutzerdefinierte Domänen sind in Kürze verfügbar. Derzeit verwenden Endpunkte von der Plattform generierte URLs.