Zum Inhalt springen

Dedizierte Endpunkte

Ultralytics ermöglicht die Bereitstellung von YOLO auf dedizierten Endpunkten in 43 Regionen weltweit. Jeder Endpunkt ist ein Single-Tenant-Dienst mit automatischer Skalierung, benutzerdefinierten URLs und unabhängiger Überwachung.

Endpunkt erstellen

Ein Modell auf einem dedizierten Endpunkt bereitstellen:

  1. Navigieren Sie zu Ihrem Modell
  2. Klicken Sie auf die Registerkarte „Bereitstellen “.
  3. Wählen Sie eine Region aus der Karte aus.
  4. Klicken Sie auf „Bereitstellen“

Regionsauswahl

Wählen Sie aus 43 Regionen weltweit:

Die interaktive Karte zeigt:

  • Regions-Pins: Zum Auswählen anklicken
  • Latenzindikatoren: Farbcodiert nach Entfernung
    • Green: <100ms
    • Gelb: 100–200 ms
    • Rot: >200 ms

Regionstabelle

Alle Regionen mit Details anzeigen:

SpalteBeschreibung
RegionRegionskennung
StandortStadt/Land
LatenzGemessene Ping-Zeit
StatusVerfügbar/eingesetzt

Wählen Sie mit Bedacht

Wählen Sie die Region aus, die Ihren Benutzern am nächsten liegt, um die geringste Latenz zu erzielen. Erwägen Sie die Bereitstellung in mehreren Regionen, um eine globale Abdeckung zu erreichen.

Verfügbare Regionen

Amerika (15 Regionen)

RegionStandort
us-central1Iowa, USA
us-east1South Carolina, USA
us-east4Virginia, USA
us-east5Columbus, USA
us-south1Dallas, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
Nordamerika-Nordosten1Montreal, Kanada
Nordamerika-Nordosten2Toronto, Kanada
Südamerika-Ost1São Paulo, Brasilien
Südamerika-West1Santiago, Chile

Europa (12 Regionen)

RegionStandort
Europa-Zentral2Warschau, Polen
Europa-Nord1Finnland
Europa-Südwesten1Madrid, Spanien
Europa-West1Belgien
Europa-West2London, Vereinigtes Königreich
Europa-West3Frankfurt, Deutschland
Europa-West4Niederlande
Europa-West6Zürich, Schweiz
Europa-West8Mailand, Italien
Europa-West9Paris, Frankreich
Europa-West10Berlin, Deutschland
Europa-West12Turin, Italien

Asien-Pazifik-Raum (16 Regionen)

RegionStandort
Asien-Ost1Taiwan
Asien-Ost2Hongkong
Asien-Nordosten1Tokio, Japan
Asien-Nordosten2Osaka, Japan
Asien-Nordosten3Seoul, Korea
Asien-Süd1Mumbai, Indien
Asien-Süd2Delhi, Indien
Asien-Südostasien1Singapur
Asien-Südostasien2Jakarta, Indonesien
australien-südosten1Sydney, Australien
australien-südosten2Melbourne, Australien
me-central1Doha, Katar
me-central2Dammam, Saudi-Arabien
me-west1Tel Aviv, Israel

Endpunktkonfiguration

Beim Erstellen eines Endpunkts:

EinstellungBeschreibungStandard
RegionBereitstellungsregion-
Minimale InstanzenMindestanzahl laufender Instanzen0
Maximale InstanzenMaximale Skalierungsgrenze10

Skalierungsoptionen

EinstellungVerhalten
Min = 0Bei Leerlauf auf Null skalieren (kostengünstig)
Min > 0Immer eingeschaltet, keine Kaltstarts
MaxObergrenze für Verkehrsspitzen

Kaltstarts

Bei min instances = 0 löst die erste Anfrage nach einer Leerlaufphase einen Kaltstart aus (2–5 Sekunden). Setzen Sie min > 0 für latenzempfindliche Anwendungen.

Endpunkte verwalten

Anzeigen und Verwalten Ihrer Endpunkte:

Endpunktdetails

FeldBeschreibung
URLHTTPS-Endpunkt für Anfragen
RegionEingesetzte Region
StatusLäuft, angehalten, wird bereitgestellt
InstanzenAktuelle/maximale Instanzanzahl

Endpunkt-URL

Jeder Endpunkt hat eine eindeutige URL:

https://model-abc123-us-central1.a.run.app

Klicken Sie auf die Schaltfläche „Kopieren“, um die URL zu kopieren.

Lebenszyklusmanagement

Kontrollieren Sie den Status Ihrer Endgeräte:

AktionBeschreibung
StartEinen angehaltenen Endpunkt fortsetzen
HaltEndpunkt pausieren (keine Abrechnung)
LöschenEndpunkt dauerhaft entfernen

Endpunkt stoppen

Endpunkt stoppen, um die Abrechnung zu unterbrechen:

  1. Menü „Endpunktaktionen“ öffnen
  2. Klicken Sie auf „Stopp“.
  3. Aktion bestätigen

Gestoppte Endpunkte:

  • Anfragen nicht annehmen
  • Keine Gebühren anfallen lassen
  • Kann jederzeit neu gestartet werden

Endpunkt löschen

Endpunkt dauerhaft entfernen:

  1. Menü „Endpunktaktionen“ öffnen
  2. Auf „Löschen“ klicken
  3. Löschen bestätigen

Dauerhafte Maßnahme

Die Löschung erfolgt sofort und dauerhaft. Sie können jederzeit einen neuen Endpunkt erstellen.

Verwendung von Endpunkten

Authentifizierung

Fügen Sie Ihren API-Schlüssel in Anfragen ein:

Authorization: Bearer YOUR_API_KEY

Beispiel anfordern

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Antwortformat

Wie gemeinsame Inferenz mit aufgabenspezifischen Feldern.

Preisgestaltung

Spezieller Endpunkt-Rechnung basierend auf:

KomponentePreis
CPUPro vCPU-Sekunde
ArbeitsspeicherPro GB-Sekunde
AnfragenPro Million Anfragen

Kostenoptimierung

  • Verwenden Sie Scale-to-Zero für Entwicklungsendpunkte.
  • Geeignete maximale Instanzen festlegen
  • Überwachen Sie die Nutzung im Überwachungs -Dashboard.

FAQ

Wie viele Endpunkte kann ich erstellen?

Es gibt keine feste Begrenzung. Jedes Modell kann Endpunkte in mehreren Regionen haben. Die Gesamtzahl der Endpunkte hängt von Ihrem Tarif ab.

Kann ich die Region nach der Bereitstellung ändern?

Nein, die Regionen sind festgelegt. So ändern Sie die Regionen:

  1. Löschen Sie den vorhandenen Endpunkt.
  2. Erstellen Sie einen neuen Endpunkt in der gewünschten Region.

Wie gehe ich mit einer Bereitstellung in mehreren Regionen um?

Für weltweite Abdeckung:

  1. In mehreren Regionen bereitstellen
  2. Verwenden Sie einen Load Balancer oder DNS-Routing.
  3. Benutzer zum nächstgelegenen Endpunkt leiten

Wann ist die Kaltstartzeit?

Der Kaltstart variiert je nach Modellgröße:

ModellKaltstart
YOLO11n~2 Sekunden
YOLO11m~3 Sekunden
YOLO11x~5 Sekunden

Setzen Sie die Mindestanzahl an Instanzen auf > 0, um Kaltstarts zu vermeiden.

Kann ich benutzerdefinierte Domains verwenden?

Benutzerdefinierte Domänen sind in Kürze verfügbar. Derzeit verwenden Endpunkte von der Plattform generierte URLs.



📅 Erstellt vor 0 Tagen ✏️ Aktualisiert vor 0 Tagen
glenn-jocher

Kommentare