コンテンツにスキップ

専用エンドポイント

Ultralytics Platformは、YOLOモデルを43のグローバルリージョンにある専用エンドポイントにデプロイすることを可能にします。各エンドポイントは、オートスケーリング、カスタムURL、および独立したモニタリングを備えたシングルテナントサービスです。

エンドポイントを作成

モデルを専用エンドポイントにデプロイする:

  1. モデルに移動
  2. デプロイタブをクリック
  3. マップからリージョンを選択
  4. デプロイをクリック

領域選択

世界43のリージョンから選択:

インタラクティブマップは以下を示します:

  • リージョンピン:クリックして選択
  • レイテンシインジケーター:距離に応じて色分け
    • Green: <100ms
    • 黄:100-200ms
    • 赤:>200ms

リージョン表

詳細付きで全リージョンを表示:

説明
リージョンリージョン識別子
ロケーション都市/国
レイテンシーPing測定時間
ステータス利用可能/デプロイ済み

慎重に選択してください

低レイテンシを実現するため、ユーザーに最も近いリージョンを選択してください。グローバルなカバレッジを確保するために、複数のリージョンへのデプロイも検討してください。

利用可能なリージョン

アメリカ大陸(14地域)

ゾーンロケーション
us-central1アイオワ州、米国
us-east1サウスカロライナ州、米国
us-east4バージニア州、米国
us-east5アメリカ合衆国オハイオ州
us-west1オレゴン州、米国
us-west2ロサンゼルス、米国
us-west3ソルトレイクシティ、米国
us-west4ラスベガス、米国
us-south1ダラス、米国
northamerica-northeast1モントリオール、カナダ
northamerica-northeast2トロント、カナダ
southamerica-east1サンパウロ、ブラジル
southamerica-west1サンティアゴ、チリ

ヨーロッパ (12リージョン)

ゾーンロケーション
europe-west1ベルギー
europe-west2ロンドン、英国
europe-west3フランクフルト、ドイツ
europe-west4オランダ
europe-west6チューリッヒ、スイス
europe-west8ミラノ、イタリア
europe-west9パリ、フランス
europe-west10ベルリン、ドイツ
europe-west12トリノ、イタリア
europe-north1フィンランド
europe-central2ワルシャワ、ポーランド
europe-southwest1マドリード、スペイン

アジア太平洋地域(14地域)

ゾーンロケーション
asia-east1台湾
asia-east2香港
asia-northeast1東京、日本
asia-northeast2大阪、日本
asia-northeast3韓国、ソウル
asia-south1ムンバイ、インド
asia-south2デリー、インド
asia-southeast1シンガポール
asia-southeast2ジャカルタ、インドネシア
australia-southeast1シドニー、オーストラリア
australia-southeast2メルボルン、オーストラリア

中東・アフリカ(3地域)

ゾーンロケーション
me-central1ドーハ、カタール
me-central2ダンマーム、サウジアラビア
me-west1テルアビブ、イスラエル

エンドポイント設定

エンドポイント作成時:

設定説明デフォルト
リージョンデプロイリージョン-
最小インスタンス数最小実行インスタンス数0
最大インスタンス数最大スケーリング制限10

スケーリングオプション

設定動作
最小 = 0アイドル時にゼロにスケール (費用対効果が高い)
最小 > 0コールドスタートなしで常時稼働
最大トラフィックスパイクの上限

コールドスタート

最小インスタンス数 = 0 の場合、アイドル後の最初のリクエストでコールドスタート (2~5秒) が発生します。レイテンシに敏感なアプリケーションでは、最小インスタンス数 > 0 に設定してください。

エンドポイントを管理

エンドポイントの表示と管理:

エンドポイント詳細

フィールド説明
URLリクエスト用HTTPSエンドポイント
リージョンデプロイ済みリージョン
ステータス実行中、停止済み、デプロイ中
インスタンス現在の/最大インスタンス数

エンドポイントURL

各エンドポイントには一意のURLがあります:

https://model-abc123-us-central1.a.run.app

コピーボタンをクリックしてURLをコピーします。

ライフサイクル管理

エンドポイントの状態を制御します:

アクション説明
開始停止中のエンドポイントを再開します
停止エンドポイントを一時停止します(課金なし)
削除エンドポイントを完全に削除します

エンドポイントを停止

エンドポイントを停止して課金を一時停止します:

  1. エンドポイントアクションメニューを開きます
  2. 停止をクリックします
  3. アクションを確認します

停止済みエンドポイント:

  • リクエストを受け付けません
  • 料金は発生しません
  • いつでも再起動できます

エンドポイントを削除

エンドポイントを完全に削除します:

  1. エンドポイントアクションメニューを開きます
  2. 削除をクリックします
  3. 削除を確認

恒久的な操作

削除は即座に、かつ永続的に行われます。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

リクエストにAPIキーを含めます:

Authorization: Bearer YOUR_API_KEY

リクエスト例

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

応答形式

タスク固有のフィールドを持つ共有推論と同じです。

料金

専用エンドポイントの課金基準:

コンポーネントレート
CPUvCPU秒あたり
メモリGB秒あたり
リクエスト100万リクエストあたり

コスト最適化

  • 開発用エンドポイントにはスケール・トゥ・ゼロを使用します。
  • 適切な最大インスタンス数を設定します。
  • 監視ダッシュボードで利用状況を監視します。

よくある質問

いくつのエンドポイントを作成できますか?

厳密な制限はありません。各モデルは複数のリージョンにエンドポイントを持つことができます。総エンドポイント数はプランによって異なります。

デプロイ後にリージョンを変更できますか?

いいえ、リージョンは固定されています。リージョンを変更するには:

  1. 既存のエンドポイントを削除します。
  2. 希望するリージョンに新しいエンドポイントを作成します。

マルチリージョンデプロイメントはどのように扱いますか?

グローバルカバレッジの場合:

  1. 複数のリージョンにデプロイします。
  2. ロードバランサーまたはDNSルーティングを使用します。
  3. ユーザーを最寄りのエンドポイントにルーティングします。

コールドスタート時間はどのくらいですか?

コールドスタートはモデルサイズによって異なります:

モデルコールドスタート
YOLO26n約2秒
YOLO26m約3秒
YOLO26x約5秒

コールドスタートをなくすには、最小インスタンス数を0より大きく設定します。

カスタムドメインを使用できますか?

カスタムドメインは近日公開予定です。現在、エンドポイントはプラットフォームが生成したURLを使用しています。



📅 20日前に作成✏️ 14日前に更新
glenn-jocher

コメント