コンテンツにスキップ

専用エンドポイント

Ultralytics 43のグローバルリージョンにおけるYOLO 可能にします。各エンドポイントは、自動スケーリング、カスタムURL、独立した監視機能を備えたシングルテナントサービスです。

エンドポイントを作成する

モデルを専用エンドポイントにデプロイする:

  1. モデルに移動してください
  2. デプロイタブをクリックしてください
  3. 地図から地域を選択してください
  4. デプロイをクリック

地域選択

世界43地域から選択:

インタラクティブマップには以下が表示されます:

  • 地域ピン:クリックして選択
  • レイテンシ指標距離による色分け
    • Green: <100ms
    • 黄色: 100-200ミリ秒
    • 赤: >200ミリ秒

地域表

すべての地域を詳細とともに表示:

コラム説明
地域地域識別子
場所都市/国
レイテンシー測定されたping時間
ステータス利用可能/配備済み

賢く選びなさい

ユーザーに最も近いリージョンを選択して、最低のレイテンシーを実現してください。グローバルなカバレッジを確保するため、複数のリージョンへのデプロイを検討してください。

利用可能な地域

アメリカ大陸(15地域)

地域場所
米国中部1アイオワ州、アメリカ合衆国
米国東部1アメリカ合衆国サウスカロライナ州
米国東部4バージニア州、アメリカ合衆国
米国東部5アメリカ合衆国、コロンバス
米国南部1ダラス、アメリカ合衆国
米国西部1アメリカ合衆国オレゴン州
us-west2ロサンゼルス、アメリカ合衆国
米国西部3アメリカ合衆国、ソルトレイクシティ
us-west4ラスベガス、アメリカ合衆国
北米-北東部1カナダ、モントリオール
北米-北東部2カナダ、トロント
南米-東1ブラジル、サンパウロ
南アメリカ-西1サンティアゴ、チリ

ヨーロッパ(12地域)

地域場所
ヨーロッパ-中央2ワルシャワ、ポーランド
ヨーロッパ-北1フィンランド
ヨーロッパ-南西1マドリード、スペイン
ヨーロッパ-西1ベルギー
ヨーロッパ-西2ロンドン、イギリス
ヨーロッパ-西3フランクフルト、ドイツ
ヨーロッパ-西4オランダ
ヨーロッパ-西6スイス、チューリッヒ
ヨーロッパ-西8ミラノ、イタリア
ヨーロッパ-西9フランス、パリ
ヨーロッパ-西10ドイツ、ベルリン
ヨーロッパ-西12イタリア、トリノ

アジア太平洋地域(16地域)

地域場所
アジア-東1台湾
アジア-東2香港
アジア-北東1日本、東京
アジア-北東2日本、大阪
アジア-北東3韓国、ソウル
アジア-南1ムンバイ、インド
アジア-南2デリー、インド
アジア-東南アジア1シンガポール
アジア-東南アジア2ジャカルタ、インドネシア
オーストラリア-南東部1シドニー、オーストラリア
オーストラリア-南東部2メルボルン、オーストラリア
私中心1ドーハ、カタール
私中心2サウジアラビア、ダンマーム
me-west1テルアビブ、イスラエル

エンドポイント構成

エンドポイントを作成する際:

設定説明デフォルト
地域デプロイメント地域-
最小インスタンス数最小稼働インスタンス数0
最大インスタンス数最大スケーリング限界10

スケーリングオプション

設定行動
最小値 = 0アイドル時はゼロにスケール(コスト効率的)
最小値 > 0常時稼働でコールドスタートなし
マックストラフィック急増の上限

コールドスタート

最小インスタンス数 = 0 の場合、アイドル状態後の最初のリクエストでコールドスタートが発生します(2~5秒)。レイテンシに敏感なアプリケーションでは、最小インスタンス数を 0 より大きく設定してください。

エンドポイントの管理

エンドポイントの表示と管理:

エンドポイントの詳細

フィールド説明
URLリクエスト用のHTTPSエンドポイント
地域デプロイされたリージョン
ステータス実行中、停止中、デプロイ中
インスタンス現在のインスタンス数/最大インスタンス数

エンドポイントURL

各エンドポイントには固有のURLがあります:

https://model-abc123-us-central1.a.run.app

コピーボタンをクリックしてURLをコピーしてください。

ライフサイクル管理

エンドポイントの状態を制御する:

アクション説明
開始停止したエンドポイントを再開する
止まれエンドポイントを一時停止(課金なし)
削除エンドポイントを完全に削除する

停止エンドポイント

エンドポイントを停止して課金の一時停止を行う:

  1. エンドポイントアクションメニューを開く
  2. 停止をクリック
  3. 操作を確認

停止したエンドポイント:

  • リクエストを受け入れないでください
  • 料金が発生しないようにしてください
  • いつでも再起動可能

エンドポイントを削除

エンドポイントを完全に削除する:

  1. エンドポイントアクションメニューを開く
  2. 削除をクリック
  3. 削除を確認

恒久的な措置

削除は即時かつ永続的です。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

リクエストにAPIキーを含めてください:

Authorization: Bearer YOUR_API_KEY

リクエスト例

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

応答フォーマット

タスク固有のフィールドを用いた共有推論と同様。

価格設定

専用エンドポイント料金は以下に基づいて請求されます:

コンポーネントレート
CPUvCPUあたり秒
メモリギガバイト毎秒
リクエスト100万リクエストあたり

コスト最適化

  • 開発用エンドポイントにはスケール・トゥ・ゼロを使用する
  • 適切な最大インスタンス数を設定する
  • モニタリングダッシュボードでの使用状況の監視

よくある質問

作成できるエンドポイントの数は何個ですか?

厳密な上限はありません。各モデルは複数のリージョンにエンドポイントを持つことができます。エンドポイントの総数はご利用のプランによって異なります。

デプロイ後にリージョンを変更できますか?

いいえ、地域は固定されています。地域を変更するには:

  1. 既存のエンドポイントを削除する
  2. 目的のリージョンに新しいエンドポイントを作成する

マルチリージョン展開をどのように処理すればよいですか?

世界的な報道のため:

  1. 複数のリージョンにデプロイする
  2. ロードバランサーまたはDNSルーティングを使用する
  3. ユーザーを最寄りのエンドポイントに誘導する

コールドスタートの時間はいつですか?

コールドスタートはモデルサイズによって異なります:

モデルコールドスタート
YOLO11n約2秒
YOLO11m約3秒
YOLO11x約5秒

最小インスタンス数を 0 以上に設定して、コールドスタートを排除します。

カスタムドメインは使用できますか?

カスタムドメインはまもなく提供開始予定です。現在、エンドポイントはプラットフォーム生成のURLを使用しています。



📅 0日前に作成 ✏️ 0日前に更新
glenn-jocher

コメント