専用エンドポイント
Ultralytics 43のグローバルリージョンにおけるYOLO 可能にします。各エンドポイントは、自動スケーリング、カスタムURL、独立した監視機能を備えたシングルテナントサービスです。
エンドポイントを作成する
モデルを専用エンドポイントにデプロイする:
- モデルに移動してください
- デプロイタブをクリックしてください
- 地図から地域を選択してください
- デプロイをクリック
地域選択
世界43地域から選択:
インタラクティブマップには以下が表示されます:
- 地域ピン:クリックして選択
- レイテンシ指標距離による色分け
- Green: <100ms
- 黄色: 100-200ミリ秒
- 赤: >200ミリ秒
地域表
すべての地域を詳細とともに表示:
| コラム | 説明 |
|---|---|
| 地域 | 地域識別子 |
| 場所 | 都市/国 |
| レイテンシー | 測定されたping時間 |
| ステータス | 利用可能/配備済み |
賢く選びなさい
ユーザーに最も近いリージョンを選択して、最低のレイテンシーを実現してください。グローバルなカバレッジを確保するため、複数のリージョンへのデプロイを検討してください。
利用可能な地域
アメリカ大陸(15地域)
| 地域 | 場所 |
|---|---|
| 米国中部1 | アイオワ州、アメリカ合衆国 |
| 米国東部1 | アメリカ合衆国サウスカロライナ州 |
| 米国東部4 | バージニア州、アメリカ合衆国 |
| 米国東部5 | アメリカ合衆国、コロンバス |
| 米国南部1 | ダラス、アメリカ合衆国 |
| 米国西部1 | アメリカ合衆国オレゴン州 |
| us-west2 | ロサンゼルス、アメリカ合衆国 |
| 米国西部3 | アメリカ合衆国、ソルトレイクシティ |
| us-west4 | ラスベガス、アメリカ合衆国 |
| 北米-北東部1 | カナダ、モントリオール |
| 北米-北東部2 | カナダ、トロント |
| 南米-東1 | ブラジル、サンパウロ |
| 南アメリカ-西1 | サンティアゴ、チリ |
ヨーロッパ(12地域)
| 地域 | 場所 |
|---|---|
| ヨーロッパ-中央2 | ワルシャワ、ポーランド |
| ヨーロッパ-北1 | フィンランド |
| ヨーロッパ-南西1 | マドリード、スペイン |
| ヨーロッパ-西1 | ベルギー |
| ヨーロッパ-西2 | ロンドン、イギリス |
| ヨーロッパ-西3 | フランクフルト、ドイツ |
| ヨーロッパ-西4 | オランダ |
| ヨーロッパ-西6 | スイス、チューリッヒ |
| ヨーロッパ-西8 | ミラノ、イタリア |
| ヨーロッパ-西9 | フランス、パリ |
| ヨーロッパ-西10 | ドイツ、ベルリン |
| ヨーロッパ-西12 | イタリア、トリノ |
アジア太平洋地域(16地域)
| 地域 | 場所 |
|---|---|
| アジア-東1 | 台湾 |
| アジア-東2 | 香港 |
| アジア-北東1 | 日本、東京 |
| アジア-北東2 | 日本、大阪 |
| アジア-北東3 | 韓国、ソウル |
| アジア-南1 | ムンバイ、インド |
| アジア-南2 | デリー、インド |
| アジア-東南アジア1 | シンガポール |
| アジア-東南アジア2 | ジャカルタ、インドネシア |
| オーストラリア-南東部1 | シドニー、オーストラリア |
| オーストラリア-南東部2 | メルボルン、オーストラリア |
| 私中心1 | ドーハ、カタール |
| 私中心2 | サウジアラビア、ダンマーム |
| me-west1 | テルアビブ、イスラエル |
エンドポイント構成
エンドポイントを作成する際:
| 設定 | 説明 | デフォルト |
|---|---|---|
| 地域 | デプロイメント地域 | - |
| 最小インスタンス数 | 最小稼働インスタンス数 | 0 |
| 最大インスタンス数 | 最大スケーリング限界 | 10 |
スケーリングオプション
| 設定 | 行動 |
|---|---|
| 最小値 = 0 | アイドル時はゼロにスケール(コスト効率的) |
| 最小値 > 0 | 常時稼働でコールドスタートなし |
| マックス | トラフィック急増の上限 |
コールドスタート
最小インスタンス数 = 0 の場合、アイドル状態後の最初のリクエストでコールドスタートが発生します(2~5秒)。レイテンシに敏感なアプリケーションでは、最小インスタンス数を 0 より大きく設定してください。
エンドポイントの管理
エンドポイントの表示と管理:
エンドポイントの詳細
| フィールド | 説明 |
|---|---|
| URL | リクエスト用のHTTPSエンドポイント |
| 地域 | デプロイされたリージョン |
| ステータス | 実行中、停止中、デプロイ中 |
| インスタンス | 現在のインスタンス数/最大インスタンス数 |
エンドポイントURL
各エンドポイントには固有のURLがあります:
https://model-abc123-us-central1.a.run.app
コピーボタンをクリックしてURLをコピーしてください。
ライフサイクル管理
エンドポイントの状態を制御する:
| アクション | 説明 |
|---|---|
| 開始 | 停止したエンドポイントを再開する |
| 止まれ | エンドポイントを一時停止(課金なし) |
| 削除 | エンドポイントを完全に削除する |
停止エンドポイント
エンドポイントを停止して課金の一時停止を行う:
- エンドポイントアクションメニューを開く
- 停止をクリック
- 操作を確認
停止したエンドポイント:
- リクエストを受け入れないでください
- 料金が発生しないようにしてください
- いつでも再起動可能
エンドポイントを削除
エンドポイントを完全に削除する:
- エンドポイントアクションメニューを開く
- 削除をクリック
- 削除を確認
恒久的な措置
削除は即時かつ永続的です。新しいエンドポイントはいつでも作成できます。
エンドポイントの使用
認証
リクエストにAPIキーを含めてください:
Authorization: Bearer YOUR_API_KEY
リクエスト例
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
応答フォーマット
タスク固有のフィールドを用いた共有推論と同様。
価格設定
専用エンドポイント料金は以下に基づいて請求されます:
| コンポーネント | レート |
|---|---|
| CPU | vCPUあたり秒 |
| メモリ | ギガバイト毎秒 |
| リクエスト | 100万リクエストあたり |
コスト最適化
- 開発用エンドポイントにはスケール・トゥ・ゼロを使用する
- 適切な最大インスタンス数を設定する
- モニタリングダッシュボードでの使用状況の監視
よくある質問
作成できるエンドポイントの数は何個ですか?
厳密な上限はありません。各モデルは複数のリージョンにエンドポイントを持つことができます。エンドポイントの総数はご利用のプランによって異なります。
デプロイ後にリージョンを変更できますか?
いいえ、地域は固定されています。地域を変更するには:
- 既存のエンドポイントを削除する
- 目的のリージョンに新しいエンドポイントを作成する
マルチリージョン展開をどのように処理すればよいですか?
世界的な報道のため:
- 複数のリージョンにデプロイする
- ロードバランサーまたはDNSルーティングを使用する
- ユーザーを最寄りのエンドポイントに誘導する
コールドスタートの時間はいつですか?
コールドスタートはモデルサイズによって異なります:
| モデル | コールドスタート |
|---|---|
| YOLO11n | 約2秒 |
| YOLO11m | 約3秒 |
| YOLO11x | 約5秒 |
最小インスタンス数を 0 以上に設定して、コールドスタートを排除します。
カスタムドメインは使用できますか?
カスタムドメインはまもなく提供開始予定です。現在、エンドポイントはプラットフォーム生成のURLを使用しています。