専用エンドポイント

Q: How many endpoints can I create?

エンドポイントの制限はプランによって異なります：各モデルは、プランのクォータ内で複数のリージョンに引き続きデプロイできます。

Q: How do I handle multi-region deployment?

グローバルカバレッジの場合：

Q: What's the cold start time?

コールドスタート時間は、モデルのサイズと、コンテナが既にリージョンにキャッシュされているかどうかに依存します。典型的な範囲：ヘルスチェックは、最悪のケースのコールドスタートに対応するため、55秒のタイムアウトを使用します。

Ultralytics 、YOLO 専用エンドポイントへデプロイすることを可能にします。各エンドポイントは、自動スケーリング機能、固有のエンドポイントURL、独立した監視を備えたシングルテナントサービスです。

Ultralytics モデルデプロイタブ（地域マップとテーブル付き）

エンドポイントを作成

デプロイタブから

モデルをその Deploy タブ:

モデルに移動
デプロイタブをクリック
地域テーブルから地域を選択してください（お客様の所在地からの遅延順に並べ替え済み）
リージョンの行で「デプロイ」をクリック

デプロイメント名はモデル名とリージョン都市名から自動生成されます（例： yolo11n-iowa)。

デプロイメントページから

グローバルからデプロイメントを作成する Deploy サイドバーのページ:

新規デプロイをクリック
モデルセレクターからモデルを選択してください
地図または表から地域を選択してください
必要に応じてデプロイメント名とリソースをカスタマイズできます
モデルを展開

Ultralytics 新規デプロイダイアログ（モデルセレクターと地域マップ付き）

デプロイメントライフサイクル

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

領域選択

世界43地域から選択可能。インタラクティブな地域マップと表では以下が表示されます：

Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
デプロイ済みリージョン: 「デプロイ済み」バッジで強調表示
展開中のリージョン: アニメーション付きパルスインジケーター
双方向ハイライト：地図上にカーソルを合わせるとテーブルの行がハイライトされ、その逆も同様です

Ultralytics デプロイタブにおけるリージョン遅延テーブル（遅延順にソート）

モデルのリージョンテーブル Deploy タブには以下が含まれます：

列	説明
ロケーション	国と都市（国旗アイコン付き）
ゾーン	リージョン識別子
レイテンシー	測定されたping時間（3回のpingの中央値）
距離	現在地からの距離（km）
アクション	デプロイボタンまたは「デプロイ済み」ステータスバッジ

新規デプロイダイアログ

The New Deployment ダイアログ（グローバルから） Deploy ページ）は、Location、Latency、Selectの列のみを含む、よりシンプルなリージョンテーブルを示しています。

慎重に選択してください

ユーザーに最も近い地域を選択して、最低のレイテンシーを実現してください。現在の場所からのレイテンシーを再測定するには、[再スキャン]ボタンを使用してください。

利用可能なリージョン

アメリカ大陸 (14)ヨーロッパ (13)アジア太平洋地域 (12)中東・アフリカ (4)

ゾーン	ロケーション
us-central1	アイオワ州、米国
us-east1	サウスカロライナ州、米国
us-east4	アメリカ合衆国、バージニア州北部
us-east5	コロンバス、米国
us-south1	ダラス、米国
us-west1	オレゴン州、米国
us-west2	ロサンゼルス、米国
us-west3	ソルトレイクシティ、米国
us-west4	ラスベガス、米国
northamerica-northeast1	モントリオール、カナダ
northamerica-northeast2	トロント、カナダ
北アメリカ-南1	ケレタロ、メキシコ
southamerica-east1	ブラジル、サンパウロ
southamerica-west1	サンティアゴ、チリ

ゾーン	ロケーション
europe-west1	ベルギー、サン＝ジスラン
europe-west2	ロンドン、英国
europe-west3	フランクフルト、ドイツ
europe-west4	オランダ、エームハーフェン
europe-west6	チューリッヒ、スイス
europe-west8	ミラノ、イタリア
europe-west9	パリ、フランス
europe-west10	ベルリン、ドイツ
europe-west12	トリノ、イタリア
europe-north1	ハミナ、フィンランド
ヨーロッパ-北2	ストックホルム、スウェーデン
europe-central2	ワルシャワ、ポーランド
europe-southwest1	マドリード、スペイン

ゾーン	ロケーション
asia-east1	彰化、台湾
asia-east2	九龍、香港
asia-northeast1	東京、日本
asia-northeast2	大阪、日本
asia-northeast3	韓国、ソウル
asia-south1	ムンバイ、インド
asia-south2	デリー、インド
asia-southeast1	ジュロン・ウエスト、シンガポール
asia-southeast2	ジャカルタ、インドネシア
アジア-東南アジア3	タイ、バンコク
australia-southeast1	シドニー、オーストラリア
australia-southeast2	メルボルン、オーストラリア

ゾーン	ロケーション
アフリカ-南1	南アフリカ共和国、ヨハネスブルグ
me-central1	ドーハ、カタール
me-central2	ダンマーム、サウジアラビア
me-west1	テルアビブ、イスラエル

エンドポイント設定

新規デプロイダイアログ

The New Deployment ダイアログは以下を提供します：

設定	説明	デフォルト
モデル	完成モデルから選択	-
リージョン	デプロイリージョン	-
デプロイメント名	自動生成、編集可能	-
CPU	CPU (1-8)	1
メモリ (GB)	メモリ割り当て（1～32 GB）	2

Ultralytics 新規デプロイダイアログリソースパネルが拡張されました

リソース設定は折りたたみ可能な「リソース」セクションで利用可能です。デプロイメントはデフォルトでスケール・トゥ・ゼロを使用します（最小インスタンス数 = 0、最大インスタンス数 = 1）— アクティブな推論時間に対してのみ課金されます。

自動生成された名前

デプロイメント名はモデル名とリージョン都市から自動的に生成されます（例： yolo11n-iowa同じモデルを同じリージョンに再度デプロイすると、数値のサフィックスが追加されます（例： yolo11n-iowa-2)。

デプロイタブ（クイックデプロイ）

モデルからデプロイする際 Deploy タブでは、スケール・トゥ・ゼロが有効化された状態で、デフォルトのリソース（1CPU、2 GB メモリ）を持つエンドポイントが作成されます。デプロイメント名は自動生成されます。

エンドポイントを管理

表示モード

デプロイメント一覧は3つの表示モードをサポートしています：

モード	説明
カード	詳細カード（ログ、コード例、予測パネル付き）
コンパクト	主要指標を示す小型カードのグリッド
表	ソート可能な列と検索機能を備えたDataTable

Ultralytics プロイタブアクティブなデプロイメントカードビュー

デプロイメントカード（カードビュー）

カードビューの各デプロイメントカードには以下が表示されます：

ヘッダー：名前、地域フラグ、ステータスバッジ、開始/停止/削除ボタン
エンドポイントURL: APIドキュメントへのリンク付きコピー可能なURL
メトリクス: リクエスト数（24時間）、P95レイテンシ、エラー率
ヘルスチェック：遅延と手動更新機能付きライブヘルスインジケーター
タブ: Logs, Code、および Predict

The Logs タブには、重大度フィルター（すべて／エラー）で絞り込んだ最近のログエントリが表示されます。 Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、cURLのすぐに使えるコード例が表示されます。 Predict tabは、デプロイ先で直接テストするためのインライン予測パネルを提供します。

デプロイ状況

ステータス	説明
作成	デプロイメントが設定中です
デプロイ	コンテナが起動中です
準備完了	エンドポイントは稼働中でリクエストを受け付けています
停止	エンドポイントがシャットダウン中です
停止した	エンドポイントが一時停止中（課金なし）
失敗した	デプロイに失敗しました（エラーメッセージを参照）

エンドポイントURL

各エンドポイントには固有のURLがあります。例：

https://predict-abc123.run.app

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイントの自動生成されたAPIドキュメントを表示できます。

ライフサイクル管理

エンドポイントの状態を制御します:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff

アクション	説明
開始	停止中のエンドポイントを再開します
停止	エンドポイントを一時停止します（課金なし）
削除	エンドポイントを完全に削除します

エンドポイントを停止

エンドポイントを停止して課金を一時停止します:

デプロイメントカードのポーズアイコンをクリックしてください
エンドポイントの状態が「停止中」に変化し、その後「停止済み」となる

停止済みエンドポイント:

リクエストを受け付けません
料金は発生しません
いつでも再起動できます

エンドポイントを削除

エンドポイントを完全に削除します:

デプロイメントカードの削除（ごみ箱）アイコンをクリックしてください
ダイアログで削除を確認

恒久的な操作

削除は即座に、かつ永続的に行われます。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

各デプロイは、アカウントのAPIキーを使用して作成されます。リクエストに含めてください：

Authorization: Bearer YOUR_API_KEY

APIキープレフィックスは識別のためデプロイメントカードのフッターに表示されます。APIキーからキーを生成してください。

レート制限なし

専用エンドポイントはプラットフォームAPIのレート制限の対象外です。リクエストは直接専用サービスに送信されるため、スループットはCPU、メモリ、スケーリング設定によってのみ制限されます。これは共有推論（APIキーあたり20リクエスト/分のレート制限あり）に対する主要な利点です。

リクエスト例

PythonJavaScriptcURL

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);

curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

リクエストパラメータ

パラメータ	種類	デフォルト	説明
`file`	ファイル	-	画像ファイル（必須）
`conf`	float	0.25	最小信頼度しきい値
`iou`	float	0.7	NMS IoUしきい値
`imgsz`	int	640	入力画像サイズ
`normalize`	string	-	正規化された座標を返す

応答形式

タスク固有のフィールドを持つ共有推論と同じです。

料金

専用エンドポイントの課金基準：

コンポーネント	レート
CPU	vCPU秒あたり
メモリ	GB秒あたり
リクエスト	100万リクエストあたり

コスト最適化

開発用エンドポイントにはスケール・トゥ・ゼロを使用します。
適切な最大インスタンス数を設定します。
監視ダッシュボードで利用状況を監視します。
設定＞請求で料金を確認する

よくある質問

いくつのエンドポイントを作成できますか？

エンドポイントの制限はプランによって異なります：

無料: 最大3回のデプロイ
プロ：最大10回のデプロイ
エンタープライズ: 無制限のデプロイメント

各モデルは、プランのクォータ内であれば、複数のリージョンにデプロイできます。

デプロイ後にリージョンを変更できますか？

いいえ、リージョンは固定されています。リージョンを変更するには：

既存のエンドポイントを削除します。
希望するリージョンに新しいエンドポイントを作成します。

マルチリージョンデプロイメントはどのように扱いますか？

グローバルカバレッジの場合：

複数のリージョンにデプロイします。
ロードバランサーまたはDNSルーティングを使用します。
ユーザーを最寄りのエンドポイントにルーティングします。

コールドスタート時間はどのくらいですか？

コールドスタート時間はモデルサイズと、コンテナが既にリージョンにキャッシュされているか否かに依存します。典型的な範囲：

シナリオ	コールドスタート
キャッシュされたコンテナ	約5～15秒
初回デプロイ/リージョン	約15～45秒

ヘルスチェックは、最悪のケースであるコールドスタートに対応するため、55秒のタイムアウトを使用します。

カスタムドメインを使用できますか？

カスタムドメインは近日公開予定です。現在、エンドポイントはプラットフォームが生成したURLを使用しています。

📅 1ヶ月前に作成 ✏️ 5日前に更新

専用エンドポイント

エンドポイントを作成

デプロイタブから

デプロイメントページから

デプロイメントライフサイクル

領域選択

利用可能なリージョン

エンドポイント設定

新規デプロイダイアログ

デプロイタブ（クイックデプロイ）

エンドポイントを管理

表示モード

デプロイメントカード（カードビュー）

デプロイ状況

エンドポイントURL

ライフサイクル管理

エンドポイントを停止

エンドポイントを削除

エンドポイントの使用

認証

レート制限なし

リクエスト例

リクエストパラメータ

応答形式

料金

よくある質問

いくつのエンドポイントを作成できますか？

デプロイ後にリージョンを変更できますか？

マルチリージョンデプロイメントはどのように扱いますか？

コールドスタート時間はどのくらいですか？

カスタムドメインを使用できますか？

コメント