専用エンドポイント
Ultralytics 、YOLO 専用エンドポイントへデプロイすることを可能にします。各エンドポイントは、自動スケーリング機能、固有のエンドポイントURL、独立した監視を備えたシングルテナントサービスです。

エンドポイントを作成
デプロイタブから
モデルをその Deploy タブ:
- モデルに移動
- デプロイタブをクリック
- 地域テーブルから地域を選択してください(お客様の所在地からの遅延順に並べ替え済み)
- リージョンの行で「デプロイ」をクリック
デプロイメント名はモデル名とリージョン都市名から自動生成されます(例: yolo11n-iowa)。
デプロイメントページから
グローバルからデプロイメントを作成する Deploy サイドバーのページ:
- 新規デプロイをクリック
- モデルセレクターからモデルを選択してください
- 地図または表から地域を選択してください
- 必要に応じてデプロイメント名とリソースをカスタマイズできます
- モデルを展開

デプロイメントライフサイクル
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
領域選択
世界43地域から選択可能。インタラクティブな地域マップと表では以下が表示されます:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- デプロイ済みリージョン: 「デプロイ済み」バッジで強調表示
- 展開中のリージョン: アニメーション付きパルスインジケーター
- 双方向ハイライト:地図上にカーソルを合わせるとテーブルの行がハイライトされ、その逆も同様です

モデルのリージョンテーブル Deploy タブには以下が含まれます:
| 列 | 説明 |
|---|---|
| ロケーション | 国と都市(国旗アイコン付き) |
| ゾーン | リージョン識別子 |
| レイテンシー | 測定されたping時間(3回のpingの中央値) |
| 距離 | 現在地からの距離(km) |
| アクション | デプロイボタンまたは「デプロイ済み」ステータスバッジ |
新規デプロイダイアログ
The New Deployment ダイアログ(グローバルから) Deploy ページ)は、Location、Latency、Selectの列のみを含む、よりシンプルなリージョンテーブルを示しています。
慎重に選択してください
ユーザーに最も近い地域を選択して、最低のレイテンシーを実現してください。現在の場所からのレイテンシーを再測定するには、[再スキャン]ボタンを使用してください。
利用可能なリージョン
| ゾーン | ロケーション |
|---|---|
| us-central1 | アイオワ州、米国 |
| us-east1 | サウスカロライナ州、米国 |
| us-east4 | アメリカ合衆国、バージニア州北部 |
| us-east5 | コロンバス、米国 |
| us-south1 | ダラス、米国 |
| us-west1 | オレゴン州、米国 |
| us-west2 | ロサンゼルス、米国 |
| us-west3 | ソルトレイクシティ、米国 |
| us-west4 | ラスベガス、米国 |
| northamerica-northeast1 | モントリオール、カナダ |
| northamerica-northeast2 | トロント、カナダ |
| 北アメリカ-南1 | ケレタロ、メキシコ |
| southamerica-east1 | ブラジル、サンパウロ |
| southamerica-west1 | サンティアゴ、チリ |
| ゾーン | ロケーション |
|---|---|
| europe-west1 | ベルギー、サン=ジスラン |
| europe-west2 | ロンドン、英国 |
| europe-west3 | フランクフルト、ドイツ |
| europe-west4 | オランダ、エームハーフェン |
| europe-west6 | チューリッヒ、スイス |
| europe-west8 | ミラノ、イタリア |
| europe-west9 | パリ、フランス |
| europe-west10 | ベルリン、ドイツ |
| europe-west12 | トリノ、イタリア |
| europe-north1 | ハミナ、フィンランド |
| ヨーロッパ-北2 | ストックホルム、スウェーデン |
| europe-central2 | ワルシャワ、ポーランド |
| europe-southwest1 | マドリード、スペイン |
| ゾーン | ロケーション |
|---|---|
| asia-east1 | 彰化、台湾 |
| asia-east2 | 九龍、香港 |
| asia-northeast1 | 東京、日本 |
| asia-northeast2 | 大阪、日本 |
| asia-northeast3 | 韓国、ソウル |
| asia-south1 | ムンバイ、インド |
| asia-south2 | デリー、インド |
| asia-southeast1 | ジュロン・ウエスト、シンガポール |
| asia-southeast2 | ジャカルタ、インドネシア |
| アジア-東南アジア3 | タイ、バンコク |
| australia-southeast1 | シドニー、オーストラリア |
| australia-southeast2 | メルボルン、オーストラリア |
| ゾーン | ロケーション |
|---|---|
| アフリカ-南1 | 南アフリカ共和国、ヨハネスブルグ |
| me-central1 | ドーハ、カタール |
| me-central2 | ダンマーム、サウジアラビア |
| me-west1 | テルアビブ、イスラエル |
エンドポイント設定
新規デプロイダイアログ
The New Deployment ダイアログは以下を提供します:
| 設定 | 説明 | デフォルト |
|---|---|---|
| モデル | 完成モデルから選択 | - |
| リージョン | デプロイリージョン | - |
| デプロイメント名 | 自動生成、編集可能 | - |
| CPU | CPU (1-8) | 1 |
| メモリ (GB) | メモリ割り当て(1~32 GB) | 2 |

リソース設定は折りたたみ可能な「リソース」セクションで利用可能です。デプロイメントはデフォルトでスケール・トゥ・ゼロを使用します(最小インスタンス数 = 0、最大インスタンス数 = 1)— アクティブな推論時間に対してのみ課金されます。
自動生成された名前
デプロイメント名はモデル名とリージョン都市から自動的に生成されます(例: yolo11n-iowa同じモデルを同じリージョンに再度デプロイすると、数値のサフィックスが追加されます(例: yolo11n-iowa-2)。
デプロイタブ(クイックデプロイ)
モデルからデプロイする際 Deploy タブでは、スケール・トゥ・ゼロが有効化された状態で、デフォルトのリソース(1CPU、2 GB メモリ)を持つエンドポイントが作成されます。デプロイメント名は自動生成されます。
エンドポイントを管理
表示モード
デプロイメント一覧は3つの表示モードをサポートしています:
| モード | 説明 |
|---|---|
| カード | 詳細カード(ログ、コード例、予測パネル付き) |
| コンパクト | 主要指標を示す小型カードのグリッド |
| 表 | ソート可能な列と検索機能を備えたDataTable |

デプロイメントカード(カードビュー)
カードビューの各デプロイメントカードには以下が表示されます:
- ヘッダー:名前、地域フラグ、ステータスバッジ、開始/停止/削除ボタン
- エンドポイントURL: APIドキュメントへのリンク付きコピー可能なURL
- メトリクス: リクエスト数(24時間)、P95レイテンシ、エラー率
- ヘルスチェック:遅延と手動更新機能付きライブヘルスインジケーター
- タブ:
Logs,Code、およびPredict
The Logs タブには、重大度フィルター(すべて/エラー)で絞り込んだ最近のログエントリが表示されます。 Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、cURLのすぐに使えるコード例が表示されます。 Predict tabは、デプロイ先で直接テストするためのインライン予測パネルを提供します。
デプロイ状況
| ステータス | 説明 |
|---|---|
| 作成 | デプロイメントが設定中です |
| デプロイ | コンテナが起動中です |
| 準備完了 | エンドポイントは稼働中でリクエストを受け付けています |
| 停止 | エンドポイントがシャットダウン中です |
| 停止した | エンドポイントが一時停止中(課金なし) |
| 失敗した | デプロイに失敗しました(エラーメッセージを参照) |
エンドポイントURL
各エンドポイントには固有のURLがあります。例:
https://predict-abc123.run.app

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイントの自動生成されたAPIドキュメントを表示できます。
ライフサイクル管理
エンドポイントの状態を制御します:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| アクション | 説明 |
|---|---|
| 開始 | 停止中のエンドポイントを再開します |
| 停止 | エンドポイントを一時停止します(課金なし) |
| 削除 | エンドポイントを完全に削除します |
エンドポイントを停止
エンドポイントを停止して課金を一時停止します:
- デプロイメントカードのポーズアイコンをクリックしてください
- エンドポイントの状態が「停止中」に変化し、その後「停止済み」となる
停止済みエンドポイント:
- リクエストを受け付けません
- 料金は発生しません
- いつでも再起動できます
エンドポイントを削除
エンドポイントを完全に削除します:
- デプロイメントカードの削除(ごみ箱)アイコンをクリックしてください
- ダイアログで削除を確認
恒久的な操作
削除は即座に、かつ永続的に行われます。新しいエンドポイントはいつでも作成できます。
エンドポイントの使用
認証
各デプロイは、アカウントのAPIキーを使用して作成されます。リクエストに含めてください:
Authorization: Bearer YOUR_API_KEY
APIキープレフィックスは識別のためデプロイメントカードのフッターに表示されます。APIキーからキーを生成してください。
レート制限なし
専用エンドポイントはプラットフォームAPIのレート制限の対象外です。リクエストは直接専用サービスに送信されるため、スループットはCPU、メモリ、スケーリング設定によってのみ制限されます。これは共有推論(APIキーあたり20リクエスト/分のレート制限あり)に対する主要な利点です。
リクエスト例
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
リクエストパラメータ
| パラメータ | 種類 | デフォルト | 説明 |
|---|---|---|---|
file | ファイル | - | 画像ファイル(必須) |
conf | float | 0.25 | 最小信頼度しきい値 |
iou | float | 0.7 | NMS IoUしきい値 |
imgsz | int | 640 | 入力画像サイズ |
normalize | string | - | 正規化された座標を返す |
応答形式
タスク固有のフィールドを持つ共有推論と同じです。
料金
専用エンドポイントの課金基準:
| コンポーネント | レート |
|---|---|
| CPU | vCPU秒あたり |
| メモリ | GB秒あたり |
| リクエスト | 100万リクエストあたり |
よくある質問
いくつのエンドポイントを作成できますか?
エンドポイントの制限はプランによって異なります:
- 無料: 最大3回のデプロイ
- プロ:最大10回のデプロイ
- エンタープライズ: 無制限のデプロイメント
各モデルは、プランのクォータ内であれば、複数のリージョンにデプロイできます。
デプロイ後にリージョンを変更できますか?
いいえ、リージョンは固定されています。リージョンを変更するには:
- 既存のエンドポイントを削除します。
- 希望するリージョンに新しいエンドポイントを作成します。
マルチリージョンデプロイメントはどのように扱いますか?
グローバルカバレッジの場合:
- 複数のリージョンにデプロイします。
- ロードバランサーまたはDNSルーティングを使用します。
- ユーザーを最寄りのエンドポイントにルーティングします。
コールドスタート時間はどのくらいですか?
コールドスタート時間はモデルサイズと、コンテナが既にリージョンにキャッシュされているか否かに依存します。典型的な範囲:
| シナリオ | コールドスタート |
|---|---|
| キャッシュされたコンテナ | 約5~15秒 |
| 初回デプロイ/リージョン | 約15~45秒 |
ヘルスチェックは、最悪のケースであるコールドスタートに対応するため、55秒のタイムアウトを使用します。
カスタムドメインを使用できますか?
カスタムドメインは近日公開予定です。現在、エンドポイントはプラットフォームが生成したURLを使用しています。