Link to this section専用エンドポイント#
Ultralytics Platformでは、YOLOモデルを世界43のリージョンにある専用エンドポイントにデプロイできます。各エンドポイントは、スケール・ツー・ゼロ(scale-to-zero)動作、固有のエンドポイントURL、および独立した監視機能を備えたシングルテナントサービスです。

Link to this sectionエンドポイントを作成#
Link to this sectionデプロイ(Deploy)タブから#
モデルのDeployタブからデプロイを実行します:
- モデルのページへ移動します
- Deployタブをクリックします
- インタラクティブな世界地図からリージョンを選択します。リージョンは、現在地からのレイテンシに応じて緑から赤のグラデーションで色分けされています(速いリージョンは緑色に近く、遅いリージョンは赤色に近くなります)。
- リージョン行のDeployをクリックします
デプロイ名は、モデル名とリージョンの都市名から自動生成されます(例:yolo26n-iowa)。
Link to this sectionデプロイメント(Deployments)ページから#
サイドバーにあるグローバルなDeployページからデプロイメントを作成します:
- New Deploymentをクリックします
- モデルセレクターからモデルを選択します
- 地図または表からリージョンを選択します
- 自動生成されたデプロイ名(編集可能)とデフォルトのリソースを確認します
- Deploy Modelをクリックします

Link to this sectionデプロイメントのライフサイクル#
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteLink to this sectionリージョン選択#
世界中の43のリージョンから選択可能です。インタラクティブなリージョンマップと表には以下が表示されます:
- リージョンピン: レイテンシに応じて緑から赤のグラデーションで色分けされています(速いリージョンは緑色に近く、遅いリージョンは赤色に近くなります)
- デプロイ済みリージョン: "Deployed"バッジで強調表示されます
- デプロイ中リージョン: アニメーションによるパルスインジケーター
- 双方向ハイライト: 地図上でホバーすると対応する表の行がハイライトされ、その逆も同様です

モデルDeployタブのリージョン表には以下が含まれます:
| 列 | 説明 |
|---|---|
| 場所(Location) | 国旗アイコン付きの都市と国名 |
| ゾーン(Zone) | リージョン識別子 |
| レイテンシ | 測定されたping時間(3回のpingのメディアン) |
| 距離(Distance) | 現在地からの距離(km) |
| アクション(Actions) | デプロイボタンまたは"Deployed"ステータスバッジ |
New Deploymentダイアログ(グローバルなDeployページからアクセス)には、場所、レイテンシ、選択(Select)列のみを含むシンプルなリージョン表が表示されます。
レイテンシを最小限に抑えるため、ユーザーに最も近いリージョンを選択してください。Rescanボタンを使用して、現在地からのレイテンシを再測定できます。
Link to this section利用可能なリージョン#
| ゾーン | 場所 |
|---|---|
| us-central1 | 米国アイオワ州 |
| us-east1 | サウスカロライナ州、米国 |
| us-east4 | バージニア州北部、米国 |
| us-east5 | コロンバス、米国 |
| us-south1 | ダラス、米国 |
| us-west1 | オレゴン州、米国 |
| us-west2 | ロサンゼルス、米国 |
| us-west3 | ソルトレイクシティ、米国 |
| us-west4 | ラスベガス、米国 |
| northamerica-northeast1 | モントリオール、カナダ |
| northamerica-northeast2 | トロント、カナダ |
| northamerica-south1 | ケレタロ、メキシコ |
| southamerica-east1 | サンパウロ、ブラジル |
| southamerica-west1 | サンティアゴ、チリ |
Link to this sectionエンドポイント設定#
Link to this section新しいデプロイメント(New Deployment)ダイアログ#
New Deployment(新規デプロイ)ダイアログには以下の項目があります:
| 設定 | 説明 | デフォルト |
|---|---|---|
| モデル | 完了済みのモデルから選択 | - |
| リージョン | デプロイメントリージョン | - |
| デプロイ名 | 自動生成、編集可能 | - |
| CPUコア数 | デフォルトで固定 | 1 |
| メモリ (GB) | デフォルトで固定 | 2 |

デプロイは 1 CPU、2 GiB メモリ、minInstances = 0、maxInstances = 1 のデフォルト設定で固定されます。アイドル時にはゼロへスケーリングされるため、アクティブな推論時間に対してのみ料金が発生します。
デプロイ名は、モデル名とリージョン都市名から自動的に生成されます(例: yolo26n-iowa)。同じモデルを同じリージョンに再度デプロイする場合、数字のサフィックスが追加されます(例: yolo26n-iowa-2)。
Link to this sectionデプロイタブ(クイックデプロイ)#
モデルの Deploy(デプロイ)タブからデプロイする場合、エンドポイントはデフォルトのリソース(1 CPU、2 GBメモリ)で作成され、ゼロへのスケーリングが有効になります。デプロイ名は自動生成されます。
Link to this sectionエンドポイントの管理#
Link to this sectionビューモード#
デプロイリストは以下の3つの表示モードをサポートしています:
| モード | 説明 |
|---|---|
| カード | ログ、コード例、予測パネルを備えた詳細カード |
| コンパクト | 主要メトリクスを表示する小型カードのグリッド |
| テーブル | ソート可能な列と検索機能を備えたデータテーブル |

Link to this sectionデプロイカード(カード表示)#
カード表示における各デプロイカードには以下が表示されます:
- ヘッダー: 名前、リージョンフラグ、ステータスバッジ、開始/停止/削除ボタン
- エンドポイントURL: APIドキュメントへのリンク付きのコピー可能なURL
- メトリクス: リクエスト数(24時間)、P95レイテンシ、エラー率
- ヘルスチェック: レイテンシと手動更新機能を備えたライブヘルスインジケーター
- タブ:
Logs(ログ)、Code(コード)、Predict(予測)
Logs タブには、重大度フィルタリング(すべて/エラー)付きの最近のログエントリが表示されます。Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、およびcURL用のすぐに使えるコード例が表示されます。Predict タブには、デプロイ上で直接テストを行うためのインライン予測パネルが用意されています。
Link to this sectionデプロイステータス#
| ステータス | 説明 |
|---|---|
| Creating(作成中) | デプロイを設定中です |
| Deploying(デプロイ中) | コンテナを起動しています |
| Ready(準備完了) | エンドポイントはライブ状態でリクエストを受け付けています |
| Stopping(停止中) | エンドポイントをシャットダウンしています |
| Stopped(停止済み) | エンドポイントは一時停止中です(課金なし) |
| Failed | デプロイに失敗しました(エラーメッセージを確認してください) |
Link to this sectionエンドポイントURL#
各エンドポイントには固有のURLがあります。例:
https://predict-abc123.run.app

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックして、エンドポイント用に自動生成されたAPIドキュメントを表示します。
Link to this sectionライフサイクル管理#
エンドポイントの状態を制御します:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| アクション | 説明 |
|---|---|
| Start(開始) | 停止中のエンドポイントを再開します |
| Stop(停止) | エンドポイントを一時停止します(課金なし) |
| Delete | エンドポイントを完全に削除します |
Link to this sectionエンドポイントの停止#
エンドポイントを停止して課金を一時停止します:
- デプロイカードの一時停止アイコンをクリックします
- エンドポイントステータスが「停止中」に変わり、その後「停止済み」になります
停止済みのエンドポイントは:
- リクエストを受け付けません
- 料金が発生しません
- いつでも再起動できます
Link to this sectionエンドポイントの削除#
エンドポイントを完全に削除します:
- デプロイカードの削除(ゴミ箱)アイコンをクリックします
- ダイアログで削除を確定します
削除は即時かつ永続的です。新しいエンドポイントはいつでも作成可能です。
Link to this sectionエンドポイントの使用#
Link to this section認証#
各デプロイは、お客様のアカウントのAPIキーを使用して作成されます。リクエストにそれを含めてください:
Authorization: Bearer YOUR_API_KEYAPIキーのプレフィックスは、識別のためにデプロイカードのフッターに表示されます。API Keys からキーを生成してください。
Link to this sectionレート制限なし#
専用エンドポイントのURLに直接送信されたリクエストは、Platform APIのレート制限の対象外となります。スループットはエンドポイントのCPU、メモリ、およびスケーリング設定のみによって制限されます。(ブラウザ内のテスターなど、Platform APIを介してプロキシされるリクエストは、標準の20リクエスト/分の予測制限が適用されます。)これは 共有推論 に対する重要な利点であり、共有推論はAPIキーごとに20リクエスト/分にレート制限されています。
Link to this sectionリクエストの例#
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Link to this sectionリクエストパラメータ#
| パラメータ | タイプ | デフォルト | 範囲 | 説明 |
|---|---|---|---|---|
file | ファイル | - | - | 画像または動画ファイル(必須) |
conf | float | 0.25 | 0.01 – 1.0 | 最小信頼度しきい値 |
iou | float | 0.7 | 0.0 – 0.95 | NMS IoUしきい値 |
imgsz | int | 640 | 32 – 1280 | 入力画像のサイズ(ピクセル単位) |
normalize | bool | false | - | バウンディングボックスの座標を0~1で返します |
decimals | int | 5 | 0 – 10 | 座標値の小数点以下の精度 |
source | string | - | - | 画像URLまたはbase64文字列(fileの代替として使用) |
専用エンドポイントは、file パラメータを介して画像と動画の両方を受け付けます。
- 画像フォーマット(最大100 MB):AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- 動画フォーマット(最大100 MB):ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.
Link to this sectionレスポンスフォーマット#
共有推論と同じで、タスク固有のフィールドが含まれます。
Link to this section価格設定#
基本的な専用エンドポイントは、すべてのプランで無料です。より高いリソース構成(より多くのvCPU、より多くのメモリ、ウォームスタート)については、将来的に使用量に応じた価格設定を提供する予定です。
- スケール・トゥ・ゼロ(デフォルト)を使用して、リクエストを受信したときにのみエンドポイントが実行されるようにします
- トラフィックに合わせて適切な最大インスタンス数を設定します
- モニタリングダッシュボードで使用状況を監視します
Link to this sectionよくある質問 (FAQ)#
Link to this section作成できるエンドポイントの数はいくつですか?#
エンドポイントの制限はプランによって異なります:
- Free: 最大3つのデプロイメント
- Pro: 最大10のデプロイメント
- Enterprise: 無制限のデプロイメント
各モデルは、プランの割り当ての範囲内で、複数のリージョンにデプロイできます。
Link to this sectionデプロイ後にリージョンを変更できますか?#
いいえ、リージョンは固定されています。リージョンを変更するには、次の手順を行います:
- 既存のエンドポイントを削除する
- 希望するリージョンに新しいエンドポイントを作成する
Link to this sectionマルチリージョンデプロイメントをどのように処理すればよいですか?#
グローバルなカバレッジを実現するには:
- 複数のリージョンにデプロイする
- ロードバランサーまたはDNSルーティングを使用する
- ユーザーを最も近いエンドポイントにルーティングする
Link to this sectionコールドスタート時間はどのくらいですか?#
コールドスタート時間は、モデルのサイズと、コンテナがすでにリージョン内にキャッシュされているかどうかによって異なります。典型的な範囲は以下の通りです:
| シナリオ | コールドスタート |
|---|---|
| キャッシュ済みのコンテナ | 約5~15秒 |
| 初回デプロイ/リージョン | 約15~45秒 |
ヘルスチェックでは、最悪のケースのコールドスタートに対応するために55秒のタイムアウトを使用しています。
Link to this sectionカスタムドメインを使用できますか?#
カスタムドメイン機能は近日公開予定です。現在は、プラットフォームで生成されたURLを使用します。