専用エンドポイント
Ultralytics Platformでは、世界43のリージョンにある専用エンドポイントへのYOLOモデルのデプロイが可能です。各エンドポイントは、スケール・ツー・ゼロ機能を備えたシングルテナント・サービスであり、固有のエンドポイントURLと独立したモニタリングを提供します。

エンドポイントの作成
デプロイタブから
Deploy a model from its Deploy tab:
- モデルに移動します
- **デプロイ(Deploy)**タブをクリックします
- インタラクティブな世界地図からリージョンを選択します。各リージョンは現在の場所からのレイテンシに応じて色分けされています(緑 < 100ms、黄 < 200ms、赤 > 200ms)。
- リージョン行の**デプロイ(Deploy)**をクリックします
デプロイメント名は、モデル名とリージョンの都市名から自動的に生成されます(例:yolo26n-iowa)。
デプロイメントページから
Create a deployment from the global Deploy page in the sidebar:
- **新規デプロイメント(New Deployment)**をクリックします
- モデルセレクターからモデルを選択します
- 地図またはテーブルからリージョンを選択します
- 自動生成されたデプロイメント名(編集可能)とデフォルトのリソースを確認します
- **モデルをデプロイ(Deploy Model)**をクリックします

デプロイメントのライフサイクル
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Deleteリージョンの選択
世界中の43のリージョンから選択してください。インタラクティブなリージョンマップとテーブルには以下が表示されます:
- リージョンピン: レイテンシに応じて色分けされています(緑 < 100ms、黄 < 200ms、赤 > 200ms)
- デプロイ済みリージョン: 「デプロイ済み(Deployed)」バッジで強調表示されます
- デプロイ中リージョン: アニメーション化されたパルスインジケーターが表示されます
- 双方向ハイライト: マップ上にカーソルを合わせると対応するテーブル行がハイライトされ、その逆も同様です

The region table on the model Deploy tab includes:
| カラム | 説明 |
|---|---|
| 場所(Location) | 都市名、国名、および国旗アイコン |
| ゾーン(Zone) | リージョン識別子 |
| 遅延 | 測定されたPing時間(3回の測定の中央値) |
| 距離(Distance) | 現在地からの距離(km) |
| アクション(Actions) | デプロイボタンまたは「デプロイ済み(Deployed)」ステータスバッジ |
The New Deployment dialog (from the global Deploy page) shows a simpler region table with only Location, Latency, and Select columns.
最低のレイテンシを実現するため、ユーザーに最も近いリージョンを選択してください。**再スキャン(Rescan)**ボタンを使用して、現在地からのレイテンシを再測定できます。
利用可能なリージョン
| ゾーン | 場所 |
|---|---|
| us-central1 | 米国アイオワ州 |
| us-east1 | サウスカロライナ州、米国 |
| us-east4 | バージニア州北部、米国 |
| us-east5 | コロンバス、米国 |
| us-south1 | ダラス、米国 |
| us-west1 | オレゴン州、米国 |
| us-west2 | ロサンゼルス、米国 |
| us-west3 | ソルトレイクシティ、米国 |
| us-west4 | ラスベガス、米国 |
| northamerica-northeast1 | モントリオール、カナダ |
| northamerica-northeast2 | トロント、カナダ |
| northamerica-south1 | ケレタロ、メキシコ |
| southamerica-east1 | サンパウロ、ブラジル |
| southamerica-west1 | サンティアゴ、チリ |
エンドポイント設定
新規デプロイメントダイアログ
New Deployment ダイアログには以下が含まれます:
| 設定 | 説明 | デフォルト |
|---|---|---|
| モデル | 完了したモデルから選択 | - |
| リージョン | デプロイリージョン | - |
| デプロイ名 | 自動生成、編集可能 | - |
| CPUコア | デフォルトで固定 | 1 |
| メモリ (GB) | デフォルトで固定 | 2 |

デプロイには、1 CPU、2 GiB メモリ、minInstances = 0、maxInstances = 1 のデフォルト設定が固定されます。アイドル時にはゼロまでスケールインするため、アクティブな推論時間に対してのみ料金が発生します。
デプロイ名は、モデル名とリージョンの都市から自動的に生成されます(例: yolo26n-iowa)。同じモデルを同じリージョンに再度デプロイする場合、数値のサフィックスが追加されます(例: yolo26n-iowa-2)。
Deploy タブ (クイックデプロイ)
モデルの Deploy タブからデプロイする場合、エンドポイントはデフォルトのリソース(1 CPU、2 GB メモリ)で作成され、スケール・トゥ・ゼロ(ゼロまでの自動スケーリング)が有効になります。デプロイ名は自動生成されます。
エンドポイントの管理
表示モード
デプロイ一覧では、3つの表示モードがサポートされています:
| モード | 説明 |
|---|---|
| カード | ログ、コード例、予測パネルを備えた詳細カード |
| コンパクト | 主要指標を表示する小さなカードのグリッド |
| テーブル | 並べ替え可能な列と検索機能を備えたデータテーブル |

デプロイカード (カード表示)
カード表示内の各デプロイカードには以下が表示されます:
- ヘッダー: 名前、リージョンフラグ、ステータスバッジ、開始/停止/削除ボタン
- エンドポイントURL: APIドキュメントへのリンクを含むコピー可能なURL
- 指標: リクエスト数 (24時間)、P95レイテンシ、エラー率
- ヘルスチェック: レイテンシと手動更新を備えたライブヘルスインジケーター
- タブ:
Logs、Code、Predict
Logs タブには、重大度フィルタリング(すべて / エラー)を備えた最近のログエントリが表示されます。Code タブには、実際のエンドポイントURLとAPIキーを使用した Python、JavaScript、cURL のすぐに使えるコード例が表示されます。Predict タブには、デプロイ上で直接テストするためのインライン予測パネルが用意されています。
デプロイステータス
| ステータス | 説明 |
|---|---|
| Creating (作成中) | デプロイをセットアップ中 |
| Deploying (デプロイ中) | コンテナを起動中 |
| Ready (準備完了) | エンドポイントがライブ状態でリクエストを受け付け中 |
| Stopping (停止中) | エンドポイントをシャットダウン中 |
| Stopped (停止済み) | エンドポイントが一時停止中(課金なし) |
| 失敗 (Failed) | デプロイ失敗(エラーメッセージを参照) |
エンドポイントURL
各エンドポイントには一意のURLがあります。例:
https://predict-abc123.run.app

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイント用に自動生成されたAPIドキュメントが表示されます。
ライフサイクル管理
エンドポイントの状態を制御します:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| アクション | 説明 |
|---|---|
| Start (開始) | 停止したエンドポイントを再開 |
| Stop (停止) | エンドポイントを一時停止(課金なし) |
| 削除 | エンドポイントを完全に削除 |
エンドポイントの停止
エンドポイントを停止して課金を一時停止します:
- デプロイカードのポーズアイコンをクリックします
- エンドポイントのステータスが "Stopping" から "Stopped" に変わります
停止済みのエンドポイント:
- リクエストを受け付けません
- 課金が発生しません
- いつでも再起動可能です
エンドポイントの削除
エンドポイントを完全に削除します:
- デプロイカードの削除(ゴミ箱)アイコンをクリックします
- ダイアログで削除を確認します
削除は即時かつ永続的です。新しいエンドポイントはいつでも作成できます。
エンドポイントの使用
認証
各デプロイは、アカウントのAPIキーで作成されます。リクエストに含めてください:
Authorization: Bearer YOUR_API_KEYAPIキーのプレフィックスは、識別のためにデプロイカードのフッターに表示されます。キーは API Keys から生成してください。
レート制限なし
専用エンドポイントはプラットフォームAPIのレート制限の対象外です。リクエストは専用サービスに直接送信されるため、スループットはエンドポイントのCPU、メモリ、およびスケーリング設定によってのみ制限されます。これは、1APIキーあたり毎分20リクエストに制限される共有推論に対する重要な利点です。
リクエスト例
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())リクエストパラメータ
| パラメータ | タイプ | デフォルト | 範囲 | 説明 |
|---|---|---|---|---|
file | ファイル | - | - | 画像またはビデオファイル(必須) |
conf | 浮動小数点数 | 0.25 | 0.01 – 1.0 | 最小信頼度閾値 |
iou | 浮動小数点数 | 0.7 | 0.0 – 0.95 | NMS IoU閾値 |
imgsz | int | 640 | 32 – 1280 | 入力画像サイズ(ピクセル単位) |
normalize | bool | false | - | バウンディングボックスの座標を0〜1で返す |
decimals | int | 5 | 0 – 10 | 座標値の小数点以下の精度 |
source | 文字列 | - | - | 画像URLまたはbase64文字列(fileの代替) |
専用エンドポイントは、fileパラメータを介して画像とビデオの両方を受け付けます。
- 画像フォーマット(最大50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- ビデオフォーマット(最大100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.
レスポンス形式
タスク固有のフィールドを含む共有推論と同じです。
料金
基本的な専用エンドポイントはすべてのプランで無料です。リソース要件が高い構成(より多くのvCPU、より多くのメモリ、ウォームスタート)については、将来的に従量課金制を提供する予定です。
- リクエスト受信時のみエンドポイントが実行されるよう、スケール・トゥ・ゼロ(デフォルト)を使用してください
- トラフィックに適した最大インスタンス数を設定してください
- モニタリングダッシュボードで利用状況を監視してください
FAQ
エンドポイントはいくつ作成できますか?
エンドポイントの制限はプランによって異なります:
- Free: 最大3デプロイメント
- Pro: 最大10デプロイメント
- Enterprise: 無制限のデプロイメント
各モデルは、プランのクォータ内であれば複数のリージョンにデプロイ可能です。
デプロイ後にリージョンを変更できますか?
いいえ、リージョンは固定です。リージョンを変更するには:
- 既存のエンドポイントを削除する
- 希望するリージョンで新しいエンドポイントを作成する
マルチリージョンデプロイメントにはどのように対応すればよいですか?
グローバルなカバレッジを実現するには:
- 複数のリージョンにデプロイする
- ロードバランサーまたはDNSルーティングを使用する
- ユーザーを最も近いエンドポイントにルーティングする
コールドスタート時間はどれくらいですか?
コールドスタート時間は、モデルサイズと、コンテナがそのリージョンですでにキャッシュされているかどうかによって異なります。一般的な範囲は以下の通りです:
| シナリオ | コールドスタート |
|---|---|
| キャッシュ済みコンテナ | ~5-15秒 |
| 初回デプロイ/リージョン | ~15-45秒 |
ヘルスチェックでは、最悪のコールドスタートケースを想定して55秒のタイムアウトを使用しています。
カスタムドメインは使用できますか?
カスタムドメイン機能は近日公開予定です。現在、エンドポイントはプラットフォームで生成されたURLを使用します。