専用エンドポイント

Ultralytics Platformでは、世界43のリージョンにある専用エンドポイントへのYOLOモデルのデプロイが可能です。各エンドポイントは、スケール・ツー・ゼロ機能を備えたシングルテナント・サービスであり、固有のエンドポイントURLと独立したモニタリングを提供します。

Ultralytics Platform Model Deploy Tab With Region Map And Table

エンドポイントの作成

デプロイタブから

Deploy a model from its Deploy tab:

  1. モデルに移動します
  2. **デプロイ(Deploy)**タブをクリックします
  3. インタラクティブな世界地図からリージョンを選択します。各リージョンは現在の場所からのレイテンシに応じて色分けされています(緑 < 100ms、黄 < 200ms、赤 > 200ms)。
  4. リージョン行の**デプロイ(Deploy)**をクリックします

デプロイメント名は、モデル名とリージョンの都市名から自動的に生成されます(例:yolo26n-iowa)。

デプロイメントページから

Create a deployment from the global Deploy page in the sidebar:

  1. **新規デプロイメント(New Deployment)**をクリックします
  2. モデルセレクターからモデルを選択します
  3. 地図またはテーブルからリージョンを選択します
  4. 自動生成されたデプロイメント名(編集可能)とデフォルトのリソースを確認します
  5. **モデルをデプロイ(Deploy Model)**をクリックします

Ultralytics Platform New Deployment Dialog With Model Selector And Region Map

デプロイメントのライフサイクル

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

リージョンの選択

世界中の43のリージョンから選択してください。インタラクティブなリージョンマップとテーブルには以下が表示されます:

  • リージョンピン: レイテンシに応じて色分けされています(緑 < 100ms、黄 < 200ms、赤 > 200ms)
  • デプロイ済みリージョン: 「デプロイ済み(Deployed)」バッジで強調表示されます
  • デプロイ中リージョン: アニメーション化されたパルスインジケーターが表示されます
  • 双方向ハイライト: マップ上にカーソルを合わせると対応するテーブル行がハイライトされ、その逆も同様です

Ultralytics Platform Deploy Tab Region Latency Table Sorted By Latency

The region table on the model Deploy tab includes:

カラム説明
場所(Location)都市名、国名、および国旗アイコン
ゾーン(Zone)リージョン識別子
遅延測定されたPing時間(3回の測定の中央値)
距離(Distance)現在地からの距離(km)
アクション(Actions)デプロイボタンまたは「デプロイ済み(Deployed)」ステータスバッジ
新規デプロイメントダイアログ

The New Deployment dialog (from the global Deploy page) shows a simpler region table with only Location, Latency, and Select columns.

賢明な選択を

最低のレイテンシを実現するため、ユーザーに最も近いリージョンを選択してください。**再スキャン(Rescan)**ボタンを使用して、現在地からのレイテンシを再測定できます。

利用可能なリージョン

ゾーン場所
us-central1米国アイオワ州
us-east1サウスカロライナ州、米国
us-east4バージニア州北部、米国
us-east5コロンバス、米国
us-south1ダラス、米国
us-west1オレゴン州、米国
us-west2ロサンゼルス、米国
us-west3ソルトレイクシティ、米国
us-west4ラスベガス、米国
northamerica-northeast1モントリオール、カナダ
northamerica-northeast2トロント、カナダ
northamerica-south1ケレタロ、メキシコ
southamerica-east1サンパウロ、ブラジル
southamerica-west1サンティアゴ、チリ

エンドポイント設定

新規デプロイメントダイアログ

New Deployment ダイアログには以下が含まれます:

設定説明デフォルト
モデル完了したモデルから選択-
リージョンデプロイリージョン-
デプロイ名自動生成、編集可能-
CPUコアデフォルトで固定1
メモリ (GB)デフォルトで固定2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

デプロイには、1 CPU2 GiB メモリ、minInstances = 0maxInstances = 1 のデフォルト設定が固定されます。アイドル時にはゼロまでスケールインするため、アクティブな推論時間に対してのみ料金が発生します。

自動生成名

デプロイ名は、モデル名とリージョンの都市から自動的に生成されます(例: yolo26n-iowa)。同じモデルを同じリージョンに再度デプロイする場合、数値のサフィックスが追加されます(例: yolo26n-iowa-2)。

Deploy タブ (クイックデプロイ)

モデルの Deploy タブからデプロイする場合、エンドポイントはデフォルトのリソース(1 CPU、2 GB メモリ)で作成され、スケール・トゥ・ゼロ(ゼロまでの自動スケーリング)が有効になります。デプロイ名は自動生成されます。

エンドポイントの管理

表示モード

デプロイ一覧では、3つの表示モードがサポートされています:

モード説明
カードログ、コード例、予測パネルを備えた詳細カード
コンパクト主要指標を表示する小さなカードのグリッド
テーブル並べ替え可能な列と検索機能を備えたデータテーブル

Ultralytics Platform Deploy Tab Active Deployments Cards View

デプロイカード (カード表示)

カード表示内の各デプロイカードには以下が表示されます:

  • ヘッダー: 名前、リージョンフラグ、ステータスバッジ、開始/停止/削除ボタン
  • エンドポイントURL: APIドキュメントへのリンクを含むコピー可能なURL
  • 指標: リクエスト数 (24時間)、P95レイテンシ、エラー率
  • ヘルスチェック: レイテンシと手動更新を備えたライブヘルスインジケーター
  • タブ: LogsCodePredict

Logs タブには、重大度フィルタリング(すべて / エラー)を備えた最近のログエントリが表示されます。Code タブには、実際のエンドポイントURLとAPIキーを使用した Python、JavaScript、cURL のすぐに使えるコード例が表示されます。Predict タブには、デプロイ上で直接テストするためのインライン予測パネルが用意されています。

デプロイステータス

ステータス説明
Creating (作成中)デプロイをセットアップ中
Deploying (デプロイ中)コンテナを起動中
Ready (準備完了)エンドポイントがライブ状態でリクエストを受け付け中
Stopping (停止中)エンドポイントをシャットダウン中
Stopped (停止済み)エンドポイントが一時停止中(課金なし)
失敗 (Failed)デプロイ失敗(エラーメッセージを参照)

エンドポイントURL

各エンドポイントには一意のURLがあります。例:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイント用に自動生成されたAPIドキュメントが表示されます。

ライフサイクル管理

エンドポイントの状態を制御します:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
アクション説明
Start (開始)停止したエンドポイントを再開
Stop (停止)エンドポイントを一時停止(課金なし)
削除エンドポイントを完全に削除

エンドポイントの停止

エンドポイントを停止して課金を一時停止します:

  1. デプロイカードのポーズアイコンをクリックします
  2. エンドポイントのステータスが "Stopping" から "Stopped" に変わります

停止済みのエンドポイント:

  • リクエストを受け付けません
  • 課金が発生しません
  • いつでも再起動可能です

エンドポイントの削除

エンドポイントを完全に削除します:

  1. デプロイカードの削除(ゴミ箱)アイコンをクリックします
  2. ダイアログで削除を確認します
永続的なアクション

削除は即時かつ永続的です。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

各デプロイは、アカウントのAPIキーで作成されます。リクエストに含めてください:

Authorization: Bearer YOUR_API_KEY

APIキーのプレフィックスは、識別のためにデプロイカードのフッターに表示されます。キーは API Keys から生成してください。

レート制限なし

専用エンドポイントはプラットフォームAPIのレート制限の対象外です。リクエストは専用サービスに直接送信されるため、スループットはエンドポイントのCPU、メモリ、およびスケーリング設定によってのみ制限されます。これは、1APIキーあたり毎分20リクエストに制限される共有推論に対する重要な利点です。

リクエスト例

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

リクエストパラメータ

パラメータタイプデフォルト範囲説明
fileファイル--画像またはビデオファイル(必須)
conf浮動小数点数0.250.01 – 1.0最小信頼度閾値
iou浮動小数点数0.70.0 – 0.95NMS IoU閾値
imgszint64032 – 1280入力画像サイズ(ピクセル単位)
normalizeboolfalse-バウンディングボックスの座標を0〜1で返す
decimalsint50 – 10座標値の小数点以下の精度
source文字列--画像URLまたはbase64文字列(fileの代替)
ビデオ推論

専用エンドポイントは、fileパラメータを介して画像とビデオの両方を受け付けます。

  • 画像フォーマット(最大50 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • ビデオフォーマット(最大100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.

レスポンス形式

タスク固有のフィールドを含む共有推論と同じです。

料金

基本的な専用エンドポイントはすべてのプランで無料です。リソース要件が高い構成(より多くのvCPU、より多くのメモリ、ウォームスタート)については、将来的に従量課金制を提供する予定です。

コスト最適化
  • リクエスト受信時のみエンドポイントが実行されるよう、スケール・トゥ・ゼロ(デフォルト)を使用してください
  • トラフィックに適した最大インスタンス数を設定してください
  • モニタリングダッシュボードで利用状況を監視してください

FAQ

エンドポイントはいくつ作成できますか?

エンドポイントの制限はプランによって異なります:

  • Free: 最大3デプロイメント
  • Pro: 最大10デプロイメント
  • Enterprise: 無制限のデプロイメント

各モデルは、プランのクォータ内であれば複数のリージョンにデプロイ可能です。

デプロイ後にリージョンを変更できますか?

いいえ、リージョンは固定です。リージョンを変更するには:

  1. 既存のエンドポイントを削除する
  2. 希望するリージョンで新しいエンドポイントを作成する

マルチリージョンデプロイメントにはどのように対応すればよいですか?

グローバルなカバレッジを実現するには:

  1. 複数のリージョンにデプロイする
  2. ロードバランサーまたはDNSルーティングを使用する
  3. ユーザーを最も近いエンドポイントにルーティングする

コールドスタート時間はどれくらいですか?

コールドスタート時間は、モデルサイズと、コンテナがそのリージョンですでにキャッシュされているかどうかによって異なります。一般的な範囲は以下の通りです:

シナリオコールドスタート
キャッシュ済みコンテナ~5-15秒
初回デプロイ/リージョン~15-45秒

ヘルスチェックでは、最悪のコールドスタートケースを想定して55秒のタイムアウトを使用しています。

カスタムドメインは使用できますか?

カスタムドメイン機能は近日公開予定です。現在、エンドポイントはプラットフォームで生成されたURLを使用します。

コメント