コンテンツにスキップ

専用エンドポイント

Ultralytics 、YOLO 専用エンドポイントへデプロイすることを可能にします。各エンドポイントは、自動スケーリング機能、固有のエンドポイントURL、独立した監視を備えたシングルテナントサービスです。

Ultralytics モデルデプロイタブ(地域マップとテーブル付き)

エンドポイントを作成

デプロイタブから

モデルをその Deploy タブ:

  1. モデルに移動
  2. デプロイタブをクリック
  3. 地域テーブルから地域を選択してください(お客様の所在地からの遅延順に並べ替え済み)
  4. リージョンの行で「デプロイ」をクリック

デプロイメント名はモデル名とリージョン都市名から自動生成されます(例: yolo11n-iowa)。

デプロイメントページから

グローバルからデプロイメントを作成する Deploy サイドバーのページ:

  1. 新規デプロイをクリック
  2. モデルセレクターからモデルを選択してください
  3. 地図または表から地域を選択してください
  4. 必要に応じてデプロイメント名とリソースをカスタマイズできます
  5. モデルを展開

Ultralytics 新規デプロイダイアログ(モデルセレクターと地域マップ付き)

デプロイメントライフサイクル

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

領域選択

世界43地域から選択可能。インタラクティブな地域マップと表では以下が表示されます:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • デプロイ済みリージョン: 「デプロイ済み」バッジで強調表示
  • 展開中のリージョン: アニメーション付きパルスインジケーター
  • 双方向ハイライト:地図上にカーソルを合わせるとテーブルの行がハイライトされ、その逆も同様です

Ultralytics デプロイタブにおけるリージョン遅延テーブル(遅延順にソート)

モデルのリージョンテーブル Deploy タブには以下が含まれます:

説明
ロケーション国と都市(国旗アイコン付き)
ゾーンリージョン識別子
レイテンシー測定されたping時間(3回のpingの中央値)
距離現在地からの距離(km)
アクションデプロイボタンまたは「デプロイ済み」ステータスバッジ

新規デプロイダイアログ

The New Deployment ダイアログ(グローバルから) Deploy ページ)は、Location、Latency、Selectの列のみを含む、よりシンプルなリージョンテーブルを示しています。

慎重に選択してください

ユーザーに最も近い地域を選択して、最低のレイテンシーを実現してください。現在の場所からのレイテンシーを再測定するには、[再スキャン]ボタンを使用してください。

利用可能なリージョン

ゾーンロケーション
us-central1アイオワ州、米国
us-east1サウスカロライナ州、米国
us-east4アメリカ合衆国、バージニア州北部
us-east5コロンバス、米国
us-south1ダラス、米国
us-west1オレゴン州、米国
us-west2ロサンゼルス、米国
us-west3ソルトレイクシティ、米国
us-west4ラスベガス、米国
northamerica-northeast1モントリオール、カナダ
northamerica-northeast2トロント、カナダ
北アメリカ-南1ケレタロ、メキシコ
southamerica-east1ブラジル、サンパウロ
southamerica-west1サンティアゴ、チリ
ゾーンロケーション
europe-west1ベルギー、サン=ジスラン
europe-west2ロンドン、英国
europe-west3フランクフルト、ドイツ
europe-west4オランダ、エームハーフェン
europe-west6チューリッヒ、スイス
europe-west8ミラノ、イタリア
europe-west9パリ、フランス
europe-west10ベルリン、ドイツ
europe-west12トリノ、イタリア
europe-north1ハミナ、フィンランド
ヨーロッパ-北2ストックホルム、スウェーデン
europe-central2ワルシャワ、ポーランド
europe-southwest1マドリード、スペイン
ゾーンロケーション
asia-east1彰化、台湾
asia-east2九龍、香港
asia-northeast1東京、日本
asia-northeast2大阪、日本
asia-northeast3韓国、ソウル
asia-south1ムンバイ、インド
asia-south2デリー、インド
asia-southeast1ジュロン・ウエスト、シンガポール
asia-southeast2ジャカルタ、インドネシア
アジア-東南アジア3タイ、バンコク
australia-southeast1シドニー、オーストラリア
australia-southeast2メルボルン、オーストラリア
ゾーンロケーション
アフリカ-南1南アフリカ共和国、ヨハネスブルグ
me-central1ドーハ、カタール
me-central2ダンマーム、サウジアラビア
me-west1テルアビブ、イスラエル

エンドポイント設定

新規デプロイダイアログ

The New Deployment ダイアログは以下を提供します:

設定説明デフォルト
モデル完成モデルから選択-
リージョンデプロイリージョン-
デプロイメント名自動生成、編集可能-
CPUCPU (1-8)1
メモリ (GB)メモリ割り当て(1~32 GB)2

Ultralytics 新規デプロイダイアログ リソースパネルが拡張されました

リソース設定は折りたたみ可能な「リソース」セクションで利用可能です。デプロイメントはデフォルトでスケール・トゥ・ゼロを使用します(最小インスタンス数 = 0、最大インスタンス数 = 1)— アクティブな推論時間に対してのみ課金されます。

自動生成された名前

デプロイメント名はモデル名とリージョン都市から自動的に生成されます(例: yolo11n-iowa同じモデルを同じリージョンに再度デプロイすると、数値のサフィックスが追加されます(例: yolo11n-iowa-2)。

デプロイタブ(クイックデプロイ)

モデルからデプロイする際 Deploy タブでは、スケール・トゥ・ゼロが有効化された状態で、デフォルトのリソース(1CPU、2 GB メモリ)を持つエンドポイントが作成されます。デプロイメント名は自動生成されます。

エンドポイントを管理

表示モード

デプロイメント一覧は3つの表示モードをサポートしています:

モード説明
カード詳細カード(ログ、コード例、予測パネル付き)
コンパクト主要指標を示す小型カードのグリッド
ソート可能な列と検索機能を備えたDataTable

Ultralytics プロイタブアクティブなデプロイメントカードビュー

デプロイメントカード(カードビュー)

カードビューの各デプロイメントカードには以下が表示されます:

  • ヘッダー:名前、地域フラグ、ステータスバッジ、開始/停止/削除ボタン
  • エンドポイントURL: APIドキュメントへのリンク付きコピー可能なURL
  • メトリクス: リクエスト数(24時間)、P95レイテンシ、エラー率
  • ヘルスチェック:遅延と手動更新機能付きライブヘルスインジケーター
  • タブ: Logs, Code、および Predict

The Logs タブには、重大度フィルター(すべて/エラー)で絞り込んだ最近のログエントリが表示されます。 Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、cURLのすぐに使えるコード例が表示されます。 Predict tabは、デプロイ先で直接テストするためのインライン予測パネルを提供します。

デプロイ状況

ステータス説明
作成デプロイメントが設定中です
デプロイコンテナが起動中です
準備完了エンドポイントは稼働中でリクエストを受け付けています
停止エンドポイントがシャットダウン中です
停止したエンドポイントが一時停止中(課金なし)
失敗したデプロイに失敗しました(エラーメッセージを参照)

エンドポイントURL

各エンドポイントには固有のURLがあります。例:

https://predict-abc123.run.app

Ultralytics カードエンドポイントURL(コピーボタン付き)

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイントの自動生成されたAPIドキュメントを表示できます。

ライフサイクル管理

エンドポイントの状態を制御します:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
アクション説明
開始停止中のエンドポイントを再開します
停止エンドポイントを一時停止します(課金なし)
削除エンドポイントを完全に削除します

エンドポイントを停止

エンドポイントを停止して課金を一時停止します:

  1. デプロイメントカードのポーズアイコンをクリックしてください
  2. エンドポイントの状態が「停止中」に変化し、その後「停止済み」となる

停止済みエンドポイント:

  • リクエストを受け付けません
  • 料金は発生しません
  • いつでも再起動できます

エンドポイントを削除

エンドポイントを完全に削除します:

  1. デプロイメントカードの削除(ごみ箱)アイコンをクリックしてください
  2. ダイアログで削除を確認

恒久的な操作

削除は即座に、かつ永続的に行われます。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

各デプロイは、アカウントのAPIキーを使用して作成されます。リクエストに含めてください:

Authorization: Bearer YOUR_API_KEY

APIキープレフィックスは識別のためデプロイメントカードのフッターに表示されます。APIキーからキーを生成してください。

レート制限なし

専用エンドポイントはプラットフォームAPIのレート制限の対象外です。リクエストは直接専用サービスに送信されるため、スループットはCPU、メモリ、スケーリング設定によってのみ制限されます。これは共有推論(APIキーあたり20リクエスト/分のレート制限あり)に対する主要な利点です。

リクエスト例

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

リクエストパラメータ

パラメータ種類デフォルト説明
fileファイル-画像ファイル(必須)
conffloat0.25最小信頼度しきい値
ioufloat0.7NMS IoUしきい値
imgszint640入力画像サイズ
normalizestring-正規化された座標を返す

応答形式

タスク固有のフィールドを持つ共有推論と同じです。

料金

専用エンドポイントの課金基準:

コンポーネントレート
CPUvCPU秒あたり
メモリGB秒あたり
リクエスト100万リクエストあたり

コスト最適化

  • 開発用エンドポイントにはスケール・トゥ・ゼロを使用します。
  • 適切な最大インスタンス数を設定します。
  • 監視ダッシュボードで利用状況を監視します。
  • 設定>請求で料金を確認する

よくある質問

いくつのエンドポイントを作成できますか?

エンドポイントの制限はプランによって異なります:

  • 無料: 最大3回のデプロイ
  • プロ:最大10回のデプロイ
  • エンタープライズ: 無制限のデプロイメント

各モデルは、プランのクォータ内であれば、複数のリージョンにデプロイできます。

デプロイ後にリージョンを変更できますか?

いいえ、リージョンは固定されています。リージョンを変更するには:

  1. 既存のエンドポイントを削除します。
  2. 希望するリージョンに新しいエンドポイントを作成します。

マルチリージョンデプロイメントはどのように扱いますか?

グローバルカバレッジの場合:

  1. 複数のリージョンにデプロイします。
  2. ロードバランサーまたはDNSルーティングを使用します。
  3. ユーザーを最寄りのエンドポイントにルーティングします。

コールドスタート時間はどのくらいですか?

コールドスタート時間はモデルサイズと、コンテナが既にリージョンにキャッシュされているか否かに依存します。典型的な範囲:

シナリオコールドスタート
キャッシュされたコンテナ約5~15秒
初回デプロイ/リージョン約15~45秒

ヘルスチェックは、最悪のケースであるコールドスタートに対応するため、55秒のタイムアウトを使用します。

カスタムドメインを使用できますか?

カスタムドメインは近日公開予定です。現在、エンドポイントはプラットフォームが生成したURLを使用しています。



📅 1ヶ月前に作成 ✏️ 5日前に更新
glenn-jochersergiuwaxmann

コメント