コンテンツにスキップ

専用エンドポイント

Ultralytics Platformは、YOLOモデルを世界43の地域にある専用エンドポイントにデプロイすることを可能にします。各エンドポイントは、オートスケーリング、固有のエンドポイントURL、独立した監視機能を備えたシングルテナントサービスです。

Ultralytics モデルデプロイタブ(地域マップとテーブル付き)

エンドポイントを作成

デプロイタブから

モデルをその Deploy タブ:

  1. モデルに移動
  2. デプロイタブをクリック
  3. Select a region from the interactive world map — regions are color-coded by latency from your location (green < 100ms, yellow < 200ms, red > 200ms)
  4. リージョン行でデプロイをクリックします。

デプロイメント名はモデル名とリージョン都市名から自動生成されます(例: yolo26n-iowa)。

デプロイメントページから

グローバルからデプロイメントを作成します。 Deploy サイドバーのページ:

  1. 新しいデプロイをクリックします。
  2. モデルセレクターからモデルを選択してください
  3. 地図または表から地域を選択してください
  4. 必要に応じてデプロイメント名とリソースをカスタマイズできます
  5. モデルをデプロイをクリックします。

Ultralytics 新規デプロイダイアログ(モデルセレクターと地域マップ付き)

デプロイメントライフサイクル

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

領域選択

世界中の43のリージョンから選択できます。インタラクティブなリージョンマップと表には以下が表示されます。

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • デプロイ済みリージョン: 「Deployed」バッジで強調表示されます。
  • デプロイ中リージョン: アニメーションのパルスインジケーター
  • 双方向ハイライト: マップ上にカーソルを合わせるとテーブルの行がハイライトされ、その逆も同様です。

Ultralytics デプロイタブにおけるリージョン遅延テーブル(遅延順にソート)

モデルのリージョンテーブル Deploy タブには以下が含まれます:

説明
ロケーション国旗アイコン付きの都市と国
ゾーンリージョン識別子
レイテンシー測定されたping時間(3回のpingの中央値)
距離あなたの現在地からの距離 (km単位)
アクションデプロイボタンまたは「デプロイ済み」ステータスバッジ

新規デプロイダイアログ

The New Deployment ダイアログ(グローバルから Deploy ページ)は、Location、Latency、Selectの列のみを含む、よりシンプルなリージョンテーブルを示しています。

慎重に選択してください

ユーザーに最も近い地域を選択して、最低のレイテンシーを実現してください。現在の場所からのレイテンシーを再測定するには、[再スキャン]ボタンを使用してください。

利用可能なリージョン

ゾーンロケーション
us-central1アイオワ州、米国
us-east1サウスカロライナ州、米国
us-east4アメリカ合衆国、バージニア州北部
us-east5コロンバス、米国
us-south1ダラス、米国
us-west1オレゴン州、米国
us-west2ロサンゼルス、米国
us-west3ソルトレイクシティ、米国
us-west4ラスベガス、米国
northamerica-northeast1モントリオール、カナダ
northamerica-northeast2トロント、カナダ
北アメリカ-南1ケレタロ、メキシコ
southamerica-east1ブラジル、サンパウロ
southamerica-west1サンティアゴ、チリ
ゾーンロケーション
europe-west1ベルギー、サン=ジスラン
europe-west2ロンドン、英国
europe-west3フランクフルト、ドイツ
europe-west4エームスハーフェン、オランダ
europe-west6チューリッヒ、スイス
europe-west8ミラノ、イタリア
europe-west9パリ、フランス
europe-west10ベルリン、ドイツ
europe-west12トリノ、イタリア
europe-north1ハミナ、フィンランド
europe-north2ストックホルム、スウェーデン
europe-central2ワルシャワ、ポーランド
europe-southwest1マドリード、スペイン
ゾーンロケーション
asia-east1彰化、台湾
asia-east2九龍、香港
asia-northeast1東京、日本
asia-northeast2大阪、日本
asia-northeast3韓国、ソウル
asia-south1ムンバイ、インド
asia-south2デリー、インド
asia-southeast1ジュロン・ウエスト、シンガポール
asia-southeast2ジャカルタ、インドネシア
asia-southeast3タイ、バンコク
australia-southeast1シドニー、オーストラリア
australia-southeast2メルボルン、オーストラリア
ゾーンロケーション
africa-south1南アフリカ共和国、ヨハネスブルグ
me-central1ドーハ、カタール
me-central2ダンマーム、サウジアラビア
me-west1テルアビブ、イスラエル

エンドポイント設定

新規デプロイダイアログ

The New Deployment ダイアログが提供するもの:

設定説明デフォルト
モデル完成モデルから選択-
リージョンデプロイリージョン-
デプロイメント名自動生成、編集可能-
CPUコアCPU割り当て (1-8)1
メモリ (GB)メモリ割り当て(1~32 GB)2

Ultralytics 新規デプロイダイアログ リソースパネルが拡張されました

リソース設定は折りたたみ可能な「リソース」セクションで利用可能です。デプロイメントはデフォルトでスケール・トゥ・ゼロを使用します(最小インスタンス数 = 0、最大インスタンス数 = 1)— アクティブな推論時間に対してのみ課金されます。

自動生成された名前

デプロイメント名はモデル名とリージョン都市から自動的に生成されます(例: yolo26n-iowa)。同じモデルを同じリージョンに再度デプロイする場合、数値サフィックスが追加されます(例: yolo26n-iowa-2)。

デプロイタブ(クイックデプロイ)

モデルからデプロイする際 Deploy タブでは、スケール・トゥ・ゼロが有効化された状態で、デフォルトのリソース(1CPU、2 GB メモリ)を持つエンドポイントが作成されます。デプロイメント名は自動生成されます。

エンドポイントを管理

表示モード

デプロイメント一覧は3つの表示モードをサポートしています:

モード説明
カード詳細カード(ログ、コード例、予測パネル付き)
コンパクト主要指標を示す小型カードのグリッド
ソート可能な列と検索機能を備えたデータテーブル

Ultralytics プロイタブアクティブなデプロイメントカードビュー

デプロイメントカード(カードビュー)

カードビューの各デプロイメントカードには以下が表示されます。

  • ヘッダー: 名前、リージョンフラグ、ステータスバッジ、開始/停止/削除ボタン
  • エンドポイントURL: APIドキュメントへのリンク付きコピー可能なURL
  • メトリクス: リクエスト数 (24時間)、P95レイテンシ、エラー率
  • ヘルスチェック: レイテンシーと手動更新機能を備えたライブヘルスインジケーター
  • タブ: Logs, Code、および Predict

The Logs タブには、重大度フィルター(すべて/エラー)で絞り込んだ最近のログエントリが表示されます。 Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、cURLのすぐに使えるコード例が表示されます。 Predict tabは、デプロイ先で直接テストするためのインライン予測パネルを提供します。

デプロイメントステータス

ステータス説明
作成デプロイメントをセットアップ中です
デプロイ中コンテナが起動しています
準備完了エンドポイントは稼働中で、リクエストを受け付けています
停止エンドポイントはシャットダウン中です
停止したエンドポイントは一時停止中 (課金なし)
失敗デプロイメントに失敗しました(エラーメッセージを参照)

エンドポイントURL

各エンドポイントには一意のURLがあります。例:

https://predict-abc123.run.app

Ultralytics カードエンドポイントURL(コピーボタン付き)

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックすると、エンドポイントの自動生成されたAPIドキュメントが表示されます。

ライフサイクル管理

エンドポイントの状態を制御します:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
アクション説明
開始停止中のエンドポイントを再開します
停止エンドポイントを一時停止します(課金なし)
削除エンドポイントを完全に削除します

エンドポイントを停止

エンドポイントを停止して課金を一時停止します:

  1. デプロイメントカードのポーズアイコンをクリックします
  2. エンドポイントのステータスは「停止中」から「停止済み」に変わります

停止済みエンドポイント:

  • リクエストを受け付けません
  • 料金は発生しません
  • いつでも再起動できます

エンドポイントを削除

エンドポイントを完全に削除します:

  1. デプロイメントカードの削除(ゴミ箱)アイコンをクリックします。
  2. ダイアログで削除を確認します

恒久的な操作

削除は即座に、かつ永続的に行われます。新しいエンドポイントはいつでも作成できます。

エンドポイントの使用

認証

各デプロイメントは、アカウントのAPIキーを使用して作成されます。リクエストに含めてください。

Authorization: Bearer YOUR_API_KEY

APIキープレフィックスは識別のためデプロイメントカードのフッターに表示されます。APIキーからキーを生成してください。

レート制限なし

専用エンドポイントは、プラットフォームAPIのレート制限の対象外です。リクエストは専用サービスに直接送信されるため、スループットはエンドポイントのCPU、メモリ、スケーリング構成によってのみ制限されます。これは、APIキーあたり20リクエスト/分にレート制限されている共有推論と比較して、重要な利点です。

リクエスト例

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

リクエストパラメータ

パラメータ種類デフォルト説明
fileファイル-画像または動画ファイル(必須)
conffloat0.25最小信頼度しきい値
ioufloat0.7NMS IoUしきい値
imgszint640入力画像サイズ
normalizestring-正規化された座標を返す

動画推論

専用エンドポイントは、画像に加えて動画ファイルも受け入れます。サポートされている動画形式 (最大100MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV。各フレームは個別に処理され、結果はフレームごとに返されます。サポートされている画像形式 (最大50MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP。

応答形式

タスク固有のフィールドを持つ共有推論と同じです。

料金

基本的な専用エンドポイントはすべてのプランで無料です。より多くのリソースを必要とする構成(vCPUの増加、メモリの増加、ウォームスタート)は、将来的に使用量ベースの料金体系となる予定です。

コスト最適化

  • 「スケール・トゥ・ゼロ」(デフォルト)を使用し、エンドポイントがリクエストを受信したときのみ実行されるようにします
  • トラフィック量に応じて適切な最大インスタンス数を設定してください
  • 監視ダッシュボードで利用状況を監視します。

よくある質問

いくつのエンドポイントを作成できますか?

エンドポイントの制限はプランによって異なります:

  • 無料: デプロイは3回まで
  • Pro: 最大10のデプロイ
  • エンタープライズ: 無制限のデプロイメント

各モデルは、プランのクォータ内で複数のリージョンにデプロイできます。

デプロイ後にリージョンを変更できますか?

いいえ、リージョンは固定されています。リージョンを変更するには:

  1. 既存のエンドポイントを削除します。
  2. 希望するリージョンに新しいエンドポイントを作成します。

マルチリージョンデプロイメントはどのように扱いますか?

グローバルカバレッジの場合:

  1. 複数のリージョンにデプロイします。
  2. ロードバランサーまたはDNSルーティングを使用します。
  3. ユーザーを最寄りのエンドポイントにルーティングします。

コールドスタート時間はどのくらいですか?

コールドスタート時間は、モデルサイズとコンテナがそのリージョンにキャッシュされているかどうかに依存します。一般的な範囲:

シナリオコールドスタート
キャッシュされたコンテナ約5~15秒
最初のデプロイ/リージョン約15~45秒

ヘルスチェックは、最悪のケースであるコールドスタートに対応するため、55秒のタイムアウトを使用します。

カスタムドメインを使用できますか?

カスタムドメインは近日公開予定です。現在、エンドポイントはプラットフォームが生成したURLを使用しています。



📅 2ヶ月前に作成✏️ 7日前に更新
glenn-jochert-hakobyansergiuwaxmann

コメント