Meet YOLO26: next-gen vision AI.

Link to this section専用エンドポイント#

Ultralytics Platformでは、YOLOモデルを世界43のリージョンにある専用エンドポイントにデプロイできます。各エンドポイントは、スケール・ツー・ゼロ(scale-to-zero)動作、固有のエンドポイントURL、および独立した監視機能を備えたシングルテナントサービスです。

Ultralytics Platform Model Deploy Tab With Region Map And Table

Link to this sectionエンドポイントを作成#

Link to this sectionデプロイ(Deploy)タブから#

モデルのDeployタブからデプロイを実行します:

  1. モデルのページへ移動します
  2. Deployタブをクリックします
  3. インタラクティブな世界地図からリージョンを選択します。リージョンは、現在地からのレイテンシに応じて緑から赤のグラデーションで色分けされています(速いリージョンは緑色に近く、遅いリージョンは赤色に近くなります)。
  4. リージョン行のDeployをクリックします

デプロイ名は、モデル名とリージョンの都市名から自動生成されます(例:yolo26n-iowa)。

Link to this sectionデプロイメント(Deployments)ページから#

サイドバーにあるグローバルなDeployページからデプロイメントを作成します:

  1. New Deploymentをクリックします
  2. モデルセレクターからモデルを選択します
  3. 地図または表からリージョンを選択します
  4. 自動生成されたデプロイ名(編集可能)とデフォルトのリソースを確認します
  5. Deploy Modelをクリックします

Ultralytics Platform New Deployment Dialog With Model Selector And Region Map

Link to this sectionデプロイメントのライフサイクル#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this sectionリージョン選択#

世界中の43のリージョンから選択可能です。インタラクティブなリージョンマップと表には以下が表示されます:

  • リージョンピン: レイテンシに応じて緑から赤のグラデーションで色分けされています(速いリージョンは緑色に近く、遅いリージョンは赤色に近くなります)
  • デプロイ済みリージョン: "Deployed"バッジで強調表示されます
  • デプロイ中リージョン: アニメーションによるパルスインジケーター
  • 双方向ハイライト: 地図上でホバーすると対応する表の行がハイライトされ、その逆も同様です

Ultralytics Platform Deploy Tab Region Latency Table Sorted By Latency

モデルDeployタブのリージョン表には以下が含まれます:

説明
場所(Location)国旗アイコン付きの都市と国名
ゾーン(Zone)リージョン識別子
レイテンシ測定されたping時間(3回のpingのメディアン)
距離(Distance)現在地からの距離(km)
アクション(Actions)デプロイボタンまたは"Deployed"ステータスバッジ
新しいデプロイメント(New Deployment)ダイアログ

New Deploymentダイアログ(グローバルなDeployページからアクセス)には、場所、レイテンシ、選択(Select)列のみを含むシンプルなリージョン表が表示されます。

賢明な選択を

レイテンシを最小限に抑えるため、ユーザーに最も近いリージョンを選択してください。Rescanボタンを使用して、現在地からのレイテンシを再測定できます。

Link to this section利用可能なリージョン#

ゾーン場所
us-central1米国アイオワ州
us-east1サウスカロライナ州、米国
us-east4バージニア州北部、米国
us-east5コロンバス、米国
us-south1ダラス、米国
us-west1オレゴン州、米国
us-west2ロサンゼルス、米国
us-west3ソルトレイクシティ、米国
us-west4ラスベガス、米国
northamerica-northeast1モントリオール、カナダ
northamerica-northeast2トロント、カナダ
northamerica-south1ケレタロ、メキシコ
southamerica-east1サンパウロ、ブラジル
southamerica-west1サンティアゴ、チリ

Link to this sectionエンドポイント設定#

Link to this section新しいデプロイメント(New Deployment)ダイアログ#

New Deployment(新規デプロイ)ダイアログには以下の項目があります:

設定説明デフォルト
モデル完了済みのモデルから選択-
リージョンデプロイメントリージョン-
デプロイ名自動生成、編集可能-
CPUコア数デフォルトで固定1
メモリ (GB)デフォルトで固定2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

デプロイは 1 CPU2 GiB メモリ、minInstances = 0maxInstances = 1 のデフォルト設定で固定されます。アイドル時にはゼロへスケーリングされるため、アクティブな推論時間に対してのみ料金が発生します。

自動生成名

デプロイ名は、モデル名とリージョン都市名から自動的に生成されます(例: yolo26n-iowa)。同じモデルを同じリージョンに再度デプロイする場合、数字のサフィックスが追加されます(例: yolo26n-iowa-2)。

Link to this sectionデプロイタブ(クイックデプロイ)#

モデルの Deploy(デプロイ)タブからデプロイする場合、エンドポイントはデフォルトのリソース(1 CPU、2 GBメモリ)で作成され、ゼロへのスケーリングが有効になります。デプロイ名は自動生成されます。

Link to this sectionエンドポイントの管理#

Link to this sectionビューモード#

デプロイリストは以下の3つの表示モードをサポートしています:

モード説明
カードログ、コード例、予測パネルを備えた詳細カード
コンパクト主要メトリクスを表示する小型カードのグリッド
テーブルソート可能な列と検索機能を備えたデータテーブル

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionデプロイカード(カード表示)#

カード表示における各デプロイカードには以下が表示されます:

  • ヘッダー: 名前、リージョンフラグ、ステータスバッジ、開始/停止/削除ボタン
  • エンドポイントURL: APIドキュメントへのリンク付きのコピー可能なURL
  • メトリクス: リクエスト数(24時間)、P95レイテンシ、エラー率
  • ヘルスチェック: レイテンシと手動更新機能を備えたライブヘルスインジケーター
  • タブ: Logs(ログ)、Code(コード)、Predict(予測)

Logs タブには、重大度フィルタリング(すべて/エラー)付きの最近のログエントリが表示されます。Code タブには、実際のエンドポイントURLとAPIキーを使用したPython、JavaScript、およびcURL用のすぐに使えるコード例が表示されます。Predict タブには、デプロイ上で直接テストを行うためのインライン予測パネルが用意されています。

Link to this sectionデプロイステータス#

ステータス説明
Creating(作成中)デプロイを設定中です
Deploying(デプロイ中)コンテナを起動しています
Ready(準備完了)エンドポイントはライブ状態でリクエストを受け付けています
Stopping(停止中)エンドポイントをシャットダウンしています
Stopped(停止済み)エンドポイントは一時停止中です(課金なし)
Failedデプロイに失敗しました(エラーメッセージを確認してください)

Link to this sectionエンドポイントURL#

各エンドポイントには固有のURLがあります。例:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

コピーボタンをクリックしてURLをコピーします。ドキュメントアイコンをクリックして、エンドポイント用に自動生成されたAPIドキュメントを表示します。

Link to this sectionライフサイクル管理#

エンドポイントの状態を制御します:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
アクション説明
Start(開始)停止中のエンドポイントを再開します
Stop(停止)エンドポイントを一時停止します(課金なし)
Deleteエンドポイントを完全に削除します

Link to this sectionエンドポイントの停止#

エンドポイントを停止して課金を一時停止します:

  1. デプロイカードの一時停止アイコンをクリックします
  2. エンドポイントステータスが「停止中」に変わり、その後「停止済み」になります

停止済みのエンドポイントは:

  • リクエストを受け付けません
  • 料金が発生しません
  • いつでも再起動できます

Link to this sectionエンドポイントの削除#

エンドポイントを完全に削除します:

  1. デプロイカードの削除(ゴミ箱)アイコンをクリックします
  2. ダイアログで削除を確定します
永続的なアクション

削除は即時かつ永続的です。新しいエンドポイントはいつでも作成可能です。

Link to this sectionエンドポイントの使用#

Link to this section認証#

各デプロイは、お客様のアカウントのAPIキーを使用して作成されます。リクエストにそれを含めてください:

Authorization: Bearer YOUR_API_KEY

APIキーのプレフィックスは、識別のためにデプロイカードのフッターに表示されます。API Keys からキーを生成してください。

Link to this sectionレート制限なし#

専用エンドポイントのURLに直接送信されたリクエストは、Platform APIのレート制限の対象外となります。スループットはエンドポイントのCPU、メモリ、およびスケーリング設定のみによって制限されます。(ブラウザ内のテスターなど、Platform APIを介してプロキシされるリクエストは、標準の20リクエスト/分の予測制限が適用されます。)これは 共有推論 に対する重要な利点であり、共有推論はAPIキーごとに20リクエスト/分にレート制限されています。

Link to this sectionリクエストの例#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionリクエストパラメータ#

パラメータタイプデフォルト範囲説明
fileファイル--画像または動画ファイル(必須)
conffloat0.250.01 – 1.0最小信頼度しきい値
ioufloat0.70.0 – 0.95NMS IoUしきい値
imgszint64032 – 1280入力画像のサイズ(ピクセル単位)
normalizeboolfalse-バウンディングボックスの座標を0~1で返します
decimalsint50 – 10座標値の小数点以下の精度
sourcestring--画像URLまたはbase64文字列(fileの代替として使用)
動画推論

専用エンドポイントは、file パラメータを介して画像と動画の両方を受け付けます。

  • 画像フォーマット(最大100 MB):AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • 動画フォーマット(最大100 MB):ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.

Link to this sectionレスポンスフォーマット#

共有推論と同じで、タスク固有のフィールドが含まれます。

Link to this section価格設定#

基本的な専用エンドポイントは、すべてのプランで無料です。より高いリソース構成(より多くのvCPU、より多くのメモリ、ウォームスタート)については、将来的に使用量に応じた価格設定を提供する予定です。

コストの最適化
  • スケール・トゥ・ゼロ(デフォルト)を使用して、リクエストを受信したときにのみエンドポイントが実行されるようにします
  • トラフィックに合わせて適切な最大インスタンス数を設定します
  • モニタリングダッシュボードで使用状況を監視します

Link to this sectionよくある質問 (FAQ)#

Link to this section作成できるエンドポイントの数はいくつですか?#

エンドポイントの制限はプランによって異なります:

  • Free: 最大3つのデプロイメント
  • Pro: 最大10のデプロイメント
  • Enterprise: 無制限のデプロイメント

各モデルは、プランの割り当ての範囲内で、複数のリージョンにデプロイできます。

Link to this sectionデプロイ後にリージョンを変更できますか?#

いいえ、リージョンは固定されています。リージョンを変更するには、次の手順を行います:

  1. 既存のエンドポイントを削除する
  2. 希望するリージョンに新しいエンドポイントを作成する

Link to this sectionマルチリージョンデプロイメントをどのように処理すればよいですか?#

グローバルなカバレッジを実現するには:

  1. 複数のリージョンにデプロイする
  2. ロードバランサーまたはDNSルーティングを使用する
  3. ユーザーを最も近いエンドポイントにルーティングする

Link to this sectionコールドスタート時間はどのくらいですか?#

コールドスタート時間は、モデルのサイズと、コンテナがすでにリージョン内にキャッシュされているかどうかによって異なります。典型的な範囲は以下の通りです:

シナリオコールドスタート
キャッシュ済みのコンテナ約5~15秒
初回デプロイ/リージョン約15~45秒

ヘルスチェックでは、最悪のケースのコールドスタートに対応するために55秒のタイムアウトを使用しています。

Link to this sectionカスタムドメインを使用できますか?#

カスタムドメイン機能は近日公開予定です。現在は、プラットフォームで生成されたURLを使用します。

コメント