モニタリング

Ultralytics Platformでは、デプロイされたエンドポイントのモニタリング機能を提供しています。自動ポーリングにより、リクエストメトリクスの追跡、ログの閲覧、ヘルスステータスの確認が可能です。

Ultralytics Platform Deploy Page Overview Cards And World Map

デプロイメントダッシュボード

サイドバーのDeployページは、すべてのデプロイメントを監視するためのダッシュボードです。このページでは、ワールドマップ、概要メトリクス、デプロイメント管理が一元的に表示されます。デプロイメントの作成と管理については、Dedicated Endpointsを参照してください。

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

概要カード

ページ上部にある4つの概要カードには、以下が表示されます。

Ultralytics Platform Deploy Page Four Overview Cards

指標説明
総リクエスト数 (24時間)すべてのエンドポイントにおけるリクエスト数
アクティブなデプロイメント現在実行中のエンドポイント
エラー率 (24時間)失敗したリクエストの割合
P95レイテンシ (24時間)95パーセンタイル応答時間
エラー率アラート

エラー率が5%を超えると、エラー率カードが赤色で強調表示されます。エラーの診断については、各デプロイメントのLogsタブを確認してください。

ワールドマップ

インタラクティブなワールドマップには以下が表示されます。

  • 利用可能な全43リージョンのリージョンピン
  • デプロイ済みのリージョンを示す緑色のピン
  • デプロイ進行中のリージョンを示すアニメーション付きの青いピン
  • デプロイメントのステータスとレイテンシに応じたピンサイズの変化

Ultralytics Platform Deploy Page World Map With Deployed Regions

デプロイメントリスト

概要カードの下には、プロジェクト内の全エンドポイントのリストが表示されます。ビューモードの切り替えにより、以下の表示形式を選択できます。

表示説明
カードメトリクス、ログ、コード、予測タブを含む詳細なカード表示
コンパクト主要メトリクスを表示する小さなカードのグリッド(1~4列)
テーブル名前、リージョン、ステータス、リクエスト数、P95、エラー数でソート可能なデータテーブル
リアルタイム更新

ダッシュボードは15秒ごとにデプロイメントのステータス更新をポーリングします。デプロイメントが遷移状態(creatingdeploying、またはstopping)にある場合、ポーリング間隔は3秒に短縮されます。メトリクスチャートは60秒ごとに更新されます。更新ボタンをクリックすると、即座に最新情報を取得できます。

デプロイメントごとのメトリクス

各デプロイメントカード(カードビュー)には、リアルタイムのメトリクスが表示されます。

メトリクス行

指標説明
リクエスト数アイコン付きのリクエスト数(24時間)
P95レイテンシ95パーセンタイル応答時間
エラー率失敗したリクエストの割合

メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。

ヘルスチェック

実行中のデプロイメントには、ヘルスチェックのインジケーターが表示されます。

インジケーター意味
緑色のハート正常 — 応答レイテンシを表示
赤色のハート異常 — エラーメッセージを表示
回転するアイコンヘルスチェック実行中

異常時には、ヘルスチェックが20秒ごとに自動再試行されます。更新アイコンをクリックすると、手動でヘルスチェックをトリガーできます。ヘルスチェックには、ゼロスケールエンドポイントのコールドスタートに対応するため、55秒のタイムアウトが設定されています。

Ultralytics Platform Deployment Card Health Check Healthy With Latency

コールドスタートの許容範囲

ヘルスチェックは、ゼロスケールエンドポイントにおけるコールドスタート(最長で約45秒)を考慮し、55秒のタイムアウトを使用します。エンドポイントが起動すると、ヘルスチェックはミリ秒単位で完了します。

ログ

各デプロイメントカードには、最近のログエントリを表示するためのLogsタブがあります。

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

ログエントリ

各ログエントリには以下が表示されます。

項目説明
深刻度色分けされたバー(下記参照)
タイムスタンプリクエスト時刻(ローカル形式)
メッセージログの内容
HTTP情報ステータスコードとレイテンシ(該当する場合)

フィルターボタンを使用して、深刻度別にログをフィルタリングできます。

レベル説明
DEBUGグレーデバッグメッセージ
INFO通常のリクエスト
WARNING黄色重要ではない問題
ERROR失敗したリクエスト
CRITICALダークレッド致命的な障害

UIには最新の20件のエントリが表示されます。APIのデフォルト設定は1リクエストあたり50件(最大200件)です。

デバッグワークフロー

エラー調査時には、まずErrorsをクリックしてERRORおよびWARNINGエントリにフィルタリングし、次にタイムスタンプとHTTPステータスコードを確認してください。ログをクリップボードにコピーしてチームと共有できます。

コード例

各デプロイメントカードにはCodeタブがあり、実際のエンドポイントURLとAPIキーが設定された、すぐに使えるAPIコードが表示されます。

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
自動入力された認証情報

プラットフォームの Code タブを表示すると、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。キーの生成については API Keys を参照してください。

デプロイメントの予測

各デプロイメントカードの Predict タブには、インライン予測パネルが用意されています。これはモデルの Predict タブと同じインターフェースですが、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、ブラウザから直接デプロイされたエンドポイントをテストするのに便利です。パラメータの詳細とレスポンス形式については Inference を参照してください。

APIエンドポイント

モニタリングの概要

GET /api/monitoring

認証されたユーザーが所有するすべてのデプロイメントについて、集計されたメトリクスを返します。オプションの owner クエリパラメータを使用してワークスペースを指定できます。

デプロイメントメトリクス

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

特定のデプロイメントのスパークラインデータとサマリーメトリクスを返します。更新間隔は60秒です。

パラメータタイプ説明
sparklineboolスパークラインデータを含める
range文字列期間: 1h6h24h7d、 または 30d

デプロイメントログ

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

オプションの重大度フィルターとページネーションを使用して、最近のログエントリを返します。

パラメータタイプ説明
limitint返す最大エントリ数 (デフォルト: 50, 最大: 200)
severity文字列カンマ区切りの重大度フィルター
pageToken文字列前のレスポンスからのページネーショントークン

デプロイメントの健全性

GET /api/deployments/{deploymentId}/health

レスポンスレイテンシを含むヘルスチェックステータスを返します。

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

パフォーマンスの最適化

モニタリングデータを使用してデプロイメントを最適化します:

レイテンシが高すぎる場合:

  1. インスタンス数を確認する(増やす必要があるかもしれません)
  2. モデルサイズが適切か確認する
  3. より近いリージョンを検討する
  4. 送信される画像サイズを確認する
レイテンシの削減

imgsz=1280 から imgsz=640 に切り替えると、ほとんどのユースケースで精度をほとんど損なうことなく約4倍の高速化が可能です。ネットワークレイテンシを低減するために、ユーザーに近いリージョンにデプロイしてください。

FAQ

データはどのくらいの期間保持されますか?

データ型保持期間
メトリクス30日間
ログ7日間

外部モニタリングを設定できますか?

はい、エンドポイントURLは外部モニタリングツールで利用可能です:

  • 稼働監視 (Pingdom、 UptimeRobot)
  • APMツール (Datadog、 New Relic)
  • /health エンドポイントを介したカスタムヘルスチェック

レイテンシの数値はどの程度正確ですか?

レイテンシメトリクスは以下を測定します:

  • P50: 中央値の応答時間
  • P95: 95パーセンタイル
  • P99: 99パーセンタイル

これらはサーバー側の処理時間を表しており、ユーザーへのネットワークレイテンシは含まれていません。

なぜメトリクスに遅延があるのですか?

メトリクスには約2分の遅延があります。その理由は以下の通りです:

  • メトリクス集計パイプライン
  • 集計ウィンドウ
  • ダッシュボードのキャッシュ

リアルタイムのデバッグには、ほぼ即時反映されるログを確認してください。

複数のエンドポイントをまとめて監視できますか?

はい、デプロイメントページでは集計された概要カードですべてのエンドポイントが表示されます。テーブルビューを使用して、デプロイメント間のパフォーマンスを比較できます。

コメント