Link to this sectionモニタリング#

Ultralytics Platformでは、デプロイ済みエンドポイントのモニタリングを提供しています。自動ポーリングを使用して、リクエストメトリクスの追跡、ログの表示、およびヘルスステータスの確認が可能です。

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionデプロイメントダッシュボード#

サイドバーのDeployページは、すべてのデプロイメントのモニタリングダッシュボードとして機能します。世界地図、概要メトリクス、デプロイメント管理が1つの画面に集約されています。デプロイメントの作成と管理については、Dedicated Endpointsを参照してください。

graph TB
    subgraph Dashboard
        Map[World Map]:::proc --- Cards[Overview Cards]:::proc
        Cards --- List[Deployments List]:::decide
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]:::out
        Health[Health Check]:::out
        Logs[Logs Tab]:::out
        Code[Code Tab]:::out
        Predict[Predict Tab]:::out
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    classDef proc fill:#2196F3,color:#fff
    classDef decide fill:#FF9800,color:#fff
    classDef out fill:#9C27B0,color:#fff

Link to this section概要カード#

ページ上部の4つのサマリーカードには以下が表示されます：

Ultralytics Platform Deploy Page Four Overview Cards

メトリクス	説明
合計リクエスト数 (24時間)	全エンドポイントの合計リクエスト数
アクティブなデプロイメント	現在実行中のエンドポイント
エラー率 (24時間)	失敗したリクエストの割合
P95レイテンシ (24時間)	95パーセンタイルのレスポンス時間

エラー率アラート

エラー率が5%を超えると、エラー率カードが赤色で強調表示されます。個別のデプロイメントのLogsタブを確認してエラーを診断してください。

Link to this section世界地図#

インタラクティブな世界地図には以下が表示されます：

利用可能な全42リージョンのリージョンピン
デプロイ済みのリージョンを示す緑色のピン
現在デプロイ実行中のリージョンを示すアニメーション付き青いピン
デプロイメントのステータスとレイテンシに基づいてサイズが変化するピンのサイズ

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionデプロイメントリスト#

概要カードの下には、プロジェクト全体のすべてのエンドポイントが表示されるデプロイメントリストがあります。表示モードの切り替えにより、以下を選択できます：

表示	説明
カード	メトリクス、ログ、コード、予測タブを含む詳細カード
コンパクト	主要メトリクスを含む小型カードのグリッド（1〜4列）
テーブル	名前、リージョン、ステータス、リクエスト数、P95、エラーでソート可能なデータテーブル

リアルタイム更新

ダッシュボードは15秒ごとにデプロイメントステータスの更新をポーリングします。デプロイメントが遷移状態（creating、deploying、またはstopping）にある場合、ポーリングは3秒ごとに短縮されます。メトリクスチャートは60秒ごとに更新されます。更新ボタンをクリックすると即時に更新できます。

Link to this sectionデプロイメントごとのメトリクス#

各デプロイメントカード（カード表示）にはリアルタイムのメトリクスが表示されます：

Link to this sectionメトリクス行#

メトリクス	説明
リクエスト数	アイコン付きのリクエストカウント（24時間）
P95レイテンシ	95パーセンタイルのレスポンス時間
エラー率	失敗したリクエストの割合

メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。

Link to this sectionヘルスチェック#

実行中のデプロイメントにはヘルスチェックインジケーターが表示されます：

インジケーター	意味
緑色のハート	正常 — レスポンスレイテンシを表示します
赤色のハート	異常 — エラーメッセージを表示します
回転するアイコン	ヘルスチェック実行中

ヘルスチェックは異常時に20秒間隔で自動再試行されます。更新アイコンをクリックすると手動でヘルスチェックを実行できます。ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタートを考慮し、55秒のタイムアウトを設定しています。

Ultralytics Platform Deployment Card Health Check Healthy With Latency

コールドスタートの許容

ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタート（最悪の場合、約45秒）を考慮して55秒のタイムアウトを使用します。エンドポイントがウォームアップされると、ヘルスチェックはミリ秒単位で完了します。

Link to this sectionログ#

各デプロイメントカードには、最近のログエントリを表示するためのLogsタブが含まれています：

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionログエントリ#

各ログエントリには以下が表示されます：

フィールド	説明
深刻度	色分けされたバー（下記参照）
タイムスタンプ	リクエスト時刻（ローカル形式）
メッセージ	ログの内容
HTTP情報	ステータスコードとレイテンシ（該当する場合）

フィルタボタンを使用して、深刻度別にログをフィルタリングします：

レベル	色	説明
DEBUG	グレー	デバッグメッセージ
INFO	ブルー	通常のリクエスト
WARNING	イエロー	非致命的な問題
ERROR	レッド	失敗したリクエスト
CRITICAL	ダークレッド	致命的な障害

UIには直近の20エントリが表示されます。APIはデフォルトでリクエストごとに50エントリ（最大200）を返します。

デバッグワークフロー

エラーを調査する際は、まずErrorsをクリックしてERRORおよびWARNINGエントリに絞り込み、次にタイムスタンプとHTTPステータスコードを確認してください。チームと共有するためにログをクリップボードにコピーします。

Link to this sectionコード例#

各デプロイメントカードには、実際のエンドポイントURLとAPIキーが設定された、すぐに使えるAPIコードが表示されるCodeタブが含まれています：

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

自動入力される資格情報

プラットフォーム上でCodeタブを表示すると、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。キーの生成についてはAPI Keysを参照してください。

Link to this sectionデプロイメント予測#

各デプロイメントカードの Predict タブでは、インライン予測パネルを提供しています。これはモデルの Predict タブと同じインターフェースですが、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、デプロイされたエンドポイントをブラウザから直接テストするのに便利です。パラメータの詳細とレスポンス形式については、Inference を参照してください。

Link to this sectionAPI エンドポイント#

Link to this section監視の概要#

GET /api/monitoring

認証されたユーザーが所有するすべてのデプロイメントの集計メトリクスを返します。オプションの owner クエリパラメータを使用してワークスペースを認識します。

Link to this sectionデプロイメントメトリクス#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

特定のデプロイメントのスパークラインデータとサマリーメトリクスを返します。更新間隔は 60 秒です。

パラメータ	タイプ	説明
`sparkline`	bool	スパークラインデータを含む
`range`	string	時間範囲: `1h`、`6h`、`24h`、`7d`、または `30d`

Link to this sectionデプロイメントログ#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

オプションの重要度フィルタとページネーションを備えた最近のログエントリを返します。

パラメータ	タイプ	説明
`limit`	int	返す最大エントリ数 (デフォルト: 50、最大: 200)
`severity`	string	カンマ区切りの重要度フィルタ
`pageToken`	string	前回のレスポンスからのページネーショントークン

Link to this sectionデプロイメントの健全性#

GET /api/deployments/{deploymentId}/health

レスポンスレイテンシを含むヘルスチェックステータスを返します。

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionパフォーマンスの最適化#

監視データを使用してデプロイメントを最適化する方法:

レイテンシが高すぎる場合:

インスタンス数を確認する (増やす必要があるかもしれません)
モデルサイズが適切か確認する
より近いリージョンを検討する
送信している画像サイズを確認する

レイテンシの削減

ほとんどのユースケースでは、imgsz=1280 から imgsz=640 に変更することで、精度をほとんど落とさずに約4倍の速度向上が見込めます。ネットワークレイテンシを低減するために、ユーザーに近いリージョンにデプロイしてください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionデータはどのくらいの期間保持されますか？#

データ型	保持期間
Metrics	30 日間
ログ	7 日間

Link to this section外部監視を設定できますか？#

はい、エンドポイント URL は外部監視ツールで動作します:

稼働監視 (Pingdom, UptimeRobot)
APM ツール (Datadog, New Relic)
/health エンドポイント経由のカスタムヘルスチェック

Link to this sectionレイテンシの数値はどの程度正確ですか？#

レイテンシメトリクスは以下を測定します:

P50: 中央値応答時間
P95: 95パーセンタイル
P99: 99パーセンタイル

これらはサーバーサイドの処理時間を表しており、ユーザーへのネットワークレイテンシは含まれていません。

Link to this sectionメトリクスが遅延するのはなぜですか？#

メトリクスには約2分の遅延があります。その理由は以下の通りです:

メトリクス集計パイプライン
集計ウィンドウ
ダッシュボードのキャッシュ

リアルタイムのデバッグには、ほぼ瞬時に反映されるログを確認してください。

Link to this section複数のエンドポイントをまとめて監視できますか？#

はい、デプロイメントページには、集計された概要カードとともにすべてのエンドポイントが表示されます。テーブルビューを使用して、デプロイメント全体のパフォーマンスを比較してください。

貢献者

GLglenn-jocher¹³ SEsergiuwaxmann¹

作成日 2026年1月14日更新日 3 時間前