モニタリング
Ultralytics Platformでは、デプロイされたエンドポイントのモニタリング機能を提供しています。自動ポーリングにより、リクエストメトリクスの追跡、ログの閲覧、ヘルスステータスの確認が可能です。

デプロイメントダッシュボード
サイドバーのDeployページは、すべてのデプロイメントを監視するためのダッシュボードです。このページでは、ワールドマップ、概要メトリクス、デプロイメント管理が一元的に表示されます。デプロイメントの作成と管理については、Dedicated Endpointsを参照してください。
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff概要カード
ページ上部にある4つの概要カードには、以下が表示されます。

| 指標 | 説明 |
|---|---|
| 総リクエスト数 (24時間) | すべてのエンドポイントにおけるリクエスト数 |
| アクティブなデプロイメント | 現在実行中のエンドポイント |
| エラー率 (24時間) | 失敗したリクエストの割合 |
| P95レイテンシ (24時間) | 95パーセンタイル応答時間 |
エラー率が5%を超えると、エラー率カードが赤色で強調表示されます。エラーの診断については、各デプロイメントのLogsタブを確認してください。
ワールドマップ
インタラクティブなワールドマップには以下が表示されます。
- 利用可能な全43リージョンのリージョンピン
- デプロイ済みのリージョンを示す緑色のピン
- デプロイ進行中のリージョンを示すアニメーション付きの青いピン
- デプロイメントのステータスとレイテンシに応じたピンサイズの変化

デプロイメントリスト
概要カードの下には、プロジェクト内の全エンドポイントのリストが表示されます。ビューモードの切り替えにより、以下の表示形式を選択できます。
| 表示 | 説明 |
|---|---|
| カード | メトリクス、ログ、コード、予測タブを含む詳細なカード表示 |
| コンパクト | 主要メトリクスを表示する小さなカードのグリッド(1~4列) |
| テーブル | 名前、リージョン、ステータス、リクエスト数、P95、エラー数でソート可能なデータテーブル |
ダッシュボードは15秒ごとにデプロイメントのステータス更新をポーリングします。デプロイメントが遷移状態(creating、deploying、またはstopping)にある場合、ポーリング間隔は3秒に短縮されます。メトリクスチャートは60秒ごとに更新されます。更新ボタンをクリックすると、即座に最新情報を取得できます。
デプロイメントごとのメトリクス
各デプロイメントカード(カードビュー)には、リアルタイムのメトリクスが表示されます。
メトリクス行
| 指標 | 説明 |
|---|---|
| リクエスト数 | アイコン付きのリクエスト数(24時間) |
| P95レイテンシ | 95パーセンタイル応答時間 |
| エラー率 | 失敗したリクエストの割合 |
メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。
ヘルスチェック
実行中のデプロイメントには、ヘルスチェックのインジケーターが表示されます。
| インジケーター | 意味 |
|---|---|
| 緑色のハート | 正常 — 応答レイテンシを表示 |
| 赤色のハート | 異常 — エラーメッセージを表示 |
| 回転するアイコン | ヘルスチェック実行中 |
異常時には、ヘルスチェックが20秒ごとに自動再試行されます。更新アイコンをクリックすると、手動でヘルスチェックをトリガーできます。ヘルスチェックには、ゼロスケールエンドポイントのコールドスタートに対応するため、55秒のタイムアウトが設定されています。

ヘルスチェックは、ゼロスケールエンドポイントにおけるコールドスタート(最長で約45秒)を考慮し、55秒のタイムアウトを使用します。エンドポイントが起動すると、ヘルスチェックはミリ秒単位で完了します。
ログ
各デプロイメントカードには、最近のログエントリを表示するためのLogsタブがあります。

ログエントリ
各ログエントリには以下が表示されます。
| 項目 | 説明 |
|---|---|
| 深刻度 | 色分けされたバー(下記参照) |
| タイムスタンプ | リクエスト時刻(ローカル形式) |
| メッセージ | ログの内容 |
| HTTP情報 | ステータスコードとレイテンシ(該当する場合) |
フィルターボタンを使用して、深刻度別にログをフィルタリングできます。
| レベル | 色 | 説明 |
|---|---|---|
| DEBUG | グレー | デバッグメッセージ |
| INFO | 青 | 通常のリクエスト |
| WARNING | 黄色 | 重要ではない問題 |
| ERROR | 赤 | 失敗したリクエスト |
| CRITICAL | ダークレッド | 致命的な障害 |
UIには最新の20件のエントリが表示されます。APIのデフォルト設定は1リクエストあたり50件(最大200件)です。
エラー調査時には、まずErrorsをクリックしてERRORおよびWARNINGエントリにフィルタリングし、次にタイムスタンプとHTTPステータスコードを確認してください。ログをクリップボードにコピーしてチームと共有できます。
コード例
各デプロイメントカードにはCodeタブがあり、実際のエンドポイントURLとAPIキーが設定された、すぐに使えるAPIコードが表示されます。
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())プラットフォームの Code タブを表示すると、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。キーの生成については API Keys を参照してください。
デプロイメントの予測
各デプロイメントカードの Predict タブには、インライン予測パネルが用意されています。これはモデルの Predict タブと同じインターフェースですが、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、ブラウザから直接デプロイされたエンドポイントをテストするのに便利です。パラメータの詳細とレスポンス形式については Inference を参照してください。
APIエンドポイント
モニタリングの概要
GET /api/monitoring認証されたユーザーが所有するすべてのデプロイメントについて、集計されたメトリクスを返します。オプションの owner クエリパラメータを使用してワークスペースを指定できます。
デプロイメントメトリクス
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h特定のデプロイメントのスパークラインデータとサマリーメトリクスを返します。更新間隔は60秒です。
| パラメータ | タイプ | 説明 |
|---|---|---|
sparkline | bool | スパークラインデータを含める |
range | 文字列 | 期間: 1h、 6h、 24h、 7d、 または 30d |
デプロイメントログ
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGオプションの重大度フィルターとページネーションを使用して、最近のログエントリを返します。
| パラメータ | タイプ | 説明 |
|---|---|---|
limit | int | 返す最大エントリ数 (デフォルト: 50, 最大: 200) |
severity | 文字列 | カンマ区切りの重大度フィルター |
pageToken | 文字列 | 前のレスポンスからのページネーショントークン |
デプロイメントの健全性
GET /api/deployments/{deploymentId}/healthレスポンスレイテンシを含むヘルスチェックステータスを返します。
{
"healthy": true,
"status": 200,
"latencyMs": 142
}パフォーマンスの最適化
モニタリングデータを使用してデプロイメントを最適化します:
レイテンシが高すぎる場合:
- インスタンス数を確認する(増やす必要があるかもしれません)
- モデルサイズが適切か確認する
- より近いリージョンを検討する
- 送信される画像サイズを確認する
imgsz=1280 から imgsz=640 に切り替えると、ほとんどのユースケースで精度をほとんど損なうことなく約4倍の高速化が可能です。ネットワークレイテンシを低減するために、ユーザーに近いリージョンにデプロイしてください。
FAQ
データはどのくらいの期間保持されますか?
| データ型 | 保持期間 |
|---|---|
| メトリクス | 30日間 |
| ログ | 7日間 |
外部モニタリングを設定できますか?
はい、エンドポイントURLは外部モニタリングツールで利用可能です:
- 稼働監視 (Pingdom、 UptimeRobot)
- APMツール (Datadog、 New Relic)
/healthエンドポイントを介したカスタムヘルスチェック
レイテンシの数値はどの程度正確ですか?
レイテンシメトリクスは以下を測定します:
- P50: 中央値の応答時間
- P95: 95パーセンタイル
- P99: 99パーセンタイル
これらはサーバー側の処理時間を表しており、ユーザーへのネットワークレイテンシは含まれていません。
なぜメトリクスに遅延があるのですか?
メトリクスには約2分の遅延があります。その理由は以下の通りです:
- メトリクス集計パイプライン
- 集計ウィンドウ
- ダッシュボードのキャッシュ
リアルタイムのデバッグには、ほぼ即時反映されるログを確認してください。
複数のエンドポイントをまとめて監視できますか?
はい、デプロイメントページでは集計された概要カードですべてのエンドポイントが表示されます。テーブルビューを使用して、デプロイメント間のパフォーマンスを比較できます。