Link to this sectionモニタリング#
Ultralytics Platformは、デプロイされたエンドポイントのモニタリング機能を提供します。自動ポーリングにより、リクエストメトリクスの追跡、ログの表示、ヘルスステータスの確認が可能です。

Link to this sectionデプロイメントダッシュボード#
サイドバーのDeployページは、すべてのデプロイメントのモニタリングダッシュボードとして機能します。世界地図、概要メトリクス、デプロイメント管理が1つの画面に集約されています。デプロイメントの作成と管理については、Dedicated Endpointsを参照してください。
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this section概要カード#
ページ上部の4つのサマリーカードには以下が表示されます:

| メトリクス | 説明 |
|---|---|
| 合計リクエスト数 (24時間) | 全エンドポイントの合計リクエスト数 |
| アクティブなデプロイメント | 現在実行中のエンドポイント |
| エラー率 (24時間) | 失敗したリクエストの割合 |
| P95レイテンシ (24時間) | 95パーセンタイルのレスポンス時間 |
エラー率が5%を超えると、エラー率カードが赤色で強調表示されます。個別のデプロイメントのLogsタブを確認してエラーを診断してください。
Link to this section世界地図#
インタラクティブな世界地図には以下が表示されます:
- 利用可能な全43リージョンのリージョンピン
- デプロイ済みのリージョンを示す緑色のピン
- 現在デプロイ実行中のリージョンを示すアニメーション付き青いピン
- デプロイメントのステータスとレイテンシに基づいてサイズが変化するピンのサイズ

Link to this sectionデプロイメントリスト#
概要カードの下には、プロジェクト全体のすべてのエンドポイントが表示されるデプロイメントリストがあります。表示モードの切り替えにより、以下を選択できます:
| 表示 | 説明 |
|---|---|
| カード | メトリクス、ログ、コード、予測タブを含む詳細カード |
| コンパクト | 主要メトリクスを含む小型カードのグリッド(1〜4列) |
| テーブル | 名前、リージョン、ステータス、リクエスト数、P95、エラーでソート可能なデータテーブル |
ダッシュボードは15秒ごとにデプロイメントステータスの更新をポーリングします。デプロイメントが遷移状態(creating、deploying、またはstopping)にある場合、ポーリングは3秒ごとに短縮されます。メトリクスチャートは60秒ごとに更新されます。更新ボタンをクリックすると即時に更新できます。
Link to this sectionデプロイメントごとのメトリクス#
各デプロイメントカード(カード表示)にはリアルタイムのメトリクスが表示されます:
Link to this sectionメトリクス行#
| メトリクス | 説明 |
|---|---|
| リクエスト数 | アイコン付きのリクエストカウント(24時間) |
| P95レイテンシ | 95パーセンタイルのレスポンス時間 |
| エラー率 | 失敗したリクエストの割合 |
メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。
Link to this sectionヘルスチェック#
実行中のデプロイメントにはヘルスチェックインジケーターが表示されます:
| インジケーター | 意味 |
|---|---|
| 緑色のハート | 正常 — レスポンスレイテンシを表示します |
| 赤色のハート | 異常 — エラーメッセージを表示します |
| 回転するアイコン | ヘルスチェック実行中 |
ヘルスチェックは異常時に20秒間隔で自動再試行されます。更新アイコンをクリックすると手動でヘルスチェックを実行できます。ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタートを考慮し、55秒のタイムアウトを設定しています。

ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタート(最悪の場合、約45秒)を考慮して55秒のタイムアウトを使用します。エンドポイントがウォームアップされると、ヘルスチェックはミリ秒単位で完了します。
Link to this sectionログ#
各デプロイメントカードには、最近のログエントリを表示するためのLogsタブが含まれています:

Link to this sectionログエントリ#
各ログエントリには以下が表示されます:
| フィールド | 説明 |
|---|---|
| 深刻度 | 色分けされたバー(下記参照) |
| タイムスタンプ | リクエスト時刻(ローカル形式) |
| メッセージ | ログの内容 |
| HTTP情報 | ステータスコードとレイテンシ(該当する場合) |
フィルタボタンを使用して、深刻度別にログをフィルタリングします:
| レベル | 色 | 説明 |
|---|---|---|
| DEBUG | グレー | デバッグメッセージ |
| INFO | ブルー | 通常のリクエスト |
| WARNING | イエロー | 非致命的な問題 |
| ERROR | レッド | 失敗したリクエスト |
| CRITICAL | ダークレッド | 致命的な障害 |
UIには直近の20エントリが表示されます。APIはデフォルトでリクエストごとに50エントリ(最大200)を返します。
エラーを調査する際は、まずErrorsをクリックしてERRORおよびWARNINGエントリに絞り込み、次にタイムスタンプとHTTPステータスコードを確認してください。チームと共有するためにログをクリップボードにコピーします。
Link to this sectionコード例#
各デプロイメントカードには、実際のエンドポイントURLとAPIキーが設定された、すぐに使えるAPIコードが表示されるCodeタブが含まれています:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())プラットフォーム上でCodeタブを表示すると、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。キーの生成についてはAPI Keysを参照してください。
Link to this sectionデプロイメント予測#
各デプロイメントカードの Predict タブでは、インライン予測パネルを提供しています。これはモデルの Predict タブと同じインターフェースですが、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、デプロイされたエンドポイントをブラウザから直接テストするのに便利です。パラメータの詳細とレスポンス形式については、Inference を参照してください。
Link to this sectionAPI エンドポイント#
Link to this section監視の概要#
GET /api/monitoring認証されたユーザーが所有するすべてのデプロイメントの集計メトリクスを返します。オプションの owner クエリパラメータを使用してワークスペースを認識します。
Link to this sectionデプロイメントメトリクス#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h特定のデプロイメントのスパークラインデータとサマリーメトリクスを返します。更新間隔は 60 秒です。
| パラメータ | タイプ | 説明 |
|---|---|---|
sparkline | bool | スパークラインデータを含む |
range | string | 時間範囲: 1h、6h、24h、7d、または 30d |
Link to this sectionデプロイメントログ#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGオプションの重要度フィルタとページネーションを備えた最近のログエントリを返します。
| パラメータ | タイプ | 説明 |
|---|---|---|
limit | int | 返す最大エントリ数 (デフォルト: 50、最大: 200) |
severity | string | カンマ区切りの重要度フィルタ |
pageToken | string | 前回のレスポンスからのページネーショントークン |
Link to this sectionデプロイメントの健全性#
GET /api/deployments/{deploymentId}/healthレスポンスレイテンシを含むヘルスチェックステータスを返します。
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionパフォーマンスの最適化#
監視データを使用してデプロイメントを最適化する方法:
レイテンシが高すぎる場合:
- インスタンス数を確認する (増やす必要があるかもしれません)
- モデルサイズが適切か確認する
- より近いリージョンを検討する
- 送信している画像サイズを確認する
ほとんどのユースケースでは、imgsz=1280 から imgsz=640 に変更することで、精度をほとんど落とさずに約4倍の速度向上が見込めます。ネットワークレイテンシを低減するために、ユーザーに近いリージョンにデプロイしてください。
Link to this sectionよくある質問 (FAQ)#
Link to this sectionデータはどのくらいの期間保持されますか?#
| データ型 | 保持期間 |
|---|---|
| Metrics | 30 日間 |
| ログ | 7 日間 |
Link to this section外部監視を設定できますか?#
はい、エンドポイント URL は外部監視ツールで動作します:
- 稼働監視 (Pingdom, UptimeRobot)
- APM ツール (Datadog, New Relic)
/healthエンドポイント経由のカスタムヘルスチェック
Link to this sectionレイテンシの数値はどの程度正確ですか?#
レイテンシメトリクスは以下を測定します:
- P50: 中央値応答時間
- P95: 95パーセンタイル
- P99: 99パーセンタイル
これらはサーバーサイドの処理時間を表しており、ユーザーへのネットワークレイテンシは含まれていません。
Link to this sectionメトリクスが遅延するのはなぜですか?#
メトリクスには約2分の遅延があります。その理由は以下の通りです:
- メトリクス集計パイプライン
- 集計ウィンドウ
- ダッシュボードのキャッシュ
リアルタイムのデバッグには、ほぼ瞬時に反映されるログを確認してください。
Link to this section複数のエンドポイントをまとめて監視できますか?#
はい、デプロイメントページには、集計された概要カードとともにすべてのエンドポイントが表示されます。テーブルビューを使用して、デプロイメント全体のパフォーマンスを比較してください。