モニタリング
Ultralytics 、デプロイされたエンドポイントの監視を提供します。リクエストメトリクスの追跡、ログの閲覧、自動ポーリングによるヘルス状態の確認が可能です。

デプロイメントダッシュボード
The Deploy サイドバーのページは、すべてのデプロイメントの監視ダッシュボードとして機能します。世界地図、概要メトリクス、デプロイメント管理を1つのビューに統合しています。参照 専用エンドポイント デプロイメントの作成および管理のため。
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff
概要カード
ページ上部の4枚の要約カードには以下が表示されます:

| メトリック | 説明 |
|---|---|
| 総リクエスト数(24時間) | すべてのエンドポイントにわたるリクエスト |
| アクティブなデプロイメント | 現在実行中のエンドポイント |
| エラー率(24時間) | 失敗したリクエストの割合 |
| P95 レイテンシー(24時間) | 95パーセンタイル応答時間 |
エラー率アラート
エラー率カードは、率が5%を超えた場合に赤色で強調表示されます。確認してください。 Logs 個々のデプロイメントをタブで切り替えてエラーを診断する。
世界地図
インタラクティブな世界地図には以下が表示されます:
- 利用可能な全43地域に対応した地域ピン
- 展開済み地域を示す緑色のピン
- アクティブなデプロイメントが進行中の地域を示すアニメーション付き青ピン
- ピンサイズはデプロイ状況とレイテンシに基づいて変動します

デプロイメント一覧
概要カードの下にあるデプロイメントリストには、プロジェクト全体のすべてのエンドポイントが表示されます。表示モードの切り替えボタンで以下の表示を切り替えられます:
| 表示 | 説明 |
|---|---|
| カード | メトリクス、ログ、コード、予測タブを含む詳細カード |
| コンパクト | 主要指標を表示する小型カード(1~4列)のグリッド |
| 表 | ソート可能な列を持つデータテーブル: 名前、地域、ステータス、リクエスト数、P95、エラー数 |
リアルタイム更新
ダッシュボードは30秒ごとにメトリックの更新をポーリングします。デプロイが移行状態(作成中、デプロイ中)にある場合、ポーリング間隔は3秒ごとに短縮されます。即時更新が必要な場合はリフレッシュボタンをクリックしてください。
デプロイごとのメトリクス
各デプロイメントカード(カードビュー内)にはリアルタイムのメトリクスが表示されます:
メトリクス行
| メトリック | 説明 |
|---|---|
| リクエスト | リクエスト数(24時間)とアイコン |
| P95レイテンシ | 95パーセンタイル応答時間 |
| エラー率 | 失敗したリクエストの割合 |
メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。
ヘルスチェック
実行中のデプロイメントにはヘルスチェックインジケーターが表示されます:
| インジケーター | 意味 |
|---|---|
| 緑の心 | 健全 — 応答遅延を示す |
| 赤いハート | 不健全 — エラーメッセージが表示される |
| 回転中のアイコン | ヘルスチェックを実行中 |
ヘルスチェックは異常状態の場合、20秒ごとに自動再試行されます。手動でヘルスチェックをトリガーするには更新アイコンをクリックしてください。スケールダウンされたエンドポイントのコールドスタートに対応するため、ヘルスチェックは55秒のタイムアウトを使用します。

コールドスタート耐性
ヘルスチェックは、スケール・トゥ・ゼロエンドポイントのコールドスタートを考慮し、55秒のタイムアウトを設定しています(最悪の場合、最大約45秒)。エンドポイントがウォームアップされると、ヘルスチェックはミリ秒単位で完了します。
ログ
各配備カードには以下が含まれます Logs 最近のログエントリを表示するタブ:

ログエントリ
各ログエントリの表示内容:
| フィールド | 説明 |
|---|---|
| 重大度 | 色分けされたバー(下記参照) |
| タイムスタンプ | リクエスト時間(ローカル形式) |
| メッセージ | ログ内容 |
| HTTP情報 | ステータスコードおよび遅延時間(該当する場合) |
フィルターボタンを使用して、深刻度でログをフィルタリングします:
| レベル | 色 | 説明 |
|---|---|---|
| デバッグ | グレイ | デバッグメッセージ |
| INFO | 青 | 正常なリクエスト |
| WARNING | 黄 | 重要度の低い問題 |
| ERROR | 赤 | 失敗したリクエスト |
| 重大 | 濃い赤 | 重大な障害 |
| 制御 | 説明 |
|---|---|
| エラー | エラーおよび警告エントリにフィルタリングする |
| すべて | すべてのログエントリを表示 |
| コピー | 表示されているログをすべてクリップボードにコピーする |
| 更新 | ログエントリを再読み込み |
UIには直近20件のエントリが表示されます。APIはリクエストごとにデフォルトで50件(最大200件)を返します。
デバッグワークフロー
エラーを調査する際は:まず「エラー」をクリックしてERRORおよびWARNINGエントリに絞り込み、タイムスタンプとHTTPステータスコードを確認してください。チームと共有するため、ログをクリップボードにコピーします。
コード例
各配備カードには以下が含まれます Code 実際のエンドポイントURLとAPIキーを含む、すぐに使えるAPIコードを表示するタブ:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
自動入力される認証情報
閲覧時に Code プラットフォームのタブでは、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。参照 APIキー 鍵を生成する。
展開予測
The Predict 各デプロイメントカードのタブには、インライン予測パネルが用意されています。これはモデルのインターフェースと同じものです。 Predict タブではなく、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、ブラウザから直接デプロイされたエンドポイントをテストするのに便利です。参照 推論 パラメータの詳細と応答形式については。
APIエンドポイント
監視の概要
GET /api/monitoring
認証済みユーザーが所有するすべてのデプロイメントの集計メトリクスを返します。オプションのワークスペース認識機能により owner クエリパラメータ
デプロイメント指標
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h
特定のデプロイメントのスパークラインデータと要約メトリクスを返します。更新間隔:60秒。
| パラメータ | 種類 | 説明 |
|---|---|---|
sparkline | bool | スパークラインデータを含める |
range | string | 時間範囲: 1h, 6h, 24h, 7d、または 30d |
デプロイログ
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING
最近のログエントリを返します。オプションで重大度フィルターとページネーションを指定できます。
| パラメータ | 種類 | 説明 |
|---|---|---|
limit | int | 返すエントリの最大数(デフォルト: 50、最大: 200) |
severity | string | カンマ区切りの深刻度フィルター |
pageToken | string | 前のレスポンスからのページネーショントークン |
デプロイメントの健全性
GET /api/deployments/{deploymentId}/health
ヘルスチェックのステータスと応答遅延を返します。
{
"healthy": true,
"status": 200,
"latencyMs": 142
}
パフォーマンスの最適化
監視データを活用してデプロイを最適化してください:
レイテンシーが高すぎる場合:
- インスタンス数を確認する(さらに必要となる可能性あり)
- モデルサイズが適切であるかを確認する
- より近い領域を考慮する
- 送信されている画像サイズを確認する
レイテンシの低減
切り替える imgsz=1280 宛先 imgsz=640 ほとんどのユースケースで、精度をほとんど損なわずに約4倍の高速化を実現します。ネットワーク遅延を低減するため、ユーザーに近いリージョンにデプロイしてください。
エラーが発生している場合:
- エラーログを確認する
Logsタブ - リクエスト形式の確認(マルチパート形式が必要)
- APIキーが有効であるかを確認する
- レート制限を確認する
容量上限に達している場合:
- 複数のリージョンを検討する
- リクエストのバッチ処理を最適化する
- CPU メモリリソースを増やす
よくある質問
データはどのくらいの期間保持されますか?
| データ型 | 保持期間 |
|---|---|
| メトリクス | 30日間 |
| ログ | 7日間 |
外部モニタリングを設定できますか?
はい、エンドポイントURLは外部モニタリングツールと連携します:
- 稼働時間監視(Pingdom、UptimeRobot)
- APMツール(Datadog、New Relic)
- カスタムヘルスチェック経由で
/healthエンドポイント
レイテンシーの数値はどのくらい正確ですか?
レイテンシメトリクス測定項目:
- P50:中央値応答時間
- P95:95パーセンタイル
- P99:99パーセンタイル
これらはサーバー側の処理時間を表し、ユーザーへのネットワークレイテンシは含まれません。
メトリクスが遅延するのはなぜですか?
メトリクスには以下の理由により約2分の遅延があります:
- メトリクス集計パイプライン
- 集計ウィンドウ
- ダッシュボードのキャッシュ
リアルタイムデバッグには、ほぼ瞬時に反映されるログを確認してください。
複数のエンドポイントをまとめて監視できますか?
はい、デプロイメントページには集計された概要カード付きの全エンドポイントが表示されます。テーブルビューを使用して、デプロイメント間のパフォーマンスを比較してください。