コンテンツにスキップ

モニタリング

Ultralytics 、デプロイされたエンドポイントの監視を提供します。リクエストメトリクスの追跡、ログの閲覧、自動ポーリングによるヘルス状態の確認が可能です。

Ultralytics 展開ページ概要カードと世界地図

デプロイメントダッシュボード

The Deploy サイドバーのページは、すべてのデプロイメントの監視ダッシュボードとして機能します。世界地図、概要メトリクス、デプロイメント管理を1つのビューに統合しています。参照 専用エンドポイント デプロイメントの作成および管理のため。

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

概要カード

ページ上部の4枚の要約カードには以下が表示されます:

Ultralytics 展開ページ4の概要カード

メトリック説明
総リクエスト数(24時間)すべてのエンドポイントにわたるリクエスト
アクティブなデプロイメント現在実行中のエンドポイント
エラー率(24時間)失敗したリクエストの割合
P95 レイテンシー(24時間)95パーセンタイル応答時間

エラー率アラート

エラー率カードは、率が5%を超えた場合に赤色で強調表示されます。確認してください。 Logs 個々のデプロイメントをタブで切り替えてエラーを診断する。

世界地図

インタラクティブな世界地図には以下が表示されます:

  • 利用可能な全43地域に対応した地域ピン
  • 展開済み地域を示す緑色のピン
  • アクティブなデプロイメントが進行中の地域を示すアニメーション付き青ピン
  • ピンサイズはデプロイ状況とレイテンシに基づいて変動します

Ultralytics 展開ページ展開済み地域の世界地図

デプロイメント一覧

概要カードの下にあるデプロイメントリストには、プロジェクト全体のすべてのエンドポイントが表示されます。表示モードの切り替えボタンで以下の表示を切り替えられます:

表示説明
カードメトリクス、ログ、コード、予測タブを含む詳細カード
コンパクト主要指標を表示する小型カード(1~4列)のグリッド
ソート可能な列を持つデータテーブル: 名前、地域、ステータス、リクエスト数、P95、エラー数

リアルタイム更新

ダッシュボードは30秒ごとにメトリックの更新をポーリングします。デプロイが移行状態(作成中、デプロイ中)にある場合、ポーリング間隔は3秒ごとに短縮されます。即時更新が必要な場合はリフレッシュボタンをクリックしてください。

デプロイごとのメトリクス

各デプロイメントカード(カードビュー内)にはリアルタイムのメトリクスが表示されます:

メトリクス行

メトリック説明
リクエストリクエスト数(24時間)とアイコン
P95レイテンシ95パーセンタイル応答時間
エラー率失敗したリクエストの割合

メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。

ヘルスチェック

実行中のデプロイメントにはヘルスチェックインジケーターが表示されます:

インジケーター意味
緑の心健全 — 応答遅延を示す
赤いハート不健全 — エラーメッセージが表示される
回転中のアイコンヘルスチェックを実行中

ヘルスチェックは異常状態の場合、20秒ごとに自動再試行されます。手動でヘルスチェックをトリガーするには更新アイコンをクリックしてください。スケールダウンされたエンドポイントのコールドスタートに対応するため、ヘルスチェックは55秒のタイムアウトを使用します。

Ultralytics カードの健全性チェック健全(遅延あり)

コールドスタート耐性

ヘルスチェックは、スケール・トゥ・ゼロエンドポイントのコールドスタートを考慮し、55秒のタイムアウトを設定しています(最悪の場合、最大約45秒)。エンドポイントがウォームアップされると、ヘルスチェックはミリ秒単位で完了します。

ログ

各配備カードには以下が含まれます Logs 最近のログエントリを表示するタブ:

Ultralytics 展開カードログタブ(重大度フィルター付き)

ログエントリ

各ログエントリの表示内容:

フィールド説明
重大度色分けされたバー(下記参照)
タイムスタンプリクエスト時間(ローカル形式)
メッセージログ内容
HTTP情報ステータスコードおよび遅延時間(該当する場合)

フィルターボタンを使用して、深刻度でログをフィルタリングします:

レベル説明
デバッググレイデバッグメッセージ
INFO正常なリクエスト
WARNING重要度の低い問題
ERROR失敗したリクエスト
重大濃い赤重大な障害
制御説明
エラーエラーおよび警告エントリにフィルタリングする
すべてすべてのログエントリを表示
コピー表示されているログをすべてクリップボードにコピーする
更新ログエントリを再読み込み

UIには直近20件のエントリが表示されます。APIはリクエストごとにデフォルトで50件(最大200件)を返します。

デバッグワークフロー

エラーを調査する際は:まず「エラー」をクリックしてERRORおよびWARNINGエントリに絞り込み、タイムスタンプとHTTPステータスコードを確認してください。チームと共有するため、ログをクリップボードにコピーします。

コード例

各配備カードには以下が含まれます Code 実際のエンドポイントURLとAPIキーを含む、すぐに使えるAPIコードを表示するタブ:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

自動入力される認証情報

閲覧時に Code プラットフォームのタブでは、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。参照 APIキー 鍵を生成する。

展開予測

The Predict 各デプロイメントカードのタブには、インライン予測パネルが用意されています。これはモデルのインターフェースと同じものです。 Predict タブではなく、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、ブラウザから直接デプロイされたエンドポイントをテストするのに便利です。参照 推論 パラメータの詳細と応答形式については。

APIエンドポイント

監視の概要

GET /api/monitoring

認証済みユーザーが所有するすべてのデプロイメントの集計メトリクスを返します。オプションのワークスペース認識機能により owner クエリパラメータ

デプロイメント指標

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

特定のデプロイメントのスパークラインデータと要約メトリクスを返します。更新間隔:60秒。

パラメータ種類説明
sparklineboolスパークラインデータを含める
rangestring時間範囲: 1h, 6h, 24h, 7d、または 30d

デプロイログ

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

最近のログエントリを返します。オプションで重大度フィルターとページネーションを指定できます。

パラメータ種類説明
limitint返すエントリの最大数(デフォルト: 50、最大: 200)
severitystringカンマ区切りの深刻度フィルター
pageTokenstring前のレスポンスからのページネーショントークン

デプロイメントの健全性

GET /api/deployments/{deploymentId}/health

ヘルスチェックのステータスと応答遅延を返します。

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

パフォーマンスの最適化

監視データを活用してデプロイを最適化してください:

レイテンシーが高すぎる場合:

  1. インスタンス数を確認する(さらに必要となる可能性あり)
  2. モデルサイズが適切であるかを確認する
  3. より近い領域を考慮する
  4. 送信されている画像サイズを確認する

レイテンシの低減

切り替える imgsz=1280 宛先 imgsz=640 ほとんどのユースケースで、精度をほとんど損なわずに約4倍の高速化を実現します。ネットワーク遅延を低減するため、ユーザーに近いリージョンにデプロイしてください。

エラーが発生している場合:

  1. エラーログを確認する Logs タブ
  2. リクエスト形式の確認(マルチパート形式が必要)
  3. APIキーが有効であるかを確認する
  4. レート制限を確認する

容量上限に達している場合:

  1. 複数のリージョンを検討する
  2. リクエストのバッチ処理を最適化する
  3. CPU メモリリソースを増やす

よくある質問

データはどのくらいの期間保持されますか?

データ型保持期間
メトリクス30日間
ログ7日間

外部モニタリングを設定できますか?

はい、エンドポイントURLは外部モニタリングツールと連携します:

  • 稼働時間監視(Pingdom、UptimeRobot)
  • APMツール(Datadog、New Relic)
  • カスタムヘルスチェック経由で /health エンドポイント

レイテンシーの数値はどのくらい正確ですか?

レイテンシメトリクス測定項目:

  • P50:中央値応答時間
  • P95:95パーセンタイル
  • P99:99パーセンタイル

これらはサーバー側の処理時間を表し、ユーザーへのネットワークレイテンシは含まれません。

メトリクスが遅延するのはなぜですか?

メトリクスには以下の理由により約2分の遅延があります:

  • メトリクス集計パイプライン
  • 集計ウィンドウ
  • ダッシュボードのキャッシュ

リアルタイムデバッグには、ほぼ瞬時に反映されるログを確認してください。

複数のエンドポイントをまとめて監視できますか?

はい、デプロイメントページには集計された概要カード付きの全エンドポイントが表示されます。テーブルビューを使用して、デプロイメント間のパフォーマンスを比較してください。



📅 1ヶ月前に作成 ✏️ 5日前に更新
glenn-jochersergiuwaxmann

コメント