コンテンツにスキップ

モニタリング

Ultralytics Platformは、デプロイされたエンドポイントに対して包括的なモニタリングを提供します。リクエストメトリクスをtrackし、ログを表示し、パフォーマンスをリアルタイムで分析できます。

モニタリングダッシュボード

サイドバーからグローバルモニタリングダッシュボードにアクセスします。

  1. サイドバーのモニタリングをクリックします。
  2. すべてのデプロイメントを一覧で表示します。
  3. 個々のエンドポイントをクリックして詳細を表示します。

概要カード

メトリック説明
総リクエスト数全エンドポイントのリクエスト数 (24時間)
アクティブなデプロイメント現在実行中のエンドポイント
エラー率失敗したリクエストの割合
平均レイテンシー平均応答時間

デプロイメントテーブル

主要なメトリクスを含むすべてのデプロイメントを表示:

説明
モデルリンク付きモデル名
リージョンフラグ付きデプロイ済みリージョン
ステータス実行中/停止中インジケーター
リクエストリクエスト数 (24時間)
レイテンシーP50応答時間
エラーエラー数 (24時間)
スパークライントラフィックトレンドの視覚化

リアルタイム更新

ダッシュボードは30秒ごとにポーリングされます。即時更新するには更新をクリックしてください。

エンドポイントメトリクス

個々のエンドポイントの詳細メトリクスを表示:

  1. モデルのデプロイタブに移動します。
  2. エンドポイントをクリック
  3. メトリクスパネルを表示

利用可能なメトリクス

メトリック説明単位
リクエスト数時間の経過に伴う合計リクエスト数カウント
リクエストレイテンシ応答時間の分布ms
エラー率失敗したリクエストの割合%
インスタンス数アクティブなコンテナインスタンスカウント
CPU使用率プロセッサ使用率%
メモリ使用量RAM消費量MB

時間範囲

メトリクス表示期間を選択:

範囲説明
1h過去1時間
6h過去6時間
24h過去24時間 (デフォルト)
7d過去7日間

メトリクスチャート

インタラクティブチャートで表示される内容:

  • 折れ線グラフで時間経過に伴う傾向
  • ホバーで正確な値を確認
  • ズームで特定の期間を分析

ログ

デバッグ用にリクエストログを表示:

ログエントリ

各ログエントリの表示内容:

フィールド説明
タイムスタンプリクエスト時刻
重大度INFO, WARNING, ERROR
メッセージログ内容
リクエストID一意の識別子

重大度レベル

重大度でログをフィルタリング:

レベル説明
INFO正常なリクエスト
WARNING重要度の低い問題
ERROR失敗したリクエスト

ログフィルタリング

ログをフィルタリングして問題を見つける:

  1. 重要度レベルを選択
  2. キーワードで検索
  3. 時間範囲でフィルタリング

アラート

エンドポイントの問題に対するアラートを設定 (近日公開):

アラートタイプトリガー
高エラー率エラー率 > しきい値
高レイテンシーP95レイテンシ > しきい値
リクエストなし期間中のリクエストがゼロ
スケーリングインスタンスが最大容量に達しています

パフォーマンスの最適化

監視データを使用して最適化する:

高レイテンシー

レイテンシーが高すぎる場合:

  1. インスタンス数を確認する(さらに必要となる可能性あり)
  2. モデルサイズが適切であるかを確認する
  3. より近いリージョンを検討する
  4. 送信されている画像サイズを確認する

高エラー率

エラーが発生している場合:

  1. 詳細についてエラーログを確認する
  2. リクエスト形式を確認する
  3. APIキーが有効であるかを確認する
  4. レート制限を確認する

スケーリングの問題

容量上限に達している場合:

  1. 最大インスタンス数を増やす
  2. 最小インスタンス数を0より大きく設定する
  3. 複数のリージョンを検討する
  4. リクエストのバッチ処理を最適化する

データのエクスポート

分析のために監視データをエクスポートする:

  1. 期間を選択する
  2. エクスポートをクリック
  3. CSVファイルをダウンロードする

エクスポート内容:

  • タイムスタンプ
  • リクエスト数
  • レイテンシーメトリクス
  • エラー数
  • インスタンスメトリクス

よくある質問

データはどのくらいの期間保持されますか?

データ型保持期間
メトリクス30日間
ログ7日間
アラート90日間

外部モニタリングを設定できますか?

はい、エンドポイントURLは外部モニタリングツールと連携します:

  • 稼働時間監視(Pingdom、UptimeRobot)
  • APMツール(Datadog、New Relic)
  • カスタムヘルスチェック

レイテンシーの数値はどのくらい正確ですか?

レイテンシメトリクス測定項目:

  • P50:中央値応答時間
  • P95:95パーセンタイル
  • P99:99パーセンタイル

これらはサーバー側の処理時間を表し、ユーザーへのネットワークレイテンシは含まれません。

メトリクスが遅延するのはなぜですか?

メトリクスには以下の理由により約2分の遅延があります:

  • メトリクス集計パイプライン
  • 集計ウィンドウ
  • ダッシュボードのキャッシュ

リアルタイムデバッグには、ほぼ瞬時に反映されるログを確認してください。

複数のエンドポイントをまとめて監視できますか?

はい、グローバルモニタリングダッシュボードにはすべてのエンドポイントが表示されます。デプロイメント間のパフォーマンスを比較するには、テーブルを使用してください。



📅 20日前に作成✏️ 20日前に更新
glenn-jocher

コメント