監視
Ultralytics 、デプロイされたエンドポイントの包括的な監視を提供します。リクエストメトリクスの追跡、ログの閲覧、パフォーマンスの分析をリアルタイムで行えます。
監視ダッシュボード
サイドバーからグローバル監視ダッシュボードにアクセスしてください:
- サイドバーの「モニタリング」をクリック
- すべてのデプロイメントを一目で確認
- 個々のエンドポイントをクリックして詳細を確認してください
概要カード
| メトリック | 説明 |
|---|---|
| 総リクエスト数 | 全エンドポイントにおけるリクエスト数(24時間) |
| アクティブ展開 | 現在実行中のエンドポイント |
| エラー率 | 失敗したリクエストの割合 |
| 平均遅延 | 平均応答時間 |
デプロイメント一覧
主要指標を含むすべてのデプロイを表示:
| コラム | 説明 |
|---|---|
| モデル | モデル名とリンク |
| 地域 | フラグ付きでデプロイされたリージョン |
| ステータス | 実行中/停止中インジケーター |
| リクエスト | リクエスト数(24時間) |
| レイテンシー | P50応答時間 |
| エラー | エラー件数(24時間) |
| スパークライン | トラフィック動向の可視化 |
リアルタイム更新
ダッシュボードは30秒ごとに更新されます。即時更新が必要な場合は「更新」をクリックしてください。
エンドポイントメトリクス
個々のエンドポイントの詳細なメトリクスを表示する:
- モデルの「デプロイ」タブに移動してください
- エンドポイントをクリックしてください
- メトリクスパネルを表示する
利用可能な指標
| メトリック | 説明 | ユニット |
|---|---|---|
| リクエスト数 | 時間の経過に伴う総リクエスト数 | カウント |
| リクエスト遅延 | 応答時間の分布 | ms |
| エラー率 | 失敗したリクエストの割合 | % |
| インスタンス数 | アクティブなコンテナインスタンス | カウント |
| CPU | プロセッサ使用率 | % |
| メモリ使用量 | RAM消費量 | MB |
時間範囲
メトリクスの時間範囲を選択:
| 範囲 | 説明 |
|---|---|
| 1h | 最後の1時間 |
| 6h | 過去6時間 |
| 24h | 過去24時間(デフォルト) |
| 7d | 過去7日間 |
メートル法チャート
インタラクティブチャートは以下を示します:
- 経時的な傾向を示す折れ線グラフ
- 正確な値を表示するにはカーソルを合わせてください
- 特定の期間を分析するためにズームする
ログ
デバッグ用のリクエストログを表示する:
ログエントリ
各ログエントリには以下が表示されます:
| フィールド | 説明 |
|---|---|
| タイムスタンプ | リクエスト時間 |
| 深刻度 | 情報、警告、エラー |
| メッセージ | ログの内容 |
| リクエストID | 一意の識別子 |
深刻度レベル
ログを重大度でフィルタリングする:
| レベル | 色 | 説明 |
|---|---|---|
| 情報 | 青 | 通常のリクエスト |
| 警告 | 黄色 | 重要でない問題 |
| エラー | 赤 | 失敗したリクエスト |
ログフィルタリング
ログをフィルタリングして問題を特定する:
- 深刻度レベルを選択
- キーワードで検索
- 時間範囲でフィルタリング
アラート
エンドポイントの問題に関するアラートを設定する(近日提供予定):
| アラートタイプ | トリガー |
|---|---|
| 高いエラー率 | エラー率 > 閾値 |
| 高遅延 | P95レイテンシ > 閾値 |
| リクエストはありません | 期間のリクエストがゼロ |
| スケーリング | 最大容量でのインスタンス |
パフォーマンスの最適化
監視データを活用して最適化を行う:
高遅延
レイテンシが高すぎる場合:
- インスタンス数を確認(追加が必要かもしれません)
- モデルのサイズが適切であることを確認する
- より近い地域を考慮する
- 送信される画像サイズを確認する
高いエラー率
エラーが発生している場合:
- 詳細についてはエラーログを確認してください
- 請求書のフォーマットを確認する
- APIキーが有効であることを確認する
- レート制限を確認する
スケーリングの問題
容量に達した場合:
- 最大インスタンス数を増やす
- 最小インスタンス数を 0 以上に設定
- 複数の地域を考慮する
- リクエストのバッチ処理を最適化する
データをエクスポート
分析用に監視データをエクスポートする:
- 時間範囲を選択
- エクスポートをクリック
- CSVファイルをダウンロード
輸出には以下が含まれます:
- タイムスタンプ
- リクエスト数
- レイテンシ指標
- エラー件数
- インスタンスメトリクス
よくある質問
データはどのくらいの期間保持されますか?
| データ型 | リテンション |
|---|---|
| メトリクス | 30日間 |
| ログ | 7日間 |
| アラート | 90日間 |
外部監視を設定できますか?
はい、エンドポイントURLは外部監視ツールで動作します:
- 稼働時間監視(Pingdom、UptimeRobot)
- APMツール(Datadog、New Relic)
- カスタムヘルスチェック
レイテンシの数値はどの程度正確ですか?
レイテンシメトリクスは以下を測定します:
- P50: 中央応答時間
- P95: 第95パーセンタイル
- P99: 第99パーセンタイル
これらはサーバー側の処理時間を表しており、ユーザー側へのネットワーク遅延は含まれていません。
なぜ私のメトリクスが遅延しているのですか?
メトリクスには約2分の遅延が生じます。理由は以下の通りです:
- メトリクス集計パイプライン
- 集計ウィンドウ
- ダッシュボードのキャッシュ
リアルタイムデバッグには、ほぼ瞬時に更新されるログを確認してください。
複数のエンドポイントを同時に監視できますか?
はい、グローバル監視ダッシュボードにはすべてのエンドポイントが表示されます。デプロイメント間のパフォーマンスを比較するには、この表をご利用ください。
📅 0日前に作成 ✏️ 0日前に更新