モニタリング
Ultralytics Platformは、デプロイされたエンドポイントに対して包括的なモニタリングを提供します。リクエストメトリクスをtrackし、ログを表示し、パフォーマンスをリアルタイムで分析できます。
モニタリングダッシュボード
サイドバーからグローバルモニタリングダッシュボードにアクセスします。
- サイドバーのモニタリングをクリックします。
- すべてのデプロイメントを一覧で表示します。
- 個々のエンドポイントをクリックして詳細を表示します。
概要カード
| メトリック | 説明 |
|---|---|
| 総リクエスト数 | 全エンドポイントのリクエスト数 (24時間) |
| アクティブなデプロイメント | 現在実行中のエンドポイント |
| エラー率 | 失敗したリクエストの割合 |
| 平均レイテンシー | 平均応答時間 |
デプロイメントテーブル
主要なメトリクスを含むすべてのデプロイメントを表示:
| 列 | 説明 |
|---|---|
| モデル | リンク付きモデル名 |
| リージョン | フラグ付きデプロイ済みリージョン |
| ステータス | 実行中/停止中インジケーター |
| リクエスト | リクエスト数 (24時間) |
| レイテンシー | P50応答時間 |
| エラー | エラー数 (24時間) |
| スパークライン | トラフィックトレンドの視覚化 |
リアルタイム更新
ダッシュボードは30秒ごとにポーリングされます。即時更新するには更新をクリックしてください。
エンドポイントメトリクス
個々のエンドポイントの詳細メトリクスを表示:
- モデルのデプロイタブに移動します。
- エンドポイントをクリック
- メトリクスパネルを表示
利用可能なメトリクス
| メトリック | 説明 | 単位 |
|---|---|---|
| リクエスト数 | 時間の経過に伴う合計リクエスト数 | カウント |
| リクエストレイテンシ | 応答時間の分布 | ms |
| エラー率 | 失敗したリクエストの割合 | % |
| インスタンス数 | アクティブなコンテナインスタンス | カウント |
| CPU使用率 | プロセッサ使用率 | % |
| メモリ使用量 | RAM消費量 | MB |
時間範囲
メトリクス表示期間を選択:
| 範囲 | 説明 |
|---|---|
| 1h | 過去1時間 |
| 6h | 過去6時間 |
| 24h | 過去24時間 (デフォルト) |
| 7d | 過去7日間 |
メトリクスチャート
インタラクティブチャートで表示される内容:
- 折れ線グラフで時間経過に伴う傾向
- ホバーで正確な値を確認
- ズームで特定の期間を分析
ログ
デバッグ用にリクエストログを表示:
ログエントリ
各ログエントリの表示内容:
| フィールド | 説明 |
|---|---|
| タイムスタンプ | リクエスト時刻 |
| 重大度 | INFO, WARNING, ERROR |
| メッセージ | ログ内容 |
| リクエストID | 一意の識別子 |
重大度レベル
重大度でログをフィルタリング:
| レベル | 色 | 説明 |
|---|---|---|
| INFO | 青 | 正常なリクエスト |
| WARNING | 黄 | 重要度の低い問題 |
| ERROR | 赤 | 失敗したリクエスト |
ログフィルタリング
ログをフィルタリングして問題を見つける:
- 重要度レベルを選択
- キーワードで検索
- 時間範囲でフィルタリング
アラート
エンドポイントの問題に対するアラートを設定 (近日公開):
| アラートタイプ | トリガー |
|---|---|
| 高エラー率 | エラー率 > しきい値 |
| 高レイテンシー | P95レイテンシ > しきい値 |
| リクエストなし | 期間中のリクエストがゼロ |
| スケーリング | インスタンスが最大容量に達しています |
パフォーマンスの最適化
監視データを使用して最適化する:
高レイテンシー
レイテンシーが高すぎる場合:
- インスタンス数を確認する(さらに必要となる可能性あり)
- モデルサイズが適切であるかを確認する
- より近いリージョンを検討する
- 送信されている画像サイズを確認する
高エラー率
エラーが発生している場合:
- 詳細についてエラーログを確認する
- リクエスト形式を確認する
- APIキーが有効であるかを確認する
- レート制限を確認する
スケーリングの問題
容量上限に達している場合:
- 最大インスタンス数を増やす
- 最小インスタンス数を0より大きく設定する
- 複数のリージョンを検討する
- リクエストのバッチ処理を最適化する
データのエクスポート
分析のために監視データをエクスポートする:
- 期間を選択する
- エクスポートをクリック
- CSVファイルをダウンロードする
エクスポート内容:
- タイムスタンプ
- リクエスト数
- レイテンシーメトリクス
- エラー数
- インスタンスメトリクス
よくある質問
データはどのくらいの期間保持されますか?
| データ型 | 保持期間 |
|---|---|
| メトリクス | 30日間 |
| ログ | 7日間 |
| アラート | 90日間 |
外部モニタリングを設定できますか?
はい、エンドポイントURLは外部モニタリングツールと連携します:
- 稼働時間監視(Pingdom、UptimeRobot)
- APMツール(Datadog、New Relic)
- カスタムヘルスチェック
レイテンシーの数値はどのくらい正確ですか?
レイテンシメトリクス測定項目:
- P50:中央値応答時間
- P95:95パーセンタイル
- P99:99パーセンタイル
これらはサーバー側の処理時間を表し、ユーザーへのネットワークレイテンシは含まれません。
メトリクスが遅延するのはなぜですか?
メトリクスには以下の理由により約2分の遅延があります:
- メトリクス集計パイプライン
- 集計ウィンドウ
- ダッシュボードのキャッシュ
リアルタイムデバッグには、ほぼ瞬時に反映されるログを確認してください。
複数のエンドポイントをまとめて監視できますか?
はい、グローバルモニタリングダッシュボードにはすべてのエンドポイントが表示されます。デプロイメント間のパフォーマンスを比較するには、テーブルを使用してください。
📅 20日前に作成✏️ 20日前に更新