Meet YOLO26: next-gen vision AI.

Link to this sectionモニタリング#

Ultralytics Platformは、デプロイされたエンドポイントのモニタリング機能を提供します。自動ポーリングにより、リクエストメトリクスの追跡、ログの表示、ヘルスステータスの確認が可能です。

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionデプロイメントダッシュボード#

サイドバーのDeployページは、すべてのデプロイメントのモニタリングダッシュボードとして機能します。世界地図、概要メトリクス、デプロイメント管理が1つの画面に集約されています。デプロイメントの作成と管理については、Dedicated Endpointsを参照してください。

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this section概要カード#

ページ上部の4つのサマリーカードには以下が表示されます:

Ultralytics Platform Deploy Page Four Overview Cards

メトリクス説明
合計リクエスト数 (24時間)全エンドポイントの合計リクエスト数
アクティブなデプロイメント現在実行中のエンドポイント
エラー率 (24時間)失敗したリクエストの割合
P95レイテンシ (24時間)95パーセンタイルのレスポンス時間
エラー率アラート

エラー率が5%を超えると、エラー率カードが赤色で強調表示されます。個別のデプロイメントのLogsタブを確認してエラーを診断してください。

Link to this section世界地図#

インタラクティブな世界地図には以下が表示されます:

  • 利用可能な全43リージョンのリージョンピン
  • デプロイ済みのリージョンを示す緑色のピン
  • 現在デプロイ実行中のリージョンを示すアニメーション付き青いピン
  • デプロイメントのステータスとレイテンシに基づいてサイズが変化するピンのサイズ

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionデプロイメントリスト#

概要カードの下には、プロジェクト全体のすべてのエンドポイントが表示されるデプロイメントリストがあります。表示モードの切り替えにより、以下を選択できます:

表示説明
カードメトリクス、ログ、コード、予測タブを含む詳細カード
コンパクト主要メトリクスを含む小型カードのグリッド(1〜4列)
テーブル名前、リージョン、ステータス、リクエスト数、P95、エラーでソート可能なデータテーブル
リアルタイム更新

ダッシュボードは15秒ごとにデプロイメントステータスの更新をポーリングします。デプロイメントが遷移状態(creatingdeploying、またはstopping)にある場合、ポーリングは3秒ごとに短縮されます。メトリクスチャートは60秒ごとに更新されます。更新ボタンをクリックすると即時に更新できます。

Link to this sectionデプロイメントごとのメトリクス#

各デプロイメントカード(カード表示)にはリアルタイムのメトリクスが表示されます:

Link to this sectionメトリクス行#

メトリクス説明
リクエスト数アイコン付きのリクエストカウント(24時間)
P95レイテンシ95パーセンタイルのレスポンス時間
エラー率失敗したリクエストの割合

メトリクスはスパークラインAPIエンドポイントから取得され、60秒ごとに更新されます。

Link to this sectionヘルスチェック#

実行中のデプロイメントにはヘルスチェックインジケーターが表示されます:

インジケーター意味
緑色のハート正常 — レスポンスレイテンシを表示します
赤色のハート異常 — エラーメッセージを表示します
回転するアイコンヘルスチェック実行中

ヘルスチェックは異常時に20秒間隔で自動再試行されます。更新アイコンをクリックすると手動でヘルスチェックを実行できます。ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタートを考慮し、55秒のタイムアウトを設定しています。

Ultralytics Platform Deployment Card Health Check Healthy With Latency

コールドスタートの許容

ヘルスチェックは、スケール・トゥ・ゼロ対応エンドポイントでのコールドスタート(最悪の場合、約45秒)を考慮して55秒のタイムアウトを使用します。エンドポイントがウォームアップされると、ヘルスチェックはミリ秒単位で完了します。

Link to this sectionログ#

各デプロイメントカードには、最近のログエントリを表示するためのLogsタブが含まれています:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionログエントリ#

各ログエントリには以下が表示されます:

フィールド説明
深刻度色分けされたバー(下記参照)
タイムスタンプリクエスト時刻(ローカル形式)
メッセージログの内容
HTTP情報ステータスコードとレイテンシ(該当する場合)

フィルタボタンを使用して、深刻度別にログをフィルタリングします:

レベル説明
DEBUGグレーデバッグメッセージ
INFOブルー通常のリクエスト
WARNINGイエロー非致命的な問題
ERRORレッド失敗したリクエスト
CRITICALダークレッド致命的な障害

UIには直近の20エントリが表示されます。APIはデフォルトでリクエストごとに50エントリ(最大200)を返します。

デバッグワークフロー

エラーを調査する際は、まずErrorsをクリックしてERRORおよびWARNINGエントリに絞り込み、次にタイムスタンプとHTTPステータスコードを確認してください。チームと共有するためにログをクリップボードにコピーします。

Link to this sectionコード例#

各デプロイメントカードには、実際のエンドポイントURLとAPIキーが設定された、すぐに使えるAPIコードが表示されるCodeタブが含まれています:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
自動入力される資格情報

プラットフォーム上でCodeタブを表示すると、実際のエンドポイントURLとAPIキーが自動的に入力されます。コードをコピーして直接実行してください。キーの生成についてはAPI Keysを参照してください。

Link to this sectionデプロイメント予測#

各デプロイメントカードの Predict タブでは、インライン予測パネルを提供しています。これはモデルの Predict タブと同じインターフェースですが、共有サービスではなくデプロイメントエンドポイントを通じて推論を実行します。これは、デプロイされたエンドポイントをブラウザから直接テストするのに便利です。パラメータの詳細とレスポンス形式については、Inference を参照してください。

Link to this sectionAPI エンドポイント#

Link to this section監視の概要#

GET /api/monitoring

認証されたユーザーが所有するすべてのデプロイメントの集計メトリクスを返します。オプションの owner クエリパラメータを使用してワークスペースを認識します。

Link to this sectionデプロイメントメトリクス#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

特定のデプロイメントのスパークラインデータとサマリーメトリクスを返します。更新間隔は 60 秒です。

パラメータタイプ説明
sparklineboolスパークラインデータを含む
rangestring時間範囲: 1h6h24h7d、または 30d

Link to this sectionデプロイメントログ#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

オプションの重要度フィルタとページネーションを備えた最近のログエントリを返します。

パラメータタイプ説明
limitint返す最大エントリ数 (デフォルト: 50、最大: 200)
severitystringカンマ区切りの重要度フィルタ
pageTokenstring前回のレスポンスからのページネーショントークン

Link to this sectionデプロイメントの健全性#

GET /api/deployments/{deploymentId}/health

レスポンスレイテンシを含むヘルスチェックステータスを返します。

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionパフォーマンスの最適化#

監視データを使用してデプロイメントを最適化する方法:

レイテンシが高すぎる場合:

  1. インスタンス数を確認する (増やす必要があるかもしれません)
  2. モデルサイズが適切か確認する
  3. より近いリージョンを検討する
  4. 送信している画像サイズを確認する
レイテンシの削減

ほとんどのユースケースでは、imgsz=1280 から imgsz=640 に変更することで、精度をほとんど落とさずに約4倍の速度向上が見込めます。ネットワークレイテンシを低減するために、ユーザーに近いリージョンにデプロイしてください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionデータはどのくらいの期間保持されますか?#

データ型保持期間
Metrics30 日間
ログ7 日間

Link to this section外部監視を設定できますか?#

はい、エンドポイント URL は外部監視ツールで動作します:

  • 稼働監視 (Pingdom, UptimeRobot)
  • APM ツール (Datadog, New Relic)
  • /health エンドポイント経由のカスタムヘルスチェック

Link to this sectionレイテンシの数値はどの程度正確ですか?#

レイテンシメトリクスは以下を測定します:

  • P50: 中央値応答時間
  • P95: 95パーセンタイル
  • P99: 99パーセンタイル

これらはサーバーサイドの処理時間を表しており、ユーザーへのネットワークレイテンシは含まれていません。

Link to this sectionメトリクスが遅延するのはなぜですか?#

メトリクスには約2分の遅延があります。その理由は以下の通りです:

  • メトリクス集計パイプライン
  • 集計ウィンドウ
  • ダッシュボードのキャッシュ

リアルタイムのデバッグには、ほぼ瞬時に反映されるログを確認してください。

Link to this section複数のエンドポイントをまとめて監視できますか?#

はい、デプロイメントページには、集計された概要カードとともにすべてのエンドポイントが表示されます。テーブルビューを使用して、デプロイメント全体のパフォーマンスを比較してください。

コメント