デプロイ

Q: What happens when an endpoint is idle?

スケール・トゥ・ゼロを有効にした場合：アイドル期間後の最初のリクエストはコールドスタートをトリガーします。

Ultralytics 、YOLO 本番環境へ導入するための包括的なデプロイオプションを提供します。ブラウザベースの推論によるモデルのテスト、43のグローバルリージョンにまたがる専用エンドポイントへのデプロイ、パフォーマンスのリアルタイム監視が可能です。

概要

デプロイセクションでは、以下のことが可能です。

テスト ブラウザ内で直接モデルを Predict タブ
デプロイ（世界43の地域にある専用エンドポイントへ）
リクエストのメトリクス、ログ、およびヘルスチェックを監視する
トラフィックに応じて自動的にスケール（スケール・トゥ・ゼロを含む）

Ultralytics 概要カード付き世界地図

デプロイオプション

Ultralytics Platformは、複数のデプロイパスを提供します。

オプション	説明	最適な用途
予測タブ	ブラウザベースの推論（画像、ウェブカメラ、例題対応）	開発、検証
共有推論	3つのリージョンにまたがるマルチテナントサービス	軽度の使用、テスト
専用エンドポイント	43のリージョンにまたがるシングルテナントサービス	本番、低レイテンシ

ワークフロー

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff

ステージ	説明
テスト	モデルを `Predict` タブ
設定	地域、リソース、およびデプロイメント名を選択してください
デプロイ	専用エンドポイントを `Deploy` タブ
監視	モニタリングでリクエスト、レイテンシ、エラー、ログを追跡する

アーキテクチャ

共有推論

共有推論サービスは3つの主要リージョンで稼働し、お客様のデータリージョンに基づいてリクエストを自動的にルーティングします：

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff

リージョン	ロケーション
米国	アイオワ州、米国
欧州	ベルギー、ヨーロッパ
AP	香港、アジア太平洋地域

専用エンドポイント

Ultralytics で世界43地域にデプロイ:

アメリカ大陸：14地域
ヨーロッパ：13地域
アジア太平洋地域：12地域
中東・アフリカ：4地域

各エンドポイントは、以下の機能を備えたシングルテナントサービスです。

専用コンピューティングリソース（設定可能なCPUとCPU ）
自動スケーリング（アイドル時にスケールゼロ）
一意のエンドポイントURL
独立した監視、ログ、およびヘルスチェック

デプロイメントページ

サイドバーの以下の項目からグローバルデプロイメントページにアクセスしてください Deployこのページには以下が表示されます：

展開地域ピン付き世界地図（インタラクティブマップ）
概要カード: 総リクエスト数 (24時間)、アクティブなデプロイメント、エラー率 (24時間)、P95レイテンシ (24時間)
デプロイメント一覧（3つの表示モード：カード、コンパクト、テーブル）
完了したモデルからエンドポイントを作成するための「新規デプロイ」ボタン

Ultralytics デプロイページ概要カードとデプロイメント一覧

自動ポーリング

ページは30秒ごとにメトリクスの更新をポーリングします。デプロイが移行状態（作成中、デプロイ中、停止中）にある場合、ポーリング間隔は2～3秒に短縮され、ほぼ瞬時のフィードバックが提供されます。

主な特徴

グローバルカバレッジ

以下の43のリージョンをカバーし、ユーザーの近くにデプロイできます。

北米、南米
ヨーロッパ、中東、アフリカ
アジア太平洋、オセアニア

自動スケーリング

エンドポイントは自動的にスケーリングします。

スケールをゼロに設定：アイドル時はコストなし（デフォルト）
スケールアップ：トラフィックの急増を自動的に処理する

コスト削減

スケール・トゥ・ゼロはデフォルトで有効です（最小インスタンス数 = 0）。アクティブな推論時間に対してのみ課金されます。

低レイテンシー

専用エンドポイントは以下を提供します。

コールドスタート: 約5～15秒（キャッシュ済みコンテナ）、最大約45秒（初回デプロイ時）
ウォーム推論: 50〜200ミリ秒 (モデルに依存)
最適なパフォーマンスのためのリージョンルーティング

健康診断

各実行デプロイメントには、以下の自動ヘルスチェックが含まれます：

稼働状態インジケーター（正常/異常）
応答遅延表示
状態不良時の自動再試行（20秒間隔でポーリング）
手動更新ボタン

クイックスタート

2分以内にモデルをデプロイする：

モデルをプロジェクトにトレーニングまたはアップロードする
モデルの「デプロイ」タブに移動する
レイテンシテーブルから地域を選択してください
デプロイをクリック — エンドポイントが公開されました

クイックデプロイ

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

デプロイ後、APIキー付きのエンドポイントURLを使用して、あらゆるアプリケーションから推論リクエストを送信できます。

クイックリンク

推論: ブラウザでモデルをテスト
エンドポイント: 専用エンドポイントのデプロイ
モニタリング: デプロイのパフォーマンスをtrack

よくある質問

共有推論と専用推論の違いは何ですか？

機能	共有	専用
レイテンシー	可変	一貫性
コスト	リクエストごとの支払い	稼働時間に応じた支払い
スケール	制限あり	設定可能
リージョン	3	43
URL	汎用	カスタム

デプロイにはどのくらい時間がかかりますか？

専用エンドポイントのデプロイには通常1〜2分かかります。

イメージプル（約30秒）
コンテナ起動（約30秒）
ヘルスチェック（約30秒）

複数のモデルをデプロイできますか？

はい、各モデルは異なるリージョンに複数のエンドポイントを持つことができます。合計エンドポイント数に制限はありません（プランによる）。

エンドポイントがアイドル状態の場合、どうなりますか？

スケール・トゥ・ゼロが有効な場合：

非アクティブ後にエンドポイントがスケールダウンします
最初の要求でコールドスタートが発生します
以降の要求は高速です

アイドル期間後の最初のリクエストはコールドスタートを引き起こす。

📅 1ヶ月前に作成 ✏️ 5日前に更新