コンテンツにスキップ

デプロイ

Ultralytics Platformは、YOLOモデルを本番環境に導入するための包括的なデプロイオプションを提供します。Inference APIでモデルをテストし、専用エンドポイントにデプロイし、リアルタイムでパフォーマンスを監視できます。

概要

デプロイセクションでは、以下のことが可能です。

  • モデルをテスト(ブラウザで直接)
  • デプロイ(世界43の地域にある専用エンドポイントへ)
  • 監視(リクエストメトリクスとログ)
  • スケール(トラフィックに応じて自動的に)

デプロイオプション

Ultralytics Platformは、複数のデプロイパスを提供します。

オプション説明最適な用途
テストタブブラウザベースの推論テスト開発、検証
共有APIマルチテナント推論サービス軽度の使用、テスト
専用エンドポイントシングルテナント本番サービス本番、低レイテンシ

ワークフロー

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ステージ説明
テストsample_imagesでモデルを検証
設定リージョンとスケーリングオプションを選択
デプロイ専用エンドポイントを作成
監視リクエスト、レイテンシ、エラーをtrack

アーキテクチャ

共有推論

共有推論サービスは、主要な3つのリージョンで稼働しています。

リージョンロケーション
米国アイオワ州、米国
欧州ベルギー、ヨーロッパ
AP台湾、アジア太平洋地域

リクエストは、お客様のデータリージョンに自動的にルーティングされます。

専用エンドポイント

世界43のリージョンにデプロイ可能です。

  • 南北アメリカ: 15リージョン
  • ヨーロッパ: 12リージョン
  • アジア太平洋: 16リージョン

各エンドポイントは、以下の機能を備えたシングルテナントサービスです。

  • 専用のコンピューティングリソース
  • オートスケーリング (0〜Nインスタンス)
  • カスタムURL
  • 独立したモニタリング

主な特徴

グローバルカバレッジ

以下の43のリージョンをカバーし、ユーザーの近くにデプロイできます。

  • 北米、南米
  • ヨーロッパ、中東、アフリカ
  • アジア太平洋、オセアニア

自動スケーリング

エンドポイントは自動的にスケーリングします。

  • スケール・トゥ・ゼロ: アイドル時はコストがかかりません
  • スケールアップ: トラフィックの急増に対応
  • 設定可能な制限: 最小/最大インスタンス数の設定

低レイテンシー

専用エンドポイントは以下を提供します。

  • コールドスタート: 約2〜5秒
  • ウォーム推論: 50〜200ミリ秒 (モデルに依存)
  • 最適なパフォーマンスのためのリージョンルーティング

よくある質問

共有推論と専用推論の違いは何ですか?

機能共有専用
レイテンシー可変一貫性
コストリクエストごとの支払い稼働時間に応じた支払い
スケール制限あり設定可能
リージョン343
URL汎用カスタム

デプロイにはどのくらい時間がかかりますか?

専用エンドポイントのデプロイには通常1〜2分かかります。

  1. イメージプル(約30秒)
  2. コンテナ起動(約30秒)
  3. ヘルスチェック(約30秒)

複数のモデルをデプロイできますか?

はい、各モデルは異なるリージョンに複数のエンドポイントを持つことができます。合計エンドポイント数に制限はありません(プランによる)。

エンドポイントがアイドル状態の場合、どうなりますか?

スケール・トゥ・ゼロが有効な場合:

  • 非アクティブ後にエンドポイントがスケールダウンします
  • 最初の要求でコールドスタートが発生します
  • 以降の要求は高速です

コールドスタートを回避するには、最小インスタンス数を0より大きい値に設定してください。



📅 20日前に作成✏️ 14日前に更新
glenn-jocher

コメント