デプロイ
Ultralytics Platformは、YOLOモデルを本番環境に導入するための包括的なデプロイオプションを提供します。Inference APIでモデルをテストし、専用エンドポイントにデプロイし、リアルタイムでパフォーマンスを監視できます。
概要
デプロイセクションでは、以下のことが可能です。
- モデルをテスト(ブラウザで直接)
- デプロイ(世界43の地域にある専用エンドポイントへ)
- 監視(リクエストメトリクスとログ)
- スケール(トラフィックに応じて自動的に)
デプロイオプション
Ultralytics Platformは、複数のデプロイパスを提供します。
| オプション | 説明 | 最適な用途 |
|---|---|---|
| テストタブ | ブラウザベースの推論テスト | 開発、検証 |
| 共有API | マルチテナント推論サービス | 軽度の使用、テスト |
| 専用エンドポイント | シングルテナント本番サービス | 本番、低レイテンシ |
ワークフロー
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| ステージ | 説明 |
|---|---|
| テスト | sample_imagesでモデルを検証 |
| 設定 | リージョンとスケーリングオプションを選択 |
| デプロイ | 専用エンドポイントを作成 |
| 監視 | リクエスト、レイテンシ、エラーをtrack |
アーキテクチャ
共有推論
共有推論サービスは、主要な3つのリージョンで稼働しています。
| リージョン | ロケーション |
|---|---|
| 米国 | アイオワ州、米国 |
| 欧州 | ベルギー、ヨーロッパ |
| AP | 台湾、アジア太平洋地域 |
リクエストは、お客様のデータリージョンに自動的にルーティングされます。
専用エンドポイント
世界43のリージョンにデプロイ可能です。
- 南北アメリカ: 15リージョン
- ヨーロッパ: 12リージョン
- アジア太平洋: 16リージョン
各エンドポイントは、以下の機能を備えたシングルテナントサービスです。
- 専用のコンピューティングリソース
- オートスケーリング (0〜Nインスタンス)
- カスタムURL
- 独立したモニタリング
主な特徴
グローバルカバレッジ
以下の43のリージョンをカバーし、ユーザーの近くにデプロイできます。
- 北米、南米
- ヨーロッパ、中東、アフリカ
- アジア太平洋、オセアニア
自動スケーリング
エンドポイントは自動的にスケーリングします。
- スケール・トゥ・ゼロ: アイドル時はコストがかかりません
- スケールアップ: トラフィックの急増に対応
- 設定可能な制限: 最小/最大インスタンス数の設定
低レイテンシー
専用エンドポイントは以下を提供します。
- コールドスタート: 約2〜5秒
- ウォーム推論: 50〜200ミリ秒 (モデルに依存)
- 最適なパフォーマンスのためのリージョンルーティング
クイックリンク
よくある質問
共有推論と専用推論の違いは何ですか?
| 機能 | 共有 | 専用 |
|---|---|---|
| レイテンシー | 可変 | 一貫性 |
| コスト | リクエストごとの支払い | 稼働時間に応じた支払い |
| スケール | 制限あり | 設定可能 |
| リージョン | 3 | 43 |
| URL | 汎用 | カスタム |
デプロイにはどのくらい時間がかかりますか?
専用エンドポイントのデプロイには通常1〜2分かかります。
- イメージプル(約30秒)
- コンテナ起動(約30秒)
- ヘルスチェック(約30秒)
複数のモデルをデプロイできますか?
はい、各モデルは異なるリージョンに複数のエンドポイントを持つことができます。合計エンドポイント数に制限はありません(プランによる)。
エンドポイントがアイドル状態の場合、どうなりますか?
スケール・トゥ・ゼロが有効な場合:
- 非アクティブ後にエンドポイントがスケールダウンします
- 最初の要求でコールドスタートが発生します
- 以降の要求は高速です
コールドスタートを回避するには、最小インスタンス数を0より大きい値に設定してください。
📅 20日前に作成✏️ 14日前に更新