コンテンツにスキップ

クラウドトレーニング

Ultralytics Platformのクラウドトレーニングは、クラウドGPUでのワンクリックトレーニングを提供し、複雑なセットアップなしでモデルトレーニングを可能にします。リアルタイムのメトリクスストリーミングと自動チェックポイント保存機能により、YOLOモデルをトレーニングできます。

UI からトレーニング

Platformから直接クラウドトレーニングを開始します。

  1. プロジェクトに移動します。
  2. モデルをトレーニングをクリックします
  3. トレーニングパラメータを設定します。
  4. トレーニングを開始をクリックします

ステップ1: データセットの選択

アップロード済みのデータセットから選択します。

オプション説明
あなたのデータセットアップロード済みのデータセット
公開データセットExploreからの公開データセット

ステップ2: モデルの設定

ベースモデルとパラメーターを選択します。

パラメータ説明デフォルト
モデル基本アーキテクチャ(YOLO26n、s、m、l、x)YOLO26n
エポック数トレーニングイテレーション数100
画像サイズ入力解像度640
バッチサイズイテレーションあたりのサンプル数自動

ステップ3: GPU の選択

計算リソースを選択してください:

ティアGPUVRAM時間単価最適な用途
予算RTX A20006ギガバイト$0.12小規模データセット、テスト
予算RTX 308010ギガバイト$0.25中規模データセット
予算RTX 3080 Ti12ギガバイト$0.30中規模データセット
予算A3024ギガバイト$0.44より大きなバッチサイズ
RTX 409024ギガバイト$0.60優れたコストパフォーマンス
A600048ギガバイト$0.90大型モデル
L424ギガバイト$0.54推論最適化
L40S48ギガバイト$1.72大規模バッチ学習
ProA100 40GB40ギガバイト$2.78生産訓練
ProA100 80GB80ギガバイト$3.44非常に大規模なモデル
ProH10080ギガバイト$5.38最速トレーニング
エンタープライズH200141ギガバイト$5.38最大限のパフォーマンス
エンタープライズB200192ギガバイト$10.38最大モデル
UltralyticsRTX PRO 600048ギガバイト$3.68Ultralytics

GPUの選択

  • RTX 4090:ほとんどの作業において最高のコストパフォーマンスを実現(時間あたり0.60ドル)
  • A100 80GB: 大規模なバッチサイズまたは大規模モデルに必要です。
  • H100/H200: 時間依存性のあるトレーニングにおける最高性能
  • B200:NVIDIA アーキテクチャによる最先端ワークロード向けソリューション

ステップ4: トレーニングの開始

トレーニングを開始をクリックしてジョブを起動します。プラットフォームは以下の通りです:

  1. GPUインスタンスをプロビジョニングします
  2. データセットをダウンロードします
  3. トレーニングを開始します
  4. メトリクスをリアルタイムでストリーミングします

無料クレジット

新規アカウントには登録特典として5ドル(法人メールの場合は25ドル)が付与されます。これは数回のトレーニング走行に十分な金額です。残高は「設定」>「請求」で確認できます

トレーニングを監視する

リアルタイムのトレーニング進捗を表示:

ライブメトリクス

メトリック説明
損失訓練および検証損失
mAP平均適合率
適合率正しく検出された陽性予測
再現率検出された正解データ
GPU利用率GPU利用率
メモリGPUメモリ使用量

チェックポイント

チェックポイントは自動的に保存されます:

  • 各エポック: 最新の重みが保存されます
  • 最良モデル: 最高のmAPチェックポイントが保持されます
  • 最終モデル: 訓練完了時の重み

停止と再開

トレーニングの停止

ジョブを一時停止するには、訓練停止をクリックしてください:

  • 現在のチェックポイントが保存されます
  • GPUインスタンスが解放されます
  • クレジットの課金が停止されます

トレーニングの再開

最後のチェックポイントから再開します:

  1. モデルに移動します
  2. 訓練再開をクリックしてください
  3. 続行を確認します

再開の制限

明示的に停止された訓練のみ再開できます。失敗した訓練ジョブは、最初からやり直す必要がある場合があります。

リモートトレーニング

ご自身のハードウェアで訓練しながら、メトリクスをプラットフォームにストリーミングします。

パッケージバージョンの要件

Platformとの統合にはultralytics>=8.4.0が必要です。それより低いバージョンはPlatformでは動作しません。

pip install "ultralytics>=8.4.0"

API キーのセットアップ

  1. 設定 > APIキーに移動します
  2. 訓練スコープを持つ新しいキーを作成します
  3. 環境変数を設定します:
export ULTRALYTICS_API_KEY="your_api_key"

ストリーミングでのトレーニング

以下を使用します project および name メトリクスをストリーミングするためのパラメータ:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(
    data="coco.yaml",
    epochs=100,
    project="username/my-project",
    name="experiment-1",
)

プラットフォームデータセットの使用

プラットフォームに保存されたデータセットでトレーニング:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

The ul:// URI形式により、データセットが自動的にダウンロードされ、設定されます。

請求

トレーニング費用はGPUの使用量に基づきます:

コスト見積もり

トレーニング開始前に、プラットフォームは以下の要素に基づいて総コストを推定します:

Estimated Cost = Base Time × Model Multiplier × Dataset Multiplier × GPU Speed Factor × GPU Rate

コストに影響を与える要因:

因子影響
データセットサイズ画像が多いほど、学習時間が長くなる
モデルサイズより大きなモデル(m, l, x)は(n, s)よりも学習速度が遅い
エポック数訓練時間に対する直接的な乗数
画像サイズより大きな画像サイズは計算量を増大させる
GPU高速なGPUはトレーニング時間を短縮する

費用例

シナリオGPU時間コスト
1000枚の画像、YOLO26n、100エポックRTX 4090約1時間約0.60ドル
5000枚の画像、YOLO26m、100エポックA100 80GB約4時間約13.76ドル
10000枚の画像、YOLO26x、200エポックH100約8時間約43.04ドル

保留/決済システム

プラットフォームは消費者保護の課金モデルを採用しています:

  1. 見積もり:トレーニング開始前に算出された費用
  2. 保留:推定金額+20%の安全マージンを残高から確保
  3. 列車:残高に「予約済み」と表示される予約済み金額
  4. 精算:完了後、実際に使用したGPU のみ課金
  5. 返金:超過分は自動的に残高に返金されます

消費者保護

トレーニング開始前に表示された見積もり額を超える請求は一切発生しません。トレーニングが早期に終了した場合やキャンセルされた場合、実際に使用したコンピューティング時間分の料金のみをお支払いいただきます。

支払い方法

メソッド説明
アカウント残高事前チャージ済みクレジット
ジョブごとの支払いジョブ完了時に課金

最低残高

エポックベースのトレーニングを開始するには、最低5.00ドルの残高が必要です。

トレーニングコストの表示

トレーニング後、詳細な費用は請求タブで確認できます:

  • エポックごとの費用内訳
  • 総GPU時間
  • 費用レポートのダウンロード

トレーニングのヒント

適切なモデルサイズの選択

モデルパラメータ最適な用途
YOLO26n2.4Mリアルタイム、エッジデバイス
YOLO26s9.5M速度と精度のバランス
YOLO26m20.4Mより高い精度
YOLO26l24.8Mプロダクション精度
YOLO26x55.7M最大精度

トレーニング時間の最適化

  1. 小さく始める: まず少ないエポック数でテストする
  2. 適切なGPUを使用する: モデル/バッチサイズに合わせてGPUを選択する
  3. データセットを検証する: トレーニング前に品質を確認する
  4. 早期に監視する: メトリクスが横ばいになったら停止する

トラブルシューティング

問題ソリューション
トレーニングが0%で停止するデータセットの形式を確認し、再試行する
メモリ不足バッチサイズを減らすか、より大きなGPUを使用する
精度が低いエポック数を増やす、データ品質を確認する
トレーニングが遅いより高速なGPUを検討する

よくある質問

トレーニングにはどのくらいの時間がかかりますか?

トレーニング時間は以下によって異なります:

  • データセットサイズ
  • モデルサイズ
  • エポック数
  • 選択されたGPU

一般的な時間 (画像1000枚、100エポック):

モデルRTX 4090A100
YOLO26n30分20分
YOLO26m60分40分
YOLO26x120分80分

一晩中トレーニングできますか?

はい、トレーニングは完了するまで続行されます。トレーニングが終了すると通知が届きます。エポックベースのトレーニングに十分な残高がアカウントにあることを確認してください。

クレジットがなくなったらどうなりますか?

トレーニングは現在のエポックの終わりに一時停止します。チェックポイントは保存され、クレジットを追加した後で再開できます。

カスタムトレーニング引数を使用できますか?

はい、上級ユーザーはトレーニング設定で追加の引数を指定できます。

トレーニングパラメーターリファレンス

コアパラメーター

パラメータ種類デフォルト範囲説明
epochsint1001+トレーニングエポック数
batchint16-1 = 自動バッチサイズ (自動の場合は-1)
imgszint64032+入力画像サイズ
patienceint1000+早期停止の許容回数
workersint80+データローダーワーカー数
cacheboolFalse-画像キャッシュ (RAM/ディスク)

学習率パラメーター

パラメータ種類デフォルト範囲説明
lr0float0.010.0-1.0初期学習率
lrffloat0.010.0-1.0最終学習率係数
momentumfloat0.9370.0-1.0SGD momentum
weight_decayfloat0.00050.0-1.0L2正則化
warmup_epochsfloat3.00+ウォームアップエポック
cos_lrboolFalse-コサイン学習率スケジューラー

データ拡張パラメーター

パラメータ種類デフォルト範囲説明
hsv_hfloat0.0150.0-1.0HSV色相拡張
hsv_sfloat0.70.0-1.0HSV彩度
hsv_vfloat0.40.0-1.0HSV明度
degreesfloat0.0-回転角度
translatefloat0.10.0-1.0平行移動比率
scalefloat0.50.0-1.0スケール係数
fliplrfloat0.50.0-1.0水平反転確率
flipudfloat0.00.0-1.0垂直反転確率
mosaicfloat1.00.0-1.0モザイク拡張
mixupfloat0.00.0-1.0MixUp拡張
copy_pastefloat0.00.0-1.0コピー&ペースト (segment)

オプティマイザーの選択

説明
auto自動選択 (デフォルト)
SGD確率的勾配降下法
AdamAdam オプティマイザ
AdamW重み減衰付きAdam

タスク固有のパラメータ

一部のパラメータは特定のタスクにのみ適用されます:

  • セグメント: overlap_mask, mask_ratio, copy_paste
  • ポーズ: pose (損失重み), kobj (キーポイントの物体性)
  • 分類: dropout, erasing, auto_augment


📅 20日前に作成✏️ 14日前に更新
glenn-jocherLaughing-q

コメント