クラウドトレーニング

Ultralytics Platformのクラウドトレーニングでは、クラウドGPUを使用したワンクリックトレーニングが可能です。複雑なセットアップなしでモデルのトレーニングが行えます。リアルタイムのメトリクスストリーミングと自動チェックポイント保存機能により、YOLOモデルを効率的にトレーニングできます。

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

トレーニングダイアログ

プロジェクトページのNew Model(またはデータセットページのTrain)をクリックして、プラットフォームUIからトレーニングを開始します。トレーニングダイアログには、Cloud TrainingLocal Trainingの2つのタブがあります。

Ultralytics Platform Training Dialog Cloud Tab

ステップ1:ベースモデルの選択

公式のYOLO26モデル、または独自にトレーニングしたモデルから選択します。

カテゴリ説明
公式全25種類のYOLO26モデル(5サイズ × 5タスク)
自分のモデルファインチューニング用に完成済みのモデル

公式モデルは、タスクタイプ(DetectSegmentPoseOBBClassify)およびnanoからxlargeまでのサイズ別に分類されています。

ステップ2:データセットの選択

トレーニングに使用するデータセットを選択します(Datasetsを参照)。

オプション説明
公式Ultralyticsの厳選データセット
自分のデータセットアップロード済みのデータセット
データセットの要件

データセットはreadyステータスである必要があり、train分割に1枚以上、validationまたはtest分割に1枚以上の画像が含まれ、少なくとも1枚のラベル付き画像が必要です。

タスクの不一致

モデルのタスク(例:detect)とデータセットのタスク(例:segment)が一致しない場合、タスク不一致の警告が表示されます。不一致のまま進めるとトレーニングは失敗します。タスクガイドで説明されている通り、モデルとデータセットの両方で同じタスクタイプを使用していることを確認してください。

ステップ3:パラメータの設定

主要なトレーニングパラメータを設定します。

パラメータ説明デフォルト
Epochsトレーニングの反復回数100
Batch Size反復あたりのサンプル数-1(自動)
画像サイズ入力解像度(320/416/512/640/1280から選択、またはYAMLエディタで32から4096の間で32の倍数を指定)640
Run Nameトレーニング実行の任意の名前自動

ステップ4:詳細設定(オプション)

Advanced Settingsを展開すると、グループ別に整理された40以上のトレーニングパラメータを持つ完全なYAMLベースのパラメータエディタにアクセスできます(構成リファレンスを参照)。

グループパラメータ
学習率 (Learning Rate)lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
Optimizerauto(デフォルト)、SGD、MuSGD、Adam、AdamW、NAdam、RAdam、RMSProp、Adamax
Loss Weightsbox, cls, dfl, pose, kobj, label_smoothing
Color Augmentationhsv_h, hsv_s, hsv_v
Geometric Augment.degrees, translate, scale, shear, perspective
Flip & Mix Augment.flipud, fliplr, mosaic, mixup, copy_paste
Training Controlpatience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
Datasetfraction, freeze, single_cls, rect, multi_scale, resume

パラメータはタスクを認識します(例:copy_pasteはセグメントタスクのみ表示され、pose/kobjはポーズタスクのみ表示されます)。値がデフォルトと異なるとModifiedバッジが表示され、リセットボタンですべてをデフォルトに戻すことができます。

例:小規模データセット向けの拡張(Augmentation)調整

小規模なデータセット(画像数1000枚未満)の場合、過学習を抑えるために拡張を強化します。

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

ステップ5:GPUの選択(Cloudタブ)

Ultralytics CloudからGPUを選択します。

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPU世代VRAMコスト/時間推奨ユーザー
RTX 2000 AdaAda16 GB$0.24小規模データセット、テスト
RTX A4500Ampere20 GB$0.25小規模〜中規模データセット
RTX 4000 AdaAda20 GB$0.26中規模データセット
RTX A5000Ampere24 GB$0.27中規模データセット
L4Ada24 GB$0.39推論最適化
A40Ampere48 GB$0.44より大きなバッチサイズ
RTX 3090Ampere24 GB$0.46汎用トレーニング
RTX A6000Ampere48 GB$0.49大規模モデル
RTX PRO 4500Blackwell32 GB$0.64優れた価格/性能
RTX 4090Ada24 GB$0.69最高の価格/性能
RTX 6000 AdaAda48 GB$0.77大規模バッチトレーニング
L40SAda48 GB$0.86大規模バッチトレーニング
RTX 5090Blackwell32 GB$0.99最新のコンシューマー世代
L40Ada48 GB$0.99大規模モデル
A100 PCIeAmpere80 GB$1.39プロダクション・トレーニング
A100 SXMAmpere80 GB$1.49プロダクション・トレーニング
RTX PRO 6000Blackwell96 GB$1.89推奨デフォルト
H100 PCIeHopper80 GB$2.39高性能トレーニング
H100 SXMHopper80 GB$2.99最速トレーニング
H100 NVLHopper94 GB$3.07最高パフォーマンス
H200 NVLHopper143 GB$3.39最大メモリ
H200 SXMHopper141 GB$3.99最高パフォーマンス
B200Blackwell180 GB$5.49大規模モデル (Pro+)
B300Blackwell288 GB$7.39超大規模モデル (Pro+)
GPUの選択
  • RTX PRO 6000: 96 GB Blackwell、ほとんどのジョブで推奨されるデフォルト
  • A100 SXM: 80 GB HBM2e — 大きなバッチサイズや大規模モデルに適した強力な選択肢
  • H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper、時間にシビアなトレーニング用(全プランで利用可能)
  • H200 NVL / H200 SXM: 141–143 GB Hopper、メモリ負荷の高いワークロード用(全プランで利用可能)
  • B200 / B300: 180–288 GB NVIDIA Blackwell、最先端のワークロード用 — ProまたはEnterpriseが必要

ダイアログには現在の残高Top Upボタンが表示されます。設定内容(モデルサイズ、データセットの画像数、エポック数、GPU速度)に基づいて、コストと期間の概算が計算されます。

ステップ6:トレーニングの開始

Start Trainingをクリックしてジョブを開始します。プラットフォームは以下の処理を行います。

  1. GPUインスタンスのプロビジョニング
  2. データセットのダウンロード
  3. トレーニングの開始
  4. メトリクスのリアルタイムストリーミング

トレーニングジョブのライフサイクル

トレーニングジョブは以下のステータスで進行します。

ステータス説明
Pendingジョブ送信済み、GPU割り当て待ち
StartingGPUプロビジョニング完了、データセットとモデルのダウンロード中
Runningトレーニング進行中、メトリクスをリアルタイムでストリーミング中
Completedトレーニング正常終了
Failedトレーニング失敗(詳細はコンソールログを参照)
Cancelledユーザーによりキャンセル
無料クレジット

新規アカウントにはサインアップクレジットが付与されます(個人メールで5ドル、会社メールで25ドル)。Settings > Billingから残高を確認してください。

Ultralytics Platform Training Progress With Charts

トレーニングを監視する

モデルページのTrainタブでリアルタイムのトレーニング進捗を確認できます。

チャートサブタブ

Ultralytics Platform Model Training Live Charts

メトリクス説明
Lossトレーニングおよびバリデーションの損失
mAP平均適合率(Mean Average Precision)
Precision正しい正解予測
Recall検出された正解データ

コンソールサブタブ

ANSIカラー対応、プログレスバー、エラー検出を備えたライブコンソール出力。

システムサブタブ

リアルタイムのGPU使用率、メモリ、温度、CPU、ディスク使用状況。

チェックポイント

トレーニング完了後、最適なモデルbest.pt、mAPが最も高いチェックポイント)がプラットフォームにアップロードされ、ダウンロード、エクスポート、デプロイが可能になります。

トレーニングをキャンセルする

実行中のジョブを停止するには、モデルページで トレーニングをキャンセル (Cancel Training) をクリックします。

  • コンピューティングインスタンスが終了します
  • クレジットの課金が停止します
  • キャンセル前に到達したベストチェックポイントは引き続き利用可能です

リモートトレーニング

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

自身のハードウェアでトレーニングを行い、メトリクスをプラットフォームにストリーミングします。

パッケージのバージョン要件

プラットフォームの統合には ultralytics>=8.4.35 が必要です。それより古いバージョンではプラットフォームは動作しません。

pip install -U ultralytics

APIキーの設定

  1. Go to Settings > API Keys
  2. 新しいキーを作成します(または「ローカルトレーニング」タブを開くとプラットフォームが自動的に作成します)
  3. 環境変数を設定します:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

ストリーミングによるトレーニング

project パラメータと name パラメータを使用してメトリクスをストリーミングします:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

トレーニングダイアログの ローカルトレーニング (Local Training) タブには、APIキー、選択されたパラメータ、詳細な引数を含む設定済みのコマンドが表示されます。

プラットフォームデータセットの使用

ul:// URI形式 を使用して、プラットフォームに保存されたデータセットでトレーニングします:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

ul:// URI形式は、データセットを自動的にダウンロードおよび構成します。モデルはプラットフォーム上のデータセットに自動的にリンクされます(プラットフォームデータセットの使用 を参照してください)。

請求

トレーニング費用はGPUの使用量に基づいています:

コスト見積もり

トレーニング開始前に、プラットフォームは以下の方法で総コストを見積もります:

  1. エポックあたりの秒数の見積もり: データセットサイズ、モデルの複雑さ、画像サイズ、バッチサイズ、GPU速度から算出
  2. 合計トレーニング時間の計算: エポックあたりの秒数にエポック数を掛け、起動時のオーバーヘッドを追加
  3. 見積もりコストの算出: 合計トレーニング時間にGPUの時給単価を掛けて算出

コストに影響を与える要因:

要因影響
データセットサイズ画像が多いほどトレーニング時間が長くなります(ベースライン: RTX 4090で1000画像あたり約2.8秒の計算)
モデルサイズ大きなモデル (m, l, x) は (n, s) よりもトレーニングが遅くなります
エポック数トレーニング時間に直接的な倍率として影響します
画像サイズ大きなimgszは計算量を増加させます: 320px=0.25倍、640px=1.0倍(ベースライン)、1280px=4.0倍
Batch Size大きなバッチサイズは効率的です(batch 32 = 約0.85倍の時間、batch 8 = 約1.2倍の時間、batch 16をベースラインとした場合)
GPU速度高速なGPUはトレーニング時間を短縮します(例: H100 SXM = RTX 4090より約3.4倍高速)
起動オーバーヘッドインスタンスの初期化、データダウンロード、ウォームアップに最大5分かかります(データセットサイズに応じて変動)

コスト例

見積もり

コスト見積もりは概算であり、多くの要因に依存します。トレーニングダイアログには、トレーニング開始前にリアルタイムの見積もりが表示されます。

シナリオGPU見積もりコスト
500画像, YOLO26n, 50エポックRTX 4090約$0.50
1000画像, YOLO26n, 100エポックRTX PRO 6000約$5
5000画像, YOLO26s, 100エポックH100 SXM約$23

請求フロー

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

クラウドトレーニングの請求フロー:

  1. 見積もり: トレーニング開始前にコストを計算
  2. 残高確認: 開始前に利用可能なクレジットを確認
  3. トレーニング: 選択したコンピューティングでジョブを実行
  4. 請求: 実際の実行時間に基づいて最終コストを算出
消費者保護

請求は、キャンセルされた部分的な実行を含む実際のコンピューティング使用量を追跡します。失敗したトレーニング実行に対しては、一切課金されません。

ジョブステータス別請求

ステータス課金対象か?
Completedはい — 実際のGPU使用時間
Cancelledはい — 開始からキャンセルまでのGPU時間
Failedいいえ — 失敗した実行は請求されません
スタック(停止中)部分的 — 実際のトレーニング時間のみ請求
エラーに対する非課金

設定エラー、メモリ不足問題、またはその他の障害によりトレーニング実行が失敗した場合、課金は発生しません。成功したコンピューティング時間のみが請求されます。スタックしたジョブ(4時間以上アクティビティなし)は自動的に終了され、GPUが実際にトレーニングしていた時間に対してのみ課金され、アイドル時間は請求されません。

支払い方法

手法説明
アカウント残高プリロードされたクレジット
ジョブごとの支払いジョブ完了時に請求
最低残高

トレーニングの開始には、プラスの利用可能残高と、見積もりコストをカバーするのに十分なクレジットが必要です。

トレーニング費用の表示

トレーニング後、請求 (Billing) タブで詳細なコストを確認できます:

  • エポックごとのコスト内訳
  • 合計GPU時間
  • コストレポートのダウンロード

Ultralytics Platform Training Billing Details

トレーニングのヒント

適切なモデルサイズを選択する

モデルパラメータ推奨ユーザー
YOLO26n2.4Mリアルタイム、エッジデバイス向け
YOLO26s9.5M速度と精度のバランス
YOLO26m20.4Mより高い精度
YOLO26l24.8Mプロダクションレベルの精度
YOLO26x55.7M最大精度

トレーニング時間の最適化

コスト削減戦略
  1. 小規模から開始: 予算GPUで10〜20エポックテストし、データセットと構成が正しく機能することを確認します
  2. 適切なGPUを使用: RTX PRO 6000はほとんどのワークロードを良好に処理します
  3. データセットの検証: トレーニングに費用をかける前に、ラベル付けの問題を修正します
  4. 早期モニタリング: 損失が横ばいになった場合はトレーニングをキャンセルしてください。使用したコンピューティング時間分のみが請求されます

トラブルシューティング

問題解決策
トレーニングが0%でスタックするデータセットの形式を確認し、再試行してください
メモリ不足バッチサイズを減らすか、より大きなGPUを使用してください
精度が低いエポック数を増やすか、データの品質を確認してください
トレーニングが遅いより高速なGPUの検討
タスクの不一致エラーモデルとデータセットのタスクが一致していることを確認してください

FAQ

トレーニングにはどのくらい時間がかかりますか?

トレーニング時間は以下に依存します:

  • データセットサイズ
  • モデルサイズ
  • エポック数
  • 選択されたGPU

標準的な時間(1000画像、100エポック):

モデルRTX PRO 6000A100 SXM
YOLO26n~20分~15分
YOLO26m~40分~30分
YOLO26x~80分~60分
概算時間

トレーニング時間は目安であり、データセットの複雑さ、オーギュメンテーションの設定、バッチサイズによって異なります。より正確な予測には、トレーニングダイアログのコスト見積もりをご利用ください。

夜間にトレーニングできますか?

はい、トレーニングは完了するまで継続されます。トレーニングが終了すると通知が届きます。エポックベースのトレーニングには、アカウントに十分な残高があることを確認してください。

クレジットが不足した場合はどうなりますか?

トレーニング中にクレジット残高がゼロになった場合、トレーニングは完了まで継続され、残高はマイナスになります。これにより、トレーニングジョブが途中で中断されることはありません。

トレーニング完了後、新しいトレーニングジョブを開始する前に、残高をプラスに戻すためにクレジットを追加する必要があります。完了したモデル、チェックポイント、およびすべてのトレーニング成果物は、残高に関係なく完全に保持されます。

マイナス残高

マイナス残高は、新しいトレーニングジョブの開始のみを制限します。既存のデプロイメントやその他のプラットフォーム機能は通常通り機能します。中断を避けるには、Settings > Billing からクレジットを追加するか、auto top-up を有効にしてください。

トレーニングが見積もりよりも高いコストになった場合はどうなりますか?

コスト見積もりは概算です。実際のトレーニング時間は、データの読み込み速度、GPUのウォームアップ、モデルの収束挙動などの要因により変動する可能性があります。実際のコストが見積もりを超えた場合、残高がマイナスになることがあります(上記を参照)。プラットフォームは、見積もりに基づいてトレーニングを停止することはありません

コスト管理のために:

  • トレーニングの進行状況をリアルタイムで監視し、必要に応じて早期にキャンセルする
  • auto top-up を有効にして、自動的にクレジットを補充する
  • より短い実行(少ないエポック数)から始めて、期待値を調整する

カスタムトレーニング引数は使用できますか?

はい、トレーニングダイアログの Advanced Settings セクションを展開すると、40以上の構成可能なパラメータを持つYAMLエディタにアクセスできます。デフォルト以外の値は、クラウドとローカルの両方のトレーニングコマンドに含まれます。

YAMLエディタは、過去のトレーニング実行からの設定のインポートもサポートしています:

  • 既存のモデルからコピー: 完了したモデルのページで、Training Configurationカードにある Copy as JSON ボタンをクリックします。JSONをコピーしてYAMLエディタに直接貼り付けると、JSON形式が自動的に検出され、すべてのパラメータがインポートされます。
  • YAMLまたはJSONを貼り付け: 有効なYAMLまたはJSONトレーニング設定をエディタに貼り付けます。パラメータは自動的に検証され、範囲外の値はクランプされ、警告が表示されます。
  • ファイルをドラッグ&ドロップ: .yaml または .json ファイルをエディタに直接ドラッグして、そのパラメータをインポートします。

Ultralytics Platform Training Dialog Copy Training Config JSON

これにより、各パラメータを手動で再入力することなく、過去のトレーニング設定を簡単に再現または反復できます。

データセットページからトレーニングできますか?

はい、データセットページの Train ボタンを押すと、データセットが事前選択されロックされた状態でトレーニングダイアログが開きます。次に、プロジェクトとモデルを選択してトレーニングを開始します。

トレーニングパラメータ参照

パラメータタイプデフォルト範囲説明
epochsint1001-10000トレーニングエポック数
batchint-1(自動)-1~512バッチサイズ (-1 = 利用可能なVRAMに自動調整)
imgszint64032-4096入力画像サイズ
patienceint1001-1000早期終了の忍耐度(patience)
seedint00-2147483647再現性のための乱数シード
deterministicboolTrue-決定論的トレーニングモード
ampboolTrue-自動混合精度(AMP)
close_mosaicint100-50最後のNエポックでモザイクを無効化
save_periodint-1-1-100Nエポックごとにチェックポイントを保存
workersint80-64データローダーのワーカー数
cacheselectfalseram/disk/false画像をキャッシュする
タスク固有のパラメータ

一部のパラメータは特定のタスクにのみ適用されます。

  • 検出タスクのみ(detect、segment、pose、OBB — classifyは含まれません): boxdfldegreestranslateshearperspectivemosaicmixupclose_mosaic
  • セグメンテーションのみ: copy_paste
  • ポーズのみ: pose(損失の重み)、kobj(キーポイントの物体らしさ)

コメント