コンテンツにスキップ

データセット

Ultralytics データセットは、トレーニングデータの管理を効率化するソリューションを提供します。アップロード後、データセットはモデルトレーニングに即時利用可能となり、自動処理と統計情報の生成が行われます。


見る: Ultralytics プラットフォームにデータセットをアップロードする

データセットのアップロード

Ultralytics 柔軟性のため、複数のアップロード形式に対応しています:

形式説明
画像個々の画像ファイル(JPG、PNG、WebP、TIFF、RAW)
ZIPアーカイブ画像とオプションのラベルを含む圧縮フォルダ
動画MP4、AVIファイル - フレームを約1fpsで抽出
YOLOラベル付き標準YOLO 構造

動画フレーム抽出

動画をアップロードすると、フレームが自動的に抽出されます:

  • フレームレート:約1フレーム毎秒
  • 最大フレーム数:動画あたり100フレーム
  • 処理:アップロード前のクライアントサイド抽出
  • フォーマット:フレームを標準画像形式に変換

監視映像、アクション記録、またはあらゆる動画ソースからトレーニングデータセットを作成するのに最適です。

データセットの準備

ラベル付きデータセットには、標準のYOLO を使用してください:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

YAMLファイルはデータセットの設定を定義します:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

アップロードプロセス

  1. サイドバーの「データセット」に移動する
  2. データセットをアップロード」をクリックするか、ファイルをアップロードゾーンにドラッグしてください
  3. タスクタイプを選択(detect、segment、姿勢推定、OBB、classify)
  4. 名前と任意の説明を追加してください
  5. アップロードをクリック

アップロード後、プラットフォームはお客様のデータを処理します:

  1. 正規化:大きな画像をリサイズ(最大4096ピクセル)
  2. サムネイル:256pxのプレビュー画像が生成されました
  3. ラベル解析:YOLO ラベルを抽出
  4. 統計:クラス分布の計算結果
アップロード前に検証

アップロード前にローカルでデータセットを検証できます:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

画像を参照する

データセットの画像を複数のレイアウトで表示:

表示説明
グリッド注釈オーバーレイ付きサムネイルグリッド
コンパクト素早く見渡せる小さなサムネイル
ファイル名、寸法、ラベル数を記載したリスト

フルスクリーンビューアー

いずれかの画像をクリックすると、フルスクリーンビューアーが開きます:

  • ナビゲーション:矢印キーまたはクリックで閲覧
  • メタデータ:ファイル名、寸法、分割、ラベル数
  • 注釈: 注釈の表示/非表示を切り替える
  • クラス別内訳:クラスごとのラベル数

分割によるフィルタリング

画像データをデータセット分割でフィルタリングする:

分割目的
トレーニングモデル訓練に使用される
Valトレーニング中の検証に使用される
テスト最終評価に使用される
不明割り当てられた分割なし

データセット統計

統計タブでは、データセットの自動分析を提供します:

クラスDistribution

クラスごとの注釈数を示す棒グラフ:

場所ヒートマップ

画像内の注釈表示位置の可視化:

次元解析

画像の寸法(幅対高さ)の散布図:

統計キャッシュ

統計データは5分間キャッシュされます。注釈の変更はキャッシュの有効期限が切れた後に反映されます。

データセットのエクスポート

オフライン利用のためにデータセットをNDJSON形式でエクスポートします:

  1. データセット操作メニューを開く
  2. エクスポートをクリック
  3. NDJSONファイルをダウンロードしてください

NDJSON形式は、1行につき1つのJSONオブジェクトを格納します:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

詳細な仕様については、Ultralytics 形式のドキュメントを参照してください。

データセット URI

リファレンスプラットフォームのデータセットを使用して ul:// URI形式:

ul://username/datasets/dataset-slug

このURIを使用して、どこからでもモデルをトレーニングできます:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

プラットフォームデータでどこでもトレーニング

The ul:// URIはあらゆる環境から動作します:

  • ローカルマシン: 自身のハードウェアでトレーニング、データは自動ダウンロード
  • Google : ノートブックでプラットフォームのデータセットにアクセス
  • リモートサーバー:完全なデータセットアクセスを備えたクラウド仮想マシン上でトレーニング

表示設定

データセットの閲覧者を制御する:

設定説明
非公開アクセスできるのはあなただけです
公開誰でも「探索」ページで閲覧できます

表示を変更するには:

  1. データセット操作メニューを開く
  2. 編集をクリック
  3. 表示設定を切り替える
  4. 保存をクリック

データセットの編集

データセット名、説明、または可視性を更新する:

  1. データセット操作メニューを開く
  2. 編集をクリック
  3. 変更を加える
  4. 保存をクリック

データセットの削除

不要になったデータセットを削除する:

  1. データセット操作メニューを開く
  2. 削除をクリック
  3. 削除を確認

ごみ箱と復元

削除されたデータセットは30日間ごみ箱に移動されます。設定の「ごみ箱」ページから復元できます。

データセットで学習する

データセットから直接トレーニングを開始します:

  1. データセットページで「ClickTrainモデル」をクリック
  2. プロジェクトを選択するか、新規作成してください
  3. トレーニングパラメータを設定する
  4. トレーニングを開始する

詳細はクラウドトレーニングをご覧ください。

よくある質問

アップロード後のデータはどうなりますか?

お客様のデータは、選択された地域(米国、EU、またはAP)で処理および保存されます。画像は:

  1. フォーマットとサイズが検証済み
  2. 4096pxを超える場合は(アスペクト比を維持して)正規化される
  3. SHA-256ハッシュを用いたコンテンツアドレス可能ストレージ(CAS)を使用して保存
  4. 高速閲覧のため256pxで生成されたサムネイル
  5. 許可なく共有することはありません

ストレージはどのように機能しますか?

Ultralytics 効率的なストレージのためにコンテンツアドレス可能ストレージ(CAS)を採用しています:

  • 重複排除: 異なるユーザーによってアップロードされた同一の画像は一度だけ保存される
  • 完全性:SHA-256ハッシュによりデータの完全性が保証されます
  • 効率性:保管コストを削減し、処理を高速化します
  • 地域: データは選択した地域(米国、EU、またはAP)に保持されます

既存のデータセットに画像を追加することはできますか?

はい、データセットページの「画像を追加」ボタンを使用して追加の画像をアップロードしてください。新しい統計は自動的に計算されます。

画像データを別のデータセットに移動するにはどうすればよいですか?

一括選択機能を使用してください:

  1. ギャラリーで画像を選択する
  2. 移動またはコピーをクリック
  3. 目的のデータセットを選択してください

どのラベル形式がサポートされていますか?

Ultralytics YOLO ラベルをサポートします:

  • 検出: class_id x_center y_center width height
  • セグメント: class_id x1 y1 x2 y2 ... (ポリゴン点)
  • ポーズ: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

すべての座標は正規化されています(0~1の範囲)。



📅 0日前に作成 ✏️ 0日前に更新
glenn-jocher

コメント