データセット
Ultralytics データセットは、トレーニングデータの管理を効率化するソリューションを提供します。アップロード後、データセットはモデルトレーニングに即時利用可能となり、自動処理と統計情報の生成が行われます。
見る: Ultralytics プラットフォームにデータセットをアップロードする
データセットのアップロード
Ultralytics 柔軟性のため、複数のアップロード形式に対応しています:
| 形式 | 説明 |
|---|---|
| 画像 | 個々の画像ファイル(JPG、PNG、WebP、TIFF、RAW) |
| ZIPアーカイブ | 画像とオプションのラベルを含む圧縮フォルダ |
| 動画 | MP4、AVIファイル - フレームを約1fpsで抽出 |
| YOLO | ラベル付き標準YOLO 構造 |
動画フレーム抽出
動画をアップロードすると、フレームが自動的に抽出されます:
- フレームレート:約1フレーム毎秒
- 最大フレーム数:動画あたり100フレーム
- 処理:アップロード前のクライアントサイド抽出
- フォーマット:フレームを標準画像形式に変換
監視映像、アクション記録、またはあらゆる動画ソースからトレーニングデータセットを作成するのに最適です。
データセットの準備
ラベル付きデータセットには、標準のYOLO を使用してください:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
YAMLファイルはデータセットの設定を定義します:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
アップロードプロセス
- サイドバーの「データセット」に移動する
- 「データセットをアップロード」をクリックするか、ファイルをアップロードゾーンにドラッグしてください
- タスクタイプを選択(detect、segment、姿勢推定、OBB、classify)
- 名前と任意の説明を追加してください
- アップロードをクリック
アップロード後、プラットフォームはお客様のデータを処理します:
- 正規化:大きな画像をリサイズ(最大4096ピクセル)
- サムネイル:256pxのプレビュー画像が生成されました
- ラベル解析:YOLO ラベルを抽出
- 統計:クラス分布の計算結果
アップロード前に検証
アップロード前にローカルでデータセットを検証できます:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
画像を参照する
データセットの画像を複数のレイアウトで表示:
| 表示 | 説明 |
|---|---|
| グリッド | 注釈オーバーレイ付きサムネイルグリッド |
| コンパクト | 素早く見渡せる小さなサムネイル |
| 表 | ファイル名、寸法、ラベル数を記載したリスト |
フルスクリーンビューアー
いずれかの画像をクリックすると、フルスクリーンビューアーが開きます:
- ナビゲーション:矢印キーまたはクリックで閲覧
- メタデータ:ファイル名、寸法、分割、ラベル数
- 注釈: 注釈の表示/非表示を切り替える
- クラス別内訳:クラスごとのラベル数
分割によるフィルタリング
画像データをデータセット分割でフィルタリングする:
| 分割 | 目的 |
|---|---|
| トレーニング | モデル訓練に使用される |
| Val | トレーニング中の検証に使用される |
| テスト | 最終評価に使用される |
| 不明 | 割り当てられた分割なし |
データセット統計
統計タブでは、データセットの自動分析を提供します:
クラスDistribution
クラスごとの注釈数を示す棒グラフ:
場所ヒートマップ
画像内の注釈表示位置の可視化:
次元解析
画像の寸法(幅対高さ)の散布図:
統計キャッシュ
統計データは5分間キャッシュされます。注釈の変更はキャッシュの有効期限が切れた後に反映されます。
データセットのエクスポート
オフライン利用のためにデータセットをNDJSON形式でエクスポートします:
- データセット操作メニューを開く
- エクスポートをクリック
- NDJSONファイルをダウンロードしてください
NDJSON形式は、1行につき1つのJSONオブジェクトを格納します:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
詳細な仕様については、Ultralytics 形式のドキュメントを参照してください。
データセット URI
リファレンスプラットフォームのデータセットを使用して ul:// URI形式:
ul://username/datasets/dataset-slug
このURIを使用して、どこからでもモデルをトレーニングできます:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
プラットフォームデータでどこでもトレーニング
The ul:// URIはあらゆる環境から動作します:
- ローカルマシン: 自身のハードウェアでトレーニング、データは自動ダウンロード
- Google : ノートブックでプラットフォームのデータセットにアクセス
- リモートサーバー:完全なデータセットアクセスを備えたクラウド仮想マシン上でトレーニング
表示設定
データセットの閲覧者を制御する:
| 設定 | 説明 |
|---|---|
| 非公開 | アクセスできるのはあなただけです |
| 公開 | 誰でも「探索」ページで閲覧できます |
表示を変更するには:
- データセット操作メニューを開く
- 編集をクリック
- 表示設定を切り替える
- 保存をクリック
データセットの編集
データセット名、説明、または可視性を更新する:
- データセット操作メニューを開く
- 編集をクリック
- 変更を加える
- 保存をクリック
データセットの削除
不要になったデータセットを削除する:
- データセット操作メニューを開く
- 削除をクリック
- 削除を確認
ごみ箱と復元
削除されたデータセットは30日間ごみ箱に移動されます。設定の「ごみ箱」ページから復元できます。
データセットで学習する
データセットから直接トレーニングを開始します:
- データセットページで「ClickTrainモデル」をクリック
- プロジェクトを選択するか、新規作成してください
- トレーニングパラメータを設定する
- トレーニングを開始する
詳細はクラウドトレーニングをご覧ください。
よくある質問
アップロード後のデータはどうなりますか?
お客様のデータは、選択された地域(米国、EU、またはAP)で処理および保存されます。画像は:
- フォーマットとサイズが検証済み
- 4096pxを超える場合は(アスペクト比を維持して)正規化される
- SHA-256ハッシュを用いたコンテンツアドレス可能ストレージ(CAS)を使用して保存
- 高速閲覧のため256pxで生成されたサムネイル
- 許可なく共有することはありません
ストレージはどのように機能しますか?
Ultralytics 効率的なストレージのためにコンテンツアドレス可能ストレージ(CAS)を採用しています:
- 重複排除: 異なるユーザーによってアップロードされた同一の画像は一度だけ保存される
- 完全性:SHA-256ハッシュによりデータの完全性が保証されます
- 効率性:保管コストを削減し、処理を高速化します
- 地域: データは選択した地域(米国、EU、またはAP)に保持されます
既存のデータセットに画像を追加することはできますか?
はい、データセットページの「画像を追加」ボタンを使用して追加の画像をアップロードしてください。新しい統計は自動的に計算されます。
画像データを別のデータセットに移動するにはどうすればよいですか?
一括選択機能を使用してください:
- ギャラリーで画像を選択する
- 移動またはコピーをクリック
- 目的のデータセットを選択してください
どのラベル形式がサポートされていますか?
Ultralytics YOLO ラベルをサポートします:
- 検出:
class_id x_center y_center width height - セグメント:
class_id x1 y1 x2 y2 ...(ポリゴン点) - ポーズ:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
すべての座標は正規化されています(0~1の範囲)。