データ準備

データ準備は、成功するコンピュータビジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータの管理を行うための包括的なツールを提供します。



Watch: Get Started with Ultralytics Platform - Data

概要

Ultralytics Platformのデータセクションでは、以下のことができます:

  • アップロード: 画像、動画、およびデータセットファイル(ZIP、.tar.gz/.tgzを含むTAR、NDJSON)
  • アノテーション: 手動描画ツールおよびSAMを活用したスマートラベリング。SAM 2.1または新しいSAM 3から選択できます。
  • 分析: 統計データと可視化を使用してデータを分析します。
  • エクスポート: ローカルトレーニング用にNDJSON形式で出力します。

Ultralytics Platform Data Overview Sidebar Datasets

ワークフロー

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ステージ説明
アップロード画像、動画、またはアーカイブを自動処理でインポートします。
アノテーション全5種類のタスクの手動ツールでデータにラベル付けを行うか、検出、セグメンテーション、OBBに対してSAMアノテーションを使用します。
分析クラス分布、空間ヒートマップ、次元統計を表示します。
エクスポートオフライン利用のためにNDJSON形式でダウンロードします。

サポートされているタスク

Ultralytics Platformは、YOLOの全5種類のタスクタイプをサポートしています:

タスク説明アノテーションツール
Detectバウンディングボックスを用いた物体検出矩形ツール
Segmentピクセルマスクを用いたインスタンスセグメンテーションポリゴンツール
Pose内蔵およびカスタムのスケルトンテンプレートを用いたキーポイント推定キーポイントツール
OBB回転物体用の指向性バウンディングボックス指向性ボックスツール
Classify画像レベルの分類クラスセレクター
タスクタイプの選択

タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセットヘッダーのタスクセレクターで変更できますが、切り替え後に互換性のないアノテーションは表示されません。

主な特徴

スマートストレージ

Ultralytics Platformは、効率的なデータ管理のためにコンテンツアドレス指定可能ストレージ(CAS)を使用しています:

  • 重複排除: 同一の画像はXXH3-128ハッシュを通じて一度だけ保存されます。
  • 整合性: ハッシュベースのアドレス指定によりデータの整合性を保証します。
  • 効率性: 最適化されたストレージと高速な処理を実現します。

データセットURI

ul:// URI形式を使用してデータセットを参照します(「Using Platform Datasets」を参照):

yolo train data=ul://username/datasets/my-dataset

これにより、API keyを設定したあらゆるマシンから、プラットフォーム上のデータセットを使用してトレーニングを行うことができます。

Pythonからプラットフォームデータを使用する
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

データセットのバージョン管理

再現可能なトレーニングのために、データセットの不変なNDJSONスナップショットを作成します。各バージョンは、作成時の画像数、クラス数、およびアノテーション数を記録します。詳細は「Versions Tab」を参照してください。

データセットタブ

データセットの状態と権限に応じて、データセットページには最大6つのタブが表示されます:

タブ説明
画像アノテーションオーバーレイ付きのグリッド、コンパクト、またはテーブルビューで画像を表示します。
クラスクラス名、色、クラスごとのラベル数を表示および編集します。
チャート自動統計:分割分布、クラス数、ヒートマップ
モデルこのデータセットでトレーニングされたモデルと、そのメトリクスおよびステータス
バージョン再現可能なトレーニングのために不変なNDJSONスナップショットを作成およびダウンロードします。
エラー処理に失敗した画像と、エラーの詳細および修正ガイダンス

ClassesおよびChartsはデータセットに画像が含まれている場合に表示されます。Errorsは処理の失敗が存在する場合のみ表示されます。Versionsは所有者、またはバージョンが既に存在する場合は非所有者にも表示されます。

クラスタリング

視覚的に類似した画像が近くに配置されるインタラクティブな2D散布図としてデータセットを探索します。クラスター、重複、外れ値の検出や、データ全体における分割やクラスの分布を検査するのに役立ちます。プロットの領域を投げ縄(Lasso)選択して、ギャラリーをその画像に絞り込むことができます。詳細は「Clustering」を参照してください。

統計と可視化

Chartsタブは、以下のような自動分析を提供します:

  • 分割分布: 訓練/検証/テストの画像数を示すドーナツチャート
  • トップクラス: 最も頻度の高いアノテーションクラスを示すドーナツチャート
  • 画像幅: 画像の幅の分布を示すヒストグラム
  • 画像高さ: 画像の高さの分布を示すヒストグラム
  • インスタンスあたりのポイント数: ポリゴン頂点またはキーポイントのカウント分布(セグメント/ポーズデータセット)
  • アノテーション位置: バウンディングボックスの中心位置を示す2Dヒートマップ
  • 画像次元: アスペクト比ガイドライン付きの幅対高さの2Dヒートマップ

クイックリンク

FAQ

アップロード用にサポートされているファイル形式は?

Ultralytics Platformは以下をサポートしています:

画像: JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)

動画: MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1 FPSでフレーム抽出、最大100フレーム)

データセットファイル: .tar.gzおよび.tgzを含むZIPまたはTARアーカイブ(Freeプランで最大10GB、Proで20GB、Enterpriseで50GB)。画像とオプションのYOLO形式ラベル、およびNDJSONエクスポートを含みます。

データセットの最大サイズは?

ストレージ制限はプランによって異なります:

プランストレージ制限
無料100 GB
Pro500 GB
Enterprise無制限

個別ファイルの制限:画像50MB、動画1GB、データセットはFreeで10GB / Proで20GB / Enterpriseで50GB

ローカルトレーニングにプラットフォームのデータセットを使用できますか?

はい!データセットURI形式を使用してローカルでトレーニングできます:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

または、完全にオフラインでのトレーニング用に、データセットをNDJSON形式でエクスポートしてください。

コメント