データ準備
データ準備は、成功するコンピュータビジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータの管理を行うための包括的なツールを提供します。
Watch: Get Started with Ultralytics Platform - Data
概要
Ultralytics Platformのデータセクションでは、以下のことができます:
- アップロード: 画像、動画、およびデータセットファイル(ZIP、
.tar.gz/.tgzを含むTAR、NDJSON) - アノテーション: 手動描画ツールおよびSAMを活用したスマートラベリング。SAM 2.1または新しいSAM 3から選択できます。
- 分析: 統計データと可視化を使用してデータを分析します。
- エクスポート: ローカルトレーニング用にNDJSON形式で出力します。

ワークフロー
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| ステージ | 説明 |
|---|---|
| アップロード | 画像、動画、またはアーカイブを自動処理でインポートします。 |
| アノテーション | 全5種類のタスクの手動ツールでデータにラベル付けを行うか、検出、セグメンテーション、OBBに対してSAMアノテーションを使用します。 |
| 分析 | クラス分布、空間ヒートマップ、次元統計を表示します。 |
| エクスポート | オフライン利用のためにNDJSON形式でダウンロードします。 |
サポートされているタスク
Ultralytics Platformは、YOLOの全5種類のタスクタイプをサポートしています:
| タスク | 説明 | アノテーションツール |
|---|---|---|
| Detect | バウンディングボックスを用いた物体検出 | 矩形ツール |
| Segment | ピクセルマスクを用いたインスタンスセグメンテーション | ポリゴンツール |
| Pose | 内蔵およびカスタムのスケルトンテンプレートを用いたキーポイント推定 | キーポイントツール |
| OBB | 回転物体用の指向性バウンディングボックス | 指向性ボックスツール |
| Classify | 画像レベルの分類 | クラスセレクター |
タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセットヘッダーのタスクセレクターで変更できますが、切り替え後に互換性のないアノテーションは表示されません。
主な特徴
スマートストレージ
Ultralytics Platformは、効率的なデータ管理のためにコンテンツアドレス指定可能ストレージ(CAS)を使用しています:
- 重複排除: 同一の画像はXXH3-128ハッシュを通じて一度だけ保存されます。
- 整合性: ハッシュベースのアドレス指定によりデータの整合性を保証します。
- 効率性: 最適化されたストレージと高速な処理を実現します。
データセットURI
ul:// URI形式を使用してデータセットを参照します(「Using Platform Datasets」を参照):
yolo train data=ul://username/datasets/my-datasetこれにより、API keyを設定したあらゆるマシンから、プラットフォーム上のデータセットを使用してトレーニングを行うことができます。
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)データセットのバージョン管理
再現可能なトレーニングのために、データセットの不変なNDJSONスナップショットを作成します。各バージョンは、作成時の画像数、クラス数、およびアノテーション数を記録します。詳細は「Versions Tab」を参照してください。
データセットタブ
データセットの状態と権限に応じて、データセットページには最大6つのタブが表示されます:
| タブ | 説明 |
|---|---|
| 画像 | アノテーションオーバーレイ付きのグリッド、コンパクト、またはテーブルビューで画像を表示します。 |
| クラス | クラス名、色、クラスごとのラベル数を表示および編集します。 |
| チャート | 自動統計:分割分布、クラス数、ヒートマップ |
| モデル | このデータセットでトレーニングされたモデルと、そのメトリクスおよびステータス |
| バージョン | 再現可能なトレーニングのために不変なNDJSONスナップショットを作成およびダウンロードします。 |
| エラー | 処理に失敗した画像と、エラーの詳細および修正ガイダンス |
ClassesおよびChartsはデータセットに画像が含まれている場合に表示されます。Errorsは処理の失敗が存在する場合のみ表示されます。Versionsは所有者、またはバージョンが既に存在する場合は非所有者にも表示されます。
クラスタリング
視覚的に類似した画像が近くに配置されるインタラクティブな2D散布図としてデータセットを探索します。クラスター、重複、外れ値の検出や、データ全体における分割やクラスの分布を検査するのに役立ちます。プロットの領域を投げ縄(Lasso)選択して、ギャラリーをその画像に絞り込むことができます。詳細は「Clustering」を参照してください。
統計と可視化
Chartsタブは、以下のような自動分析を提供します:
- 分割分布: 訓練/検証/テストの画像数を示すドーナツチャート
- トップクラス: 最も頻度の高いアノテーションクラスを示すドーナツチャート
- 画像幅: 画像の幅の分布を示すヒストグラム
- 画像高さ: 画像の高さの分布を示すヒストグラム
- インスタンスあたりのポイント数: ポリゴン頂点またはキーポイントのカウント分布(セグメント/ポーズデータセット)
- アノテーション位置: バウンディングボックスの中心位置を示す2Dヒートマップ
- 画像次元: アスペクト比ガイドライン付きの幅対高さの2Dヒートマップ
クイックリンク
- データセット: トレーニングデータのアップロード、管理、エクスポート
- アノテーション: 手動およびAI支援ツールを使用したデータへのラベル付け
- クラウドトレーニング: アノテーション済みのデータセットを使用してモデルをトレーニング
- データセットURI:
ul://URIを使用してどこからでもトレーニング
FAQ
アップロード用にサポートされているファイル形式は?
Ultralytics Platformは以下をサポートしています:
画像: JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)
動画: MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1 FPSでフレーム抽出、最大100フレーム)
データセットファイル: .tar.gzおよび.tgzを含むZIPまたはTARアーカイブ(Freeプランで最大10GB、Proで20GB、Enterpriseで50GB)。画像とオプションのYOLO形式ラベル、およびNDJSONエクスポートを含みます。
データセットの最大サイズは?
ストレージ制限はプランによって異なります:
| プラン | ストレージ制限 |
|---|---|
| 無料 | 100 GB |
| Pro | 500 GB |
| Enterprise | 無制限 |
個別ファイルの制限:画像50MB、動画1GB、データセットはFreeで10GB / Proで20GB / Enterpriseで50GB
ローカルトレーニングにプラットフォームのデータセットを使用できますか?
はい!データセットURI形式を使用してローカルでトレーニングできます:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100または、完全にオフラインでのトレーニング用に、データセットをNDJSON形式でエクスポートしてください。