データ準備
データ準備は、成功するコンピュータービジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータを管理するための包括的なツールを提供します。
概要
Ultralytics Platformのデータセクションでは、以下のことが可能です。
- 画像、動画、およびアーカイブ(ZIP、TAR、GZ)をアップロード
- 手動描画ツールとSAMスマートラベリングによる注釈付け
- 統計と可視化でデータを分析
- ローカルトレーニング用にNDJSON形式で エクスポート

ワークフロー
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| ステージ | 説明 |
|---|---|
| アップロード | 画像、動画、またはアーカイブを自動処理でインポートする |
| アノテーション | バウンディングボックス、ポリゴン、キーポイント、または分類でデータにラベル付け |
| 分析 | クラス分布、空間ヒートマップ、および次元統計を表示 |
| エクスポート | オフライン利用のためNDJSON形式でダウンロード |
サポートされているタスク
Ultralytics Platformは、5つのYOLOタスクタイプすべてをサポートしています。
| タスク | 説明 | アノテーションツール |
|---|---|---|
| 検出 | バウンディングボックスによる物体detect | 矩形ツール |
| セグメント | ピクセルマスクによるインスタンスsegment | ポリゴンツール |
| ポーズ | キーポイント推定 (17点 COCO形式) | キーポイントツール |
| OBB | 回転したオブジェクトの向き付きバウンディングボックス | 向き付きボックスツール |
| 分類 | 画像レベル分類 | クラスセレクター |
タスクタイプの選択
タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセット設定で変更できますが、互換性のないアノテーションは切り替え後に表示されません。
主な特徴
スマートストレージ
Ultralytics 効率的なデータ管理のためにコンテンツアドレス可能ストレージ(CAS)を採用しています:
- 重複排除: XXH3-128ハッシュにより同一の画像を一度だけ保存
- 完全性:ハッシュベースのアドレス指定によりデータの完全性が保証される
- 効率性: 最適化されたストレージと高速処理
データセットURI
を使用した参照データセット ul:// URI形式(参照 プラットフォームデータセットの使用):
yolo train data=ul://username/datasets/my-dataset
これにより、APIキーを設定した任意のマシンからプラットフォームのデータセットを用いたトレーニングが可能になります。
Pythonからプラットフォームデータを使用する
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
データセットタブ
各データセットページには5つのタブがあります:
| タブ | 説明 |
|---|---|
| 画像 | グリッド表示、コンパクト表示、またはテーブル表示で画像を閲覧し、注釈オーバーレイを表示 |
| 授業 | クラス名、色、およびクラスごとのラベル数を表示および編集する |
| チャート | 自動統計:分布分割、クラス数、ヒートマップ |
| モデル | このデータセットで訓練されたモデルの指標とステータス |
| エラー | 処理に失敗した画像とエラー詳細、修正ガイダンス |
統計と可視化
The Charts タブは自動分析を提供し、以下を含みます:
- 分割分布:列車/検証/テスト画像数のドーナツチャート
- 上位クラス:最も頻度の高いアノテーションクラスのドーナツチャート
- 画像幅:画像幅分布のヒストグラム
- 画像の高さ分布ヒストグラム
- インスタンスごとのポイント数:ポリゴン頂点またはキーポイント数の分布(segment)
- アノテーション位置:バウンディングボックス中心位置の2Dヒートマップ
- 画像寸法:幅対高さの2Dヒートマップ(アスペクト比ガイドライン付き)
クイックリンク
よくある質問
アップロードでサポートされているファイル形式は何ですか?
Ultralytics Platformがサポートするもの:
画像形式:JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)
動画形式:MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1FPSでフレーム抽出、最大100フレーム)
アーカイブ形式:ZIP, TAR, TAR.GZ, TGZ, GZ (最大10GB)YOLOラベル付き画像を含む
データセットの最大サイズはどれくらいですか?
ストレージ制限はプランによって異なります:
| プラン | ストレージ制限 |
|---|---|
| 無料 | 100 GB |
| Pro | 500 GB |
| エンタープライズ | カスタム |
個々のファイル制限:画像 50MB、動画 1GB、アーカイブ 10GB
Platformデータセットをローカルでのトレーニングに使用できますか?
はい!データセットURI形式を使用してローカルでトレーニングできます:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
または、完全にオフラインでトレーニングを行うために、データセットをNDJSON形式でエクスポートします。