データ準備
データ準備は、成功するコンピュータービジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータを管理するための包括的なツールを提供します。
見る: Ultralytics の利用開始 - データ
概要
Ultralytics Platformのデータセクションでは、以下のことが可能です。
- アップロード 画像、動画、およびデータセットファイル(ZIP、TARを含む)
.tar.gz/.tgz、NDJSON) - アノテーション(手動描画ツールとSAMを活用したスマートラベリング — SAM 2.1または新しいSAM 3から選択)
- 統計と可視化でデータを分析
- ローカルトレーニング用にNDJSON形式でエクスポート

ワークフロー
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| ステージ | 説明 |
|---|---|
| アップロード | 画像、動画、またはアーカイブを自動処理でインポートする |
| アノテーション | 5種類のタスクタイプすべてに対して手動ツールでラベル付けするか、detect、segment、OBBにはSAM を使用する |
| 分析 | クラス分布、空間ヒートマップ、および次元統計を表示 |
| エクスポート | オフラインで使用するためにNDJSON形式でダウンロード |
サポートされているタスク
Ultralytics Platformは、5つのYOLOタスクタイプすべてをサポートしています。
| タスク | 説明 | アノテーションツール |
|---|---|---|
| 検出 | バウンディングボックスによる物体detect | 矩形ツール |
| セグメント | ピクセルマスクによるインスタンスsegment | ポリゴンツール |
| ポーズ | 組み込みおよびカスタムスケルトンテンプレートを使用したキーポイント推定 | キーポイントツール |
| OBB | 回転したオブジェクトの向き付きバウンディングボックス | 向き付きボックスツール |
| 分類 | 画像レベル分類 | クラスセレクター |
タスクタイプの選択
タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセット設定で変更できますが、互換性のないアノテーションは切り替え後に表示されません。
主な特徴
スマートストレージ
Ultralytics 効率的なデータ管理のためにコンテンツアドレス可能ストレージ(CAS)を採用しています:
- 重複排除:XXH3-128ハッシュにより、同一画像は一度だけ保存されます。
- 整合性: ハッシュベースのアドレッシングによりデータの整合性が保証されます
- 効率性: 最適化されたストレージと高速処理
データセットURI
を使用した参照データセット ul:// URI形式(参照 プラットフォームデータセットの使用):
yolo train data=ul://username/datasets/my-dataset
これにより、APIキーを設定した任意のマシンからプラットフォームのデータセットを用いたトレーニングが可能になります。
Pythonからプラットフォームデータを使用する
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
データセットバージョン管理
再現可能なトレーニングのために、データセットの不変のNDJSONスナップショットを作成します。各バージョンは、作成時の画像数、クラス数、およびアノテーション数をキャプチャします。バージョンタブで詳細を確認してください。
データセットタブ
各データセットページには6つのタブがあります。
| タブ | 説明 |
|---|---|
| 画像 | アノテーションオーバーレイ付きで、グリッド、コンパクト、またはテーブルビューで画像を閲覧 |
| クラス | クラス名、色、およびクラスごとのラベル数を表示および編集する |
| チャート | 自動統計情報: 分割分布、クラス数、ヒートマップ |
| モデル | モデル(このデータセットでトレーニングされ、メトリクスとステータス付き) |
| バージョン | 再現可能なトレーニングのために、不変のNDJSONスナップショットを作成およびダウンロードします。 |
| エラー | 処理に失敗した画像とエラー詳細、修正ガイダンス |
統計と可視化
The Charts タブは自動分析を提供し、以下を含みます:
- 分割分布: 訓練/検証/テスト画像のカウントのドーナツチャート
- 主要クラス: 最も頻繁なアノテーションクラスのドーナツチャート
- 画像の幅: 画像の幅分布のヒストグラム
- 画像の高さ: 画像の高さ分布のヒストグラム
- インスタンスあたりの点数: ポリゴン頂点またはキーポイントのカウント分布 (segment/poseデータセット)
- アノテーション位置: バウンディングボックスの中心位置の2Dヒートマップ
- 画像の寸法: 幅と高さの2Dヒートマップ(アスペクト比ガイドライン付き)
クイックリンク
- データセット: トレーニングデータのアップロード、管理、エクスポート
- アノテーション: 手動およびAI支援ツールによるラベルデータ
- クラウドトレーニング: アノテーション付きデータセットでモデルをトレーニングする
- データセットURI: 以下を使用
ul://どこからでもトレーニングできるURI
よくある質問
アップロードでサポートされているファイル形式は何ですか?
Ultralytics Platformがサポートするもの:
画像: JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)
動画形式:MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1FPSでフレーム抽出、最大100フレーム)
データセットファイル: 以下のファイルを含むZIPまたはTARアーカイブ .tar.gz および .tgz (Freeで最大10GB、Proで20GB、Enterpriseで50GB) で、オプションの画像を含む YOLOラベル、さらにNDJSONエクスポート
データセットの最大サイズはどれくらいですか?
ストレージ制限はプランによって異なります:
| プラン | ストレージ制限 |
|---|---|
| 無料 | 100 GB |
| Pro | 500 GB |
| エンタープライズ | 無制限 |
ファイルごとの容量制限:画像 50MB、動画 1GB、データセット 10GB(無料プラン)/20GB(Proプラン)/50GB(Enterpriseプラン)
Platformデータセットをローカルでのトレーニングに使用できますか?
はい!データセットURI形式を使用してローカルでトレーニングできます:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
または、完全にオフラインでトレーニングを行うために、データセットをNDJSON形式でエクスポートします。