コンテンツにスキップ

データ準備

データ準備は、成功するコンピュータービジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータを管理するための包括的なツールを提供します。



見る: Ultralytics の利用開始 - データ

概要

Ultralytics Platformのデータセクションでは、以下のことが可能です。

  • アップロード 画像、動画、およびデータセットファイル(ZIP、TARを含む) .tar.gz/.tgz、NDJSON)
  • アノテーション(手動描画ツールとSAMを活用したスマートラベリング — SAM 2.1または新しいSAM 3から選択)
  • 統計と可視化でデータを分析
  • ローカルトレーニング用にNDJSON形式エクスポート

Ultralytics データ概要 サイドバー データセット

ワークフロー

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ステージ説明
アップロード画像、動画、またはアーカイブを自動処理でインポートする
アノテーション5種類のタスクタイプすべてに対して手動ツールでラベル付けするか、detect、segment、OBBにはSAM を使用する
分析クラス分布、空間ヒートマップ、および次元統計を表示
エクスポートオフラインで使用するためにNDJSON形式でダウンロード

サポートされているタスク

Ultralytics Platformは、5つのYOLOタスクタイプすべてをサポートしています。

タスク説明アノテーションツール
検出バウンディングボックスによる物体detect矩形ツール
セグメントピクセルマスクによるインスタンスsegmentポリゴンツール
ポーズ組み込みおよびカスタムスケルトンテンプレートを使用したキーポイント推定キーポイントツール
OBB回転したオブジェクトの向き付きバウンディングボックス向き付きボックスツール
分類画像レベル分類クラスセレクター

タスクタイプの選択

タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセット設定で変更できますが、互換性のないアノテーションは切り替え後に表示されません。

主な特徴

スマートストレージ

Ultralytics 効率的なデータ管理のためにコンテンツアドレス可能ストレージ(CAS)を採用しています:

  • 重複排除:XXH3-128ハッシュにより、同一画像は一度だけ保存されます。
  • 整合性: ハッシュベースのアドレッシングによりデータの整合性が保証されます
  • 効率性: 最適化されたストレージと高速処理

データセットURI

を使用した参照データセット ul:// URI形式(参照 プラットフォームデータセットの使用):

yolo train data=ul://username/datasets/my-dataset

これにより、APIキーを設定した任意のマシンからプラットフォームのデータセットを用いたトレーニングが可能になります。

Pythonからプラットフォームデータを使用する

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

データセットバージョン管理

再現可能なトレーニングのために、データセットの不変のNDJSONスナップショットを作成します。各バージョンは、作成時の画像数、クラス数、およびアノテーション数をキャプチャします。バージョンタブで詳細を確認してください。

データセットタブ

各データセットページには6つのタブがあります。

タブ説明
画像アノテーションオーバーレイ付きで、グリッド、コンパクト、またはテーブルビューで画像を閲覧
クラスクラス名、色、およびクラスごとのラベル数を表示および編集する
チャート自動統計情報: 分割分布、クラス数、ヒートマップ
モデルモデル(このデータセットでトレーニングされ、メトリクスとステータス付き)
バージョン再現可能なトレーニングのために、不変のNDJSONスナップショットを作成およびダウンロードします。
エラー処理に失敗した画像とエラー詳細、修正ガイダンス

統計と可視化

The Charts タブは自動分析を提供し、以下を含みます:

  • 分割分布: 訓練/検証/テスト画像のカウントのドーナツチャート
  • 主要クラス: 最も頻繁なアノテーションクラスのドーナツチャート
  • 画像の幅: 画像の幅分布のヒストグラム
  • 画像の高さ: 画像の高さ分布のヒストグラム
  • インスタンスあたりの点数: ポリゴン頂点またはキーポイントのカウント分布 (segment/poseデータセット)
  • アノテーション位置: バウンディングボックスの中心位置の2Dヒートマップ
  • 画像の寸法: 幅と高さの2Dヒートマップ(アスペクト比ガイドライン付き)

よくある質問

アップロードでサポートされているファイル形式は何ですか?

Ultralytics Platformがサポートするもの:

画像: JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)

動画形式:MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1FPSでフレーム抽出、最大100フレーム)

データセットファイル: 以下のファイルを含むZIPまたはTARアーカイブ .tar.gz および .tgz (Freeで最大10GB、Proで20GB、Enterpriseで50GB) で、オプションの画像を含む YOLOラベル、さらにNDJSONエクスポート

データセットの最大サイズはどれくらいですか?

ストレージ制限はプランによって異なります:

プランストレージ制限
無料100 GB
Pro500 GB
エンタープライズ無制限

ファイルごとの容量制限:画像 50MB、動画 1GB、データセット 10GB(無料プラン)/20GB(Proプラン)/50GB(Enterpriseプラン)

Platformデータセットをローカルでのトレーニングに使用できますか?

はい!データセットURI形式を使用してローカルでトレーニングできます:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

または、完全にオフラインでトレーニングを行うために、データセットをNDJSON形式でエクスポートします。



📅 2ヶ月前に作成✏️ 4日前に更新
glenn-jocherRizwanMunawaramanharshxsergiuwaxmann

コメント