コンテンツにスキップ

データ準備

データ準備は、成功するコンピュータービジョンモデルの基盤です。Ultralytics Platformは、アップロードからアノテーション、分析に至るまで、トレーニングデータを管理するための包括的なツールを提供します。

概要

Ultralytics Platformのデータセクションでは、以下のことが可能です。

  • 画像、動画、およびアーカイブ(ZIP、TAR、GZ)をアップロード
  • 手動描画ツールとSAMスマートラベリングによる注釈付け
  • 統計と可視化でデータを分析
  • ローカルトレーニング用にNDJSON形式で エクスポート

Ultralytics データ概要 サイドバー データセット

ワークフロー

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ステージ説明
アップロード画像、動画、またはアーカイブを自動処理でインポートする
アノテーションバウンディングボックス、ポリゴン、キーポイント、または分類でデータにラベル付け
分析クラス分布、空間ヒートマップ、および次元統計を表示
エクスポートオフライン利用のためNDJSON形式でダウンロード

サポートされているタスク

Ultralytics Platformは、5つのYOLOタスクタイプすべてをサポートしています。

タスク説明アノテーションツール
検出バウンディングボックスによる物体detect矩形ツール
セグメントピクセルマスクによるインスタンスsegmentポリゴンツール
ポーズキーポイント推定 (17点 COCO形式)キーポイントツール
OBB回転したオブジェクトの向き付きバウンディングボックス向き付きボックスツール
分類画像レベル分類クラスセレクター

タスクタイプの選択

タスクタイプはデータセット作成時に設定され、利用可能なアノテーションツールを決定します。後からデータセット設定で変更できますが、互換性のないアノテーションは切り替え後に表示されません。

主な特徴

スマートストレージ

Ultralytics 効率的なデータ管理のためにコンテンツアドレス可能ストレージ(CAS)を採用しています:

  • 重複排除: XXH3-128ハッシュにより同一の画像を一度だけ保存
  • 完全性:ハッシュベースのアドレス指定によりデータの完全性が保証される
  • 効率性: 最適化されたストレージと高速処理

データセットURI

を使用した参照データセット ul:// URI形式(参照 プラットフォームデータセットの使用):

yolo train data=ul://username/datasets/my-dataset

これにより、APIキーを設定した任意のマシンからプラットフォームのデータセットを用いたトレーニングが可能になります。

Pythonからプラットフォームデータを使用する

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

データセットタブ

各データセットページには5つのタブがあります:

タブ説明
画像グリッド表示、コンパクト表示、またはテーブル表示で画像を閲覧し、注釈オーバーレイを表示
授業クラス名、色、およびクラスごとのラベル数を表示および編集する
チャート自動統計:分布分割、クラス数、ヒートマップ
モデルこのデータセットで訓練されたモデルの指標とステータス
エラー処理に失敗した画像とエラー詳細、修正ガイダンス

統計と可視化

The Charts タブは自動分析を提供し、以下を含みます:

  • 分割分布:列車/検証/テスト画像数のドーナツチャート
  • 上位クラス:最も頻度の高いアノテーションクラスのドーナツチャート
  • 画像幅:画像幅分布のヒストグラム
  • 画像の高さ分布ヒストグラム
  • インスタンスごとのポイント数:ポリゴン頂点またはキーポイント数の分布(segment)
  • アノテーション位置:バウンディングボックス中心位置の2Dヒートマップ
  • 画像寸法:幅対高さの2Dヒートマップ(アスペクト比ガイドライン付き)

よくある質問

アップロードでサポートされているファイル形式は何ですか?

Ultralytics Platformがサポートするもの:

画像形式:JPEG、PNG、WebP、BMP、TIFF、HEIC、AVIF、JP2、DNG、MPO(各最大50MB)

動画形式:MP4、WebM、MOV、AVI、MKV、M4V(最大1GB、1FPSでフレーム抽出、最大100フレーム)

アーカイブ形式:ZIP, TAR, TAR.GZ, TGZ, GZ (最大10GB)YOLOラベル付き画像を含む

データセットの最大サイズはどれくらいですか?

ストレージ制限はプランによって異なります:

プランストレージ制限
無料100 GB
Pro500 GB
エンタープライズカスタム

個々のファイル制限:画像 50MB、動画 1GB、アーカイブ 10GB

Platformデータセットをローカルでのトレーニングに使用できますか?

はい!データセットURI形式を使用してローカルでトレーニングできます:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

または、完全にオフラインでトレーニングを行うために、データセットをNDJSON形式でエクスポートします。



📅 1ヶ月前に作成 ✏️ 5日前に更新
glenn-jochersergiuwaxmann

コメント