コンテンツへスキップ

データセットの概要

Ultralytics は、検出、インスタンス分割、ポーズ推定、分類、多オブジェクト追跡などのコンピュータビジョンタスクを容易にするために、様々なデータセットをサポートしています。以下は、Ultralytics の主なデータセットのリストと、各コンピュータビジョンタスクとそれぞれのデータセットの概要です。



見るんだ: Ultralytics データセットの概要

NEW 🚀Ultralytics エクスプローラー

データセットの埋め込み画像の作成、類似画像の検索、SQLクエリの実行、セマンティック検索の実行、自然言語による検索も可能です!GUIアプリで始めることも、APIを使って独自に構築することもできます。詳しくはこちらをご覧ください。

Ultralytics エクスプローラー スクリーンショット

物体検出

バウンディングボックスオブジェクト検出は、各オブジェクトの周りにバウンディングボックスを描画することにより、画像内のオブジェクトを検出し、ローカライズすることを含むコンピュータビジョン技術である。

  • Argoverse:豊富なアノテーションを持つ都市環境の3Dトラッキングとモーション予測データを含むデータセット。
  • COCO: Common Objects in Context (COCO)は、80のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセットである。
  • LVIS: 1203のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセット。
  • COCO8: COCO trainとCOCO valの最初の4枚の画像のサブセット。
  • グローバル小麦2020Global Wheat Challenge 2020のための小麦の頭部画像を含むデータセット。
  • Objects365:365の物体カテゴリと600K以上の注釈付き画像を持つ、物体検出のための高品質で大規模なデータセット。
  • OpenImagesV7:Google による包括的なデータセットで、1.7Mの訓練画像と42kの検証画像がある。
  • SKU-110K:1万1000枚以上の画像と170万個のバウンディングボックスを含む、小売環境における高密度の物体検出を特徴とするデータセット。
  • VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。
  • VOC: Pascal Visual Object Classes (VOC)データセット。20のオブジェクトクラスと11K以上の画像を含む、オブジェクト検出とセグメンテーションのためのデータセット。
  • xView:60のオブジェクトカテゴリと100万以上の注釈付きオブジェクトを持つ俯瞰画像中のオブジェクト検出用データセット。
  • Roboflow 100:7つの画像領域にまたがる100のデータセットからなる多様な物体検出ベンチマークで、モデルの包括的な評価を行う。
  • 脳腫瘍:脳腫瘍を検出するためのデータセットには、腫瘍の有無、位置、特徴に関する詳細を含むMRIまたはCTスキャン画像が含まれる。
  • African-wildlife:バッファロー、ゾウ、サイ、シマウマなど、アフリカの野生動物の画像を集めたデータセット。
  • 署名:様々な文書の画像に署名の注釈を付けたデータセットで、文書の検証や不正検出の研究を支援する。

インスタンスのセグメンテーション

インスタンスセグメンテーションは、画像内のオブジェクトをピクセルレベルで識別し、位置を特定するコンピュータビジョン技術である。

  • COCO: オブジェクト検出、セグメンテーション、キャプション付けタスク用に設計された大規模なデータセットで、20万枚以上のラベル付き画像がある。
  • COCO8-seg: インスタンスのセグメンテーションタスク用の小規模なデータセットで、セグメンテーション注釈付きのCOCO画像8枚のサブセットを含む。
  • Crack-seg:道路や壁のひび割れを検出するために特別に作られたデータセットで、物体検出とセグメンテーションの両方のタスクに適用できる。
  • Package-seg: 倉庫や産業環境で荷物を識別するためのデータセットで、物体検出とセグメンテーションの両方のアプリケーションに適しています。
  • Carparts-seg: 自動車の部品を識別するために作られたデータセットで、設計、製造、研究のニーズに対応している。オブジェクト検出とセグメンテーションの両方のタスクに対応している。

ポーズ推定

姿勢推定は、カメラまたはワールド座標系に対するオブジェクトの相対的な姿勢を決定するために使用される技術です。

  • COCO: ポーズ推定タスクのために設計された、人間のポーズアノテーションを含む大規模データセット。
  • COCO8-pose:人間のポーズアノテーションが付いた8枚のCOCO画像のサブセットを含む、ポーズ推定タスク用の小規模データセット。
  • Tiger-pose: トラに焦点を当てた263枚の画像からなるコンパクトなデータセットで、ポーズ推定タスクのためにトラ1頭につき12個のキーポイントがアノテーションされている。

分類

画像分類は、画像をその視覚的内容に基づいて1つまたは複数の定義済みのクラスまたはカテゴリに分類することを含むコンピュータビジョンのタスクです。

  • Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
  • カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
  • CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
  • CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
  • Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
  • ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
  • ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
  • Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
  • Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
  • MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。

オリエンテッド・バウンディング・ボックス(OBB)

OBB(Oriented Bounding Boxes)は、回転したバウンディングボックスを使用して画像内の角度のあるオブジェクトを検出するためのコンピュータビジョンの手法であり、多くの場合、航空画像や衛星画像に適用される。

  • DOTA-v2:170万個のインスタンスと11,268枚の画像を持つ人気のOBB航空画像データセット。

マルチオブジェクト・トラッキング

マルチオブジェクトトラッキングは、ビデオシーケンス内の複数のオブジェクトを検出し、時間をかけて追跡するコンピュータビジョン技術です。

  • Argoverse:多オブジェクト追跡タスクのための豊富なアノテーションを持つ、都市環境からの3D追跡および運動予測データを含むデータセット。
  • VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。

新しいデータセットを提供する

新しいデータセットを提供するには、既存のインフラとうまく整合させるためのいくつかのステップが必要である。以下に必要なステップを示す:

新しいデータセットを投稿する手順

  1. 画像を集める:データセットに属する画像を集める。これらの画像は、公共データベースやあなた自身のコレクションなど、さまざまな情報源から集めることができる。
  2. 画像に注釈を付ける:タスクに応じて、バウンディングボックス、セグメント、またはキーポイントで画像に注釈を付けます。
  3. 注釈のエクスポート:これらの注釈をYOLO *.txt Ultralytics 。
  4. データセットの整理:データセットを正しいフォルダ構造に整理してください。その際 train/ そして val/ トップレベル・ディレクトリがあり、それぞれの中に images/ そして labels/ サブディレクトリにある。

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. を作成する。 data.yaml ファイル:データセットのルート・ディレクトリに data.yaml ファイルには、データセット、クラス、その他必要な情報が記述されている。

  6. 画像の最適化(オプション):より効率的な処理のためにデータセットのサイズを小さくしたい場合は、以下のコードを使って画像を最適化することができます。これは必須ではありませんが、データセットのサイズを小さくし、ダウンロード速度を速くするためにお勧めします。
  7. データセットをZIP圧縮する:データセットフォルダ全体をzipファイルに圧縮する。
  8. ドキュメントとPRあなたのデータセットと、それが既存のフレームワークにどのように適合するかを説明するドキュメントページを作成する。その後、Pull Request (PR)を提出する。PRの提出方法の詳細については、Ultralytics Contribution Guidelinesを参照してください。

データセットを最適化して圧縮するコード例

データセットの最適化と圧縮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

これらのステップに従うことで、Ultralytics' 既存の構造とうまく統合した新しいデータセットを提供することができる。

よくあるご質問

Ultralytics 、どのようなデータセットが物体検出に対応していますか?

Ultralytics は、以下のような物体検出のための多様なデータセットをサポートしている: -COCO: 80のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプション付けのデータセット。 -LVIS: 1203のオブジェクトカテゴリを持つ広範なデータセットで、より細かいオブジェクト検出とセグメンテーションのために設計されている。 - Argoverse:豊富なアノテーションを持つ都市環境からの3Dトラッキングとモーション予測データを含むデータセット。 -VisDrone:ドローンで撮影された画像からの物体検出とマルチオブジェクトトラッキングデータセット。 -SKU-110K:1万1000枚を超える画像から、小売店環境における高密度な物体検出が可能。

これらのデータセットは、様々な物体検出アプリケーションのためのロバストモデルの学習を容易にする。

新しいデータセットをUltralytics に投稿するには?

新しいデータセットを提供するには、いくつかのステップがある: 1. 画像を集める:公的データベースや個人のコレクションから画像を収集する。 2. 画像に注釈を付ける:タスクに応じて、バウンディングボックス、セグメント、またはキーポイントを適用します。 3. 注釈のエクスポート:アノテーションをYOLO *.txt フォーマット。 4. データセットの整理:でフォルダ構造を使用する。 train/ そして val/ ディレクトリがあり、それぞれに images/ そして labels/ サブディレクトリにある。 5. を作成する。 data.yaml ファイル:データセットの説明,クラス,その他の関連情報を含む. 6. 画像の最適化(オプション):効率化のためにデータセットのサイズを小さくする。 7. Zipデータセット:データセットをzipファイルに圧縮する。 8. ドキュメントとPR:データセットを説明し、以下の Pull Request を提出する。 Ultralytics 寄付ガイドライン.

包括的なガイドはContribute New Datasetsをご覧ください。

自分のデータセットにUltralytics Explorer を使うべき理由は?

Ultralytics Explorerは、データセット解析のために以下のような強力な機能を提供します: - 埋め込み画像の生成:画像のベクトル埋め込みを作成します。 - セマンティック検索:埋め込み画像やAIを使って類似画像を検索します。 - SQLクエリ:詳細なデータ分析のための高度なSQLクエリを実行します。 - 自然言語検索:使いやすさを追求した自然言語による検索。

詳しくはUltralytics エクスプローラーで GUIデモをお試しください。

Ultralytics YOLO コンピュータビジョン用モデルのユニークな特徴は?

Ultralytics YOLO モデルにはいくつかのユニークな特徴があります: - リアルタイム性能:高速推論とトレーニング。 - 汎用性:検出、セグメンテーション、分類、および姿勢推定タスクに適しています。 - 事前学習済みモデル:様々なアプリケーションのための高性能な事前学習済みモデルへのアクセス。 - 広範なコミュニティサポート:活発なコミュニティと、トラブルシューティングや開発のための包括的なドキュメント。

YOLO 。 Ultralytics YOLOページをご覧ください。

Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するにはどうすればよいですか?

Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するには、次のコード例に従ってください:

データセットの最適化と圧縮

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

データセットの最適化とZip圧縮の方法については、こちらをご覧ください。



作成日:2023-11-12 更新日:2024-07-04
作成者:glenn-jocher(10),RizwanMunawar(2),Burhan-Q(1),Laughing-q(1),abirami-vina(1),AyushExel(2)

コメント