データセットの概要
Ultralytics は、検出、インスタンス分割、ポーズ推定、分類、多オブジェクト追跡などのコンピュータビジョンタスクを容易にするために、様々なデータセットをサポートしています。以下は、Ultralytics の主なデータセットのリストと、各コンピュータビジョンタスクとそれぞれのデータセットの概要です。
見るんだ: Ultralytics データセットの概要
物体検出
バウンディングボックスオブジェクト検出は、各オブジェクトの周りにバウンディングボックスを描画することにより、画像内のオブジェクトを検出し、ローカライズすることを含むコンピュータビジョン技術である。
- Argoverse:豊富なアノテーションを持つ都市環境の3Dトラッキングとモーション予測データを含むデータセット。
- COCO: Common Objects in Context (COCO)は、80のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセットである。
- LVIS: 1203のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセット。
- COCO8: COCO trainとCOCO valの最初の4枚の画像のサブセット。
- COCO128: COCO trainとCOCO valの最初の128枚の画像のうち、テストに適した小さいサブセット。
- グローバル小麦2020Global Wheat Challenge 2020のための小麦の頭部画像を含むデータセット。
- Objects365:365の物体カテゴリと600K以上の注釈付き画像を持つ、物体検出のための高品質で大規模なデータセット。
- OpenImagesV7:Google による包括的なデータセットで、1.7Mの訓練画像と42kの検証画像がある。
- SKU-110K:1万1000枚以上の画像と170万個のバウンディングボックスを含む、小売環境における高密度な物体検出を特徴とするデータセット。
- VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。
- VOC: Pascal Visual Object Classes (VOC)データセット。20のオブジェクトクラスと11K以上の画像を含む、オブジェクト検出とセグメンテーションのためのデータセット。
- xView:60のオブジェクトカテゴリと100万以上の注釈付きオブジェクトを持つ俯瞰画像中のオブジェクト検出用データセット。
- RF100:包括的なモデル評価のための、7つの画像領域にまたがる100のデータセットからなる多様な物体検出ベンチマーク。
- 脳腫瘍:脳腫瘍を検出するためのデータセットには、腫瘍の有無、位置、特徴に関する詳細を含むMRIまたはCTスキャン画像が含まれる。
- African-wildlife:バッファロー、ゾウ、サイ、シマウマなど、アフリカの野生動物の画像を集めたデータセット。
- 署名:様々な文書の画像に署名の注釈を付けたデータセットで、文書の検証や不正検出の研究を支援する。
- 医療用錠剤:医薬品の品質管理、選別、業界標準への準拠などの作業を支援するために設計された、ラベル付けされた医療用丸薬の画像を含むデータセット。
インスタンスのセグメンテーション
インスタンス・セグメンテーションは、画像内のオブジェクトをピクセル・レベルで識別し、位置を特定するコンピュータ・ビジョン技術である。各ピクセルを分類するだけのセマンティックセグメンテーションとは異なり、インスタンスセグメンテーションは、同じクラスの異なるインスタンスを区別する。
- COCO: オブジェクト検出、セグメンテーション、キャプション付けタスク用に設計された大規模なデータセットで、20万枚以上のラベル付き画像がある。
- COCO8-seg: インスタンスのセグメンテーションタスク用の小規模なデータセットで、セグメンテーション注釈付きのCOCO画像8枚のサブセットを含む。
- COCO128-seg: インスタンスのセグメンテーションタスク用の小規模なデータセットで、セグメンテーション注釈付きの128枚のCOCO画像のサブセットを含む。
- Crack-seg:道路や壁のひび割れを検出するために特別に作られたデータセットで、物体検出とセグメンテーションの両方のタスクに適用できる。
- Package-seg: 倉庫や産業環境で荷物を識別するためのデータセットで、物体検出とセグメンテーションの両方のアプリケーションに適しています。
- Carparts-seg: 自動車の部品を識別するために作られたデータセットで、設計、製造、研究のニーズに対応している。オブジェクト検出とセグメンテーションの両方のタスクに対応している。
ポーズ推定
姿勢推定は、カメラまたはワールド座標系に対するオブジェクトの相対的な姿勢を決定するために使用される技術です。これには、物体(特に人間や動物)のキーポイントや関節を特定することが含まれる。
- COCO: ポーズ推定タスクのために設計された、人間のポーズアノテーションを含む大規模データセット。
- COCO8-pose:人間のポーズアノテーションが付いた8枚のCOCO画像のサブセットを含む、ポーズ推定タスク用の小規模データセット。
- Tiger-pose: トラに焦点を当てた263枚の画像からなるコンパクトなデータセットで、ポーズ推定タスクのためにトラ1頭につき12個のキーポイントがアノテーションされている。
- 手のキーポイント:人間の手を中心とした26,000点以上の画像から構成される簡潔なデータセットで、1つの手につき21のキーポイントがアノテーションされており、ポーズ推定タスク用に設計されています。
- Dog-pose: 犬に焦点を当てた約6,000枚の画像からなる包括的なデータセットで、犬1頭につき24のキーポイントがアノテーションされており、ポーズ推定タスク用に調整されている。
分類
画像分類は、画像をその視覚的内容に基づいて1つまたは複数の定義済みのクラスまたはカテゴリに分類することを含むコンピュータビジョンのタスクです。
- Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
- カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
- CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
- CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
- Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
- ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
- ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
- Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
- Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
- MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。
- MNIST160:MNISTデータセットから、各MNISTカテゴリの最初の8画像。データセットには合計160枚の画像が含まれる。
オリエンテッド・バウンディング・ボックス(OBB)
OBB(Oriented Bounding Boxes)は、回転したバウンディングボックスを用いて画像中の角度のある物体を検出するコンピュータビジョンの手法であり、しばしば航空写真や衛星写真に適用される。従来のバウンディングボックスとは異なり、OBBは様々な向きのオブジェクトにフィットすることができる。
- DOTA-v2:170万個のインスタンスと11,268枚の画像を持つ人気のOBB航空画像データセット。
- DOTA8: DOTAv1スプリットセットの最初の8枚の画像(トレーニング用4枚、検証用4枚)のサブセット。
マルチオブジェクト・トラッキング
マルチオブジェクトトラッキングは、ビデオシーケンスにおいて複数のオブジェクトを検出し、追跡するコンピュータビジョン技術である。このタスクは、フレーム間でオブジェクトの一貫したアイデンティティを維持することにより、オブジェクト検出を拡張します。
- Argoverse:多オブジェクト追跡タスクのための豊富なアノテーションを持つ、都市環境からの3D追跡および運動予測データを含むデータセット。
- VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。
新しいデータセットを提供する
新しいデータセットを提供するには、既存のインフラとうまく整合させるためのいくつかのステップが必要である。以下に必要なステップを示す:
見るんだ: Ultralytics データセットに貢献するには
新しいデータセットを投稿する手順
- 画像を集める:データセットに属する画像を集める。これらの画像は、公共のデータベースやあなた自身のコレクションなど、さまざまな情報源から集めることができる。
- 画像に注釈を付ける:タスクに応じて、これらの画像にバウンディングボックス、セグメント、またはキーポイントで注釈を付けます。
- 注釈のエクスポート:これらの注釈をYOLO
*.txt
Ultralytics 。 -
データセットの整理:データセットを正しいフォルダ構造に整理してください。その際
train/
そしてval/
トップレベル・ディレクトリがあり、それぞれの中にimages/
そしてlabels/
サブディレクトリにある。 -
を作成する。
data.yaml
ファイル:データセットのルート・ディレクトリにdata.yaml
ファイルには、データセット、クラス、その他必要な情報が記述されている。 - 画像の最適化(オプション):より効率的な処理のためにデータセットのサイズを小さくしたい場合は、以下のコードを使用して画像を最適化することができます。これは必須ではありませんが、データセットのサイズを小さくし、ダウンロード速度を速くするためにお勧めします。
- データセットをZIP圧縮する:データセットフォルダ全体をzipファイルに圧縮する。
- ドキュメントとPRあなたのデータセットと、それが既存のフレームワークにどのように適合するかを説明するドキュメントページを作成する。その後、Pull Request (PR)を提出する。PRの提出方法の詳細については、Ultralytics Contribution Guidelinesを参照してください。
データセットを最適化して圧縮するコード例
データセットの最適化と圧縮
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
これらのステップに従うことで、Ultralytics' 既存の構造とうまく統合した新しいデータセットを提供することができる。
よくあるご質問
Ultralytics 、どのようなデータセットが物体検出に対応していますか?
Ultralytics 、以下のような物体検出のための様々なデータセットをサポートしています:
- COCO: 80のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセット。
- LVIS: 1203のオブジェクトカテゴリを持つ広範なデータセットで、より細かいオブジェクト検出とセグメンテーションのために設計されている。
- Argoverse:豊富なアノテーションを持つ都市環境の3Dトラッキングとモーション予測データを含むデータセット。
- VisDrone:ドローンで撮影された画像からの物体検出と複数物体の追跡データを含むデータセット。
- SKU-110K:1万1000枚を超える画像で、小売環境における高密度な物体検出を実現。
これらのデータセットは、ロバストなトレーニングを容易にします。 Ultralytics YOLOモデルを学習するのに役立ちます。
新しいデータセットをUltralytics に投稿するには?
新しいデータセットを提供するには、いくつかのステップがある:
- 画像を集める:公共のデータベースや個人のコレクションから画像を集める。
- 画像に注釈を付ける:タスクに応じて、バウンディングボックス、セグメント、またはキーポイントを適用します。
- 注釈のエクスポート:アノテーションをYOLO
*.txt
という形式をとっている。 - データセットの整理:でフォルダ構造を使用する。
train/
そしてval/
ディレクトリがあり、それぞれにimages/
そしてlabels/
サブディレクトリにある。 - を作成する。
data.yaml
ファイル:データセットの説明、クラス、その他の関連情報を含む。 - 画像の最適化(オプション):効率化のためにデータセットサイズを縮小します。
- データセットをZIP圧縮する:データセットをzipファイルに圧縮する。
- 文書とPRあなたのデータセットを説明し、Ultralytics Contribution Guidelinesに従ってPull Requestを提出してください。
包括的なガイドはContribute New Datasetsをご覧ください。
なぜデータセットにUltralytics HUBを使う必要があるのですか?
Ultralytics HUBは、データセット管理と分析のための強力な機能を提供します:
- シームレスなデータセット管理:データセットのアップロード、整理、管理を一箇所で行えます。
- 即時トレーニング統合:アップロードされたデータセットをモデルのトレーニングに直接使用できます。
- 可視化ツール:データセットの画像と注釈を探索し、視覚化します。
- データセット分析:データセットの分布と特徴を把握します。
このプラットフォームは、データセット管理からモデルトレーニングへの移行を合理化し、プロセス全体を効率化します。Ultralytics HUB Datasetsの詳細はこちら。
Ultralytics YOLO コンピュータビジョン用モデルのユニークな特徴は?
Ultralytics YOLO モデルは、コンピュータビジョンタスクにいくつかのユニークな機能を提供します:
- リアルタイム性能:時間に敏感なアプリケーションのための高速推論とトレーニング機能。
- 汎用性:統一されたフレームワークで、検出、セグメンテーション、分類、姿勢推定タスクをサポート。
- 事前学習済みモデル:様々なアプリケーションに対応した高性能な事前学習済みモデルを利用できるため、トレーニング時間を短縮できます。
- 広範なコミュニティ・サポート:活発なコミュニティと、トラブルシューティングや開発のための包括的なドキュメント。
- 簡単な統合:既存のプロジェクトやワークフローと統合するためのシンプルなAPI。
YOLO モデルの詳細については、Ultralytics モデルのページをご覧ください。
Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するにはどうすればよいですか?
Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するには、次のコード例に従ってください:
データセットの最適化と圧縮
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
このプロセスにより、データセットのサイズが縮小され、より効率的な保存と高速なダウンロードが可能になります。データセットの最適化とZip圧縮の方法については、こちらをご覧ください。