データセットの概要
Ultralytics provides support for various datasets to facilitate computer vision tasks such as detection, instance segmentation, pose estimation, classification, and multi-object tracking. Below is a list of the main Ultralytics datasets, followed by a summary of each computer vision task and the respective datasets.
見るんだ: Ultralytics データセットの概要
Ultralytics エクスプローラー
Community Note ⚠️
As of ultralytics>=8.3.10
, Ultralytics explorer support has been deprecated. But don't worry! You can now access similar and even enhanced functionality through Ultralytics ハブ, our intuitive no-code platform designed to streamline your workflow. With Ultralytics HUB, you can continue exploring, visualizing, and managing your data effortlessly, all without writing a single line of code. Make sure to check it out and take advantage of its powerful features!🚀
Create embeddings for your dataset, search for similar images, run SQL queries, perform semantic search and even search using natural language! You can get started with our GUI app or build your own using the API. Learn more here.
物体検出
Bounding box object detection is a computer vision technique that involves detecting and localizing objects in an image by drawing a bounding box around each object.
- Argoverse:豊富なアノテーションを持つ都市環境の3Dトラッキングとモーション予測データを含むデータセット。
- COCO: Common Objects in Context (COCO)は、80のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセットである。
- LVIS: 1203のオブジェクトカテゴリを持つ大規模なオブジェクト検出、セグメンテーション、キャプションデータセット。
- COCO8: COCO trainとCOCO valの最初の4枚の画像のサブセット。
- COCO128: A smaller subset of the first 128 images from COCO train and COCO val, suitable for tests.
- グローバル小麦2020Global Wheat Challenge 2020のための小麦の頭部画像を含むデータセット。
- Objects365:365の物体カテゴリと600K以上の注釈付き画像を持つ、物体検出のための高品質で大規模なデータセット。
- OpenImagesV7:Google による包括的なデータセットで、1.7Mの訓練画像と42kの検証画像がある。
- SKU-110K:1万1000枚以上の画像と170万個のバウンディングボックスを含む、小売環境における高密度の物体検出を特徴とするデータセット。
- VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。
- VOC: Pascal Visual Object Classes (VOC)データセット。20のオブジェクトクラスと11K以上の画像を含む、オブジェクト検出とセグメンテーションのためのデータセット。
- xView:60のオブジェクトカテゴリと100万以上の注釈付きオブジェクトを持つ俯瞰画像中のオブジェクト検出用データセット。
- RF100: A diverse object detection benchmark with 100 datasets spanning seven imagery domains for comprehensive model evaluation.
- 脳腫瘍:脳腫瘍を検出するためのデータセットには、腫瘍の有無、位置、特徴に関する詳細を含むMRIまたはCTスキャン画像が含まれる。
- African-wildlife:バッファロー、ゾウ、サイ、シマウマなど、アフリカの野生動物の画像を集めたデータセット。
- 署名:様々な文書の画像に署名の注釈を付けたデータセットで、文書の検証や不正検出の研究を支援する。
インスタンスのセグメンテーション
インスタンスセグメンテーションは、画像内のオブジェクトをピクセルレベルで識別し、位置を特定するコンピュータビジョン技術である。
- COCO: オブジェクト検出、セグメンテーション、キャプション付けタスク用に設計された大規模なデータセットで、20万枚以上のラベル付き画像がある。
- COCO8-seg: インスタンスのセグメンテーションタスク用の小規模なデータセットで、セグメンテーション注釈付きのCOCO画像8枚のサブセットを含む。
- COCO128-seg: A smaller dataset for instance segmentation tasks, containing a subset of 128 COCO images with segmentation annotations.
- Crack-seg:道路や壁のひび割れを検出するために特別に作られたデータセットで、物体検出とセグメンテーションの両方のタスクに適用できる。
- Package-seg: 倉庫や産業環境で荷物を識別するためのデータセットで、物体検出とセグメンテーションの両方のアプリケーションに適しています。
- Carparts-seg: 自動車の部品を識別するために作られたデータセットで、設計、製造、研究のニーズに対応している。オブジェクト検出とセグメンテーションの両方のタスクに対応している。
ポーズ推定
姿勢推定は、カメラまたはワールド座標系に対するオブジェクトの相対的な姿勢を決定するために使用される技術です。
- COCO: ポーズ推定タスクのために設計された、人間のポーズアノテーションを含む大規模データセット。
- COCO8-pose:人間のポーズアノテーションが付いた8枚のCOCO画像のサブセットを含む、ポーズ推定タスク用の小規模データセット。
- Tiger-pose: トラに焦点を当てた263枚の画像からなるコンパクトなデータセットで、ポーズ推定タスクのためにトラ1頭につき12個のキーポイントがアノテーションされている。
- Hand-Keypoints: A concise dataset featuring over 26,000 images centered on human hands, annotated with 21 keypoints per hand, designed for pose estimation tasks.
分類
Image classification is a computer vision task that involves categorizing an image into one or more predefined classes or categories based on its visual content.
- Caltech 101: 画像分類タスクのための101のオブジェクトカテゴリの画像を含むデータセット。
- カルテック256Caltech101の拡張版で、256のオブジェクトカテゴリーと、より難易度の高い画像が用意されている。
- CIFAR-10: 32x32のカラー画像60K枚を10クラスに分類したデータセット。
- CIFAR-100:CIFAR-10の拡張版で、1クラスあたり100のオブジェクトカテゴリと600の画像を持つ。
- Fashion-MNIST:画像分類タスクのための、10のファッションカテゴリの70,000グレースケール画像からなるデータセット。
- ImageNet:1,400万以上の画像と20,000以上のカテゴリを持つ、物体検出と画像分類のための大規模なデータセット。
- ImageNet-10:実験とテストをより迅速に行うための、ImageNetの10カテゴリより小さいサブセット。
- Imagenette:ImageNetの小さなサブセットで、10個の区別しやすいクラスが含まれ、訓練とテストを迅速に行うことができる。
- Imagewoof:画像分類タスクのための10犬種カテゴリを含む、ImageNetのより困難なサブセット。
- MNIST:手書き数字のグレースケール画像70,000枚からなる画像分類用データセット。
- MNIST160: First 8 images of each MNIST category from the MNIST dataset. Dataset contains 160 images total.
オリエンテッド・バウンディング・ボックス(OBB)
OBB(Oriented Bounding Boxes)は、回転したバウンディングボックスを使用して画像内の角度のあるオブジェクトを検出するためのコンピュータビジョンの手法であり、多くの場合、航空画像や衛星画像に適用される。
- DOTA-v2:170万個のインスタンスと11,268枚の画像を持つ人気のOBB航空画像データセット。
- DOTA8: A smaller subset of the first 8 images from the DOTAv1 split set, 4 for training and 4 for validation, suitable for quick tests.
マルチオブジェクト・トラッキング
マルチオブジェクトトラッキングは、ビデオシーケンス内の複数のオブジェクトを検出し、時間をかけて追跡するコンピュータビジョン技術です。
- Argoverse:多オブジェクト追跡タスクのための豊富なアノテーションを持つ、都市環境からの3D追跡および運動予測データを含むデータセット。
- VisDrone:ドローンで撮影された10K以上の画像とビデオシーケンスからのオブジェクト検出とマルチオブジェクトトラッキングデータを含むデータセット。
新しいデータセットを提供する
新しいデータセットを提供するには、既存のインフラとうまく整合させるためのいくつかのステップが必要である。以下に必要なステップを示す:
新しいデータセットを投稿する手順
- 画像を集める:データセットに属する画像を集める。これらの画像は、公共データベースやあなた自身のコレクションなど、さまざまな情報源から集めることができる。
- 画像に注釈を付ける:タスクに応じて、バウンディングボックス、セグメント、またはキーポイントで画像に注釈を付けます。
- 注釈のエクスポート:これらの注釈をYOLO
*.txt
Ultralytics 。 データセットの整理:データセットを正しいフォルダ構造に整理してください。その際
train/
そしてval/
トップレベル・ディレクトリがあり、それぞれの中にimages/
そしてlabels/
サブディレクトリにある。を作成する。
data.yaml
ファイル:データセットのルート・ディレクトリにdata.yaml
ファイルには、データセット、クラス、その他必要な情報が記述されている。- 画像の最適化(オプション):より効率的な処理のためにデータセットのサイズを小さくしたい場合は、以下のコードを使って画像を最適化することができます。これは必須ではありませんが、データセットのサイズを小さくし、ダウンロード速度を速くするためにお勧めします。
- データセットをZIP圧縮する:データセットフォルダ全体をzipファイルに圧縮する。
- ドキュメントとPRあなたのデータセットと、それが既存のフレームワークにどのように適合するかを説明するドキュメントページを作成する。その後、Pull Request (PR)を提出する。PRの提出方法の詳細については、Ultralytics Contribution Guidelinesを参照してください。
データセットを最適化して圧縮するコード例
データセットの最適化と圧縮
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
これらのステップに従うことで、Ultralytics' 既存の構造とうまく統合した新しいデータセットを提供することができる。
よくあるご質問
What datasets does Ultralytics support for object detection?
Ultralytics supports a wide variety of datasets for object detection, including:
- COCO: A large-scale object detection, segmentation, and captioning dataset with 80 object categories.
- LVIS: An extensive dataset with 1203 object categories, designed for more fine-grained object detection and segmentation.
- Argoverse:豊富なアノテーションを持つ都市環境の3Dトラッキングとモーション予測データを含むデータセット。
- VisDrone: A dataset with object detection and multi-object tracking data from drone-captured imagery.
- SKU-110K: Featuring dense object detection in retail environments with over 11K images.
これらのデータセットは、様々な物体検出アプリケーションのためのロバストモデルの学習を容易にする。
新しいデータセットをUltralytics に投稿するには?
Contributing a new dataset involves several steps:
- Collect Images: Gather images from public databases or personal collections.
- Annotate Images: Apply bounding boxes, segments, or keypoints, depending on the task.
- 注釈のエクスポート:アノテーションをYOLO
*.txt
という形式をとっている。 - データセットの整理:でフォルダ構造を使用する。
train/
そしてval/
ディレクトリがあり、それぞれにimages/
そしてlabels/
subdirectories. - を作成する。
data.yaml
ファイル: Include dataset descriptions, classes, and other relevant information. - Optimize Images (Optional): Reduce dataset size for efficiency.
- Zip Dataset: Compress the dataset into a zip file.
- Document and PR: Describe your dataset and submit a Pull Request following Ultralytics Contribution Guidelines.
包括的なガイドはContribute New Datasetsをご覧ください。
自分のデータセットにUltralytics Explorer を使うべき理由は?
Ultralytics Explorer offers powerful features for dataset analysis, including:
- Embeddings Generation: Create vector embeddings for images.
- Semantic Search: Search for similar images using embeddings or AI.
- SQL Queries: Run advanced SQL queries for detailed data analysis.
- Natural Language Search: Search using plain language queries for ease of use.
詳しくはUltralytics エクスプローラーで GUIデモをお試しください。
What are the unique features of Ultralytics YOLO models for computer vision?
Ultralytics YOLO models provide several unique features:
- Real-time Performance: High-speed inference and training.
- Versatility: Suitable for detection, segmentation, classification, and pose estimation tasks.
- Pretrained Models: Access to high-performing, pretrained models for various applications.
- Extensive Community Support: Active community and comprehensive documentation for troubleshooting and development.
YOLO 。 Ultralytics YOLOページをご覧ください。
Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するにはどうすればよいですか?
Ultralytics ツールを使ってデータセットを最適化し、zip圧縮するには、次のコード例に従ってください:
データセットの最適化と圧縮
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
データセットの最適化とZip圧縮の方法については、こちらをご覧ください。