Link to this sectionDog-Poseデータセット#

Link to this sectionはじめに#

Ultralytics Dog-Poseデータセットは、犬のキーポイント推定のために特別に作成された高品質かつ広範なデータセットであり、6,773枚のトレーニング用画像と1,703枚のバリデーション用画像を提供します。

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

各アノテーション済み画像には、キーポイントごとに3次元（x、y、視認性）を持つ24個のキーポイントが含まれており、コンピュータビジョンの高度な研究開発にとって貴重なリソースとなります。

特定の品種やその他の動物については、Ultralytics Platformを使用して、インフラストラクチャを管理することなく、独自のデータでカスタムキーポイントモデルのアップロード、ラベリング、トレーニングを行うことができます。

Link to this sectionデータセットの構造#

合計画像数: 8,476枚（トレーニング用 6,773枚 / バリデーション用 1,703枚）、YOLO形式のラベルファイル付き。
キーポイント: 各犬につき24個、(x, y, visibility) の3つ組で構成されています。
ダウンロードサイズ: 約337 MB。

レイアウト:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionデータセット YAML#

データセットの設定を定義するためにYAMLファイルが使用されます。これにはパス、キーポイントの詳細、およびその他の関連情報が含まれます。Dog-Poseデータセットの場合、dog-pose.yamlファイルが https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml に用意されています。

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this section使用方法#

Dog-PoseデータセットでYOLO26n-poseモデルを100 epochs、画像サイズ640でトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルのTrainingページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionサンプル画像とアノテーション#

Dog-Poseデータセットの画像と、それに対応するアノテーションの例をいくつか紹介します。

Dog pose estimation dataset mosaic training batch

モザイク画像: この画像は、モザイク処理されたデータセット画像で構成されるトレーニングバッチを示しています。モザイク処理は、トレーニング中に複数の画像を1つの画像に結合し、各トレーニングバッチ内のオブジェクトやシーンの多様性を高める技術です。これにより、さまざまなオブジェクトのサイズ、アスペクト比、およびコンテキストに対してモデルが汎化する能力を向上させます。

この例では、Dog-Poseデータセットに含まれる画像の多様性と複雑さ、およびトレーニングプロセス中にモザイク処理を使用する利点を示しています。

Link to this section引用と謝辞#

研究や開発作業でDog-Poseデータセットを使用する場合は、次の論文を引用してください。

引用

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

computer visionコミュニティのためにこの貴重なリソースを作成・維持しているスタンフォード大学のチームに感謝いたします。Dog-Poseデータセットとその作成者の詳細については、Stanford Dogs Dataset websiteをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionDog-Poseデータセットとは何ですか？また、Ultralytics YOLO26でどのように使用されますか？#

Dog-Poseデータセットは、犬の姿勢推定のための24個のキーポイントが付与された6,773枚のトレーニング用画像と1,703枚のバリデーション用画像を備えています。これはUltralytics YOLO26を用いたモデルのトレーニングと検証用に設計されており、動物の行動分析、ペットの監視、獣医学的研究などのアプリケーションをサポートします。データセットの包括的なアノテーションにより、犬の正確な姿勢推定モデルを開発するのに最適です。

Link to this sectionUltralyticsでDog-Poseデータセットを使用してYOLO26モデルをトレーニングするにはどうすればよいですか？#

yolo26n-pose.ptをロードし、model.train(data="dog-pose.yaml", epochs=100, imgsz=640)を呼び出します。完全なPythonおよびCLIスニペットについては上記のTrain Exampleを、引数の詳細なリストについてはモデルのTrainingページを参照してください。

Link to this sectionDog-Poseデータセットを使用する利点は何ですか？#

合計8,476枚の画像（トレーニング用 6,773枚 / バリデーション用 1,703枚）で幅広い犬種と姿勢をカバーし、アノテーションごとに3次元（x、y、可視性）の24個のキーポイントを持つDog-Poseデータセットは、pet monitoringや行動分析といったアプリケーションに必要な実世界のシナリオをカバーします。その機能と使用方法の詳細については、Dataset Introductionセクションを参照してください。

Link to this sectionDog-Poseデータセットを使用したYOLO26のトレーニングプロセスにおいて、モザイク処理はどのような利点をもたらしますか？#

モザイク処理は、複数のDog-Pose画像を1つのトレーニング画像に結合することで、ステップごとにモデルが認識する犬の姿勢、サイズ、背景の多様性を高めます。これにより、新しいコンテキストやスケールへの汎化性能が向上し、過学習を低減できます。画像例については、Sample Images and Annotationsセクションを参照してください。

Link to this sectionDog-PoseデータセットのYAMLファイルはどこにありますか？また、どのように使用すればよいですか？#

Dog-PoseデータセットのYAMLファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml にあります。このファイルは、パス、クラス、キーポイントの詳細、その他の関連情報を含むデータセット構成を定義しています。YAMLはキーポイントごとに3次元を持つ24個のキーポイントを指定しており、詳細な姿勢推定タスクに適しています。

このファイルをYOLO26のトレーニングスクリプトで使用するには、使用方法セクションに示されているように、トレーニングコマンドで参照するだけです。データセットは初回使用時に自動的にダウンロードされるため、セットアップは簡単です。

キーポイントモデルの詳細については、ポーズ推定タスクのドキュメントを参照してください。

貢献者

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

作成日 2024年11月16日更新日 3 日前