Meet YOLO26: next-gen vision AI.

Link to this sectionDog-Poseデータセット#

Link to this sectionはじめに#

Ultralytics Dog-Poseデータセットは、犬のキーポイント推定のために特別にキュレーションされた、高品質で広範なデータセットです。6,773枚の学習画像と1,703枚のテスト画像を備えており、堅牢な姿勢推定モデルをトレーニングするための強力な基盤を提供します。



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

各アノテーション済み画像には、キーポイントごとに3次元(x、y、視認性)を持つ24個のキーポイントが含まれており、コンピュータビジョンの高度な研究開発にとって貴重なリソースとなります。

Ultralytics Dog-pose display image

このデータセットは、Ultralytics PlatformおよびYOLO26での使用を想定しています。

Link to this sectionデータセットの構造#

  • 分割: 6,773枚の学習画像 / 1,703枚の検証画像(YOLO形式のラベルファイル付き)。

  • Keypoints: 24 per dog with (x, y, visibility) triplets.

  • レイアウト:

    datasets/dog-pose/
    ├── images/{train,val}
    └── labels/{train,val}

Link to this sectionデータセット YAML#

YAML(Yet Another Markup Language)ファイルを使用してデータセット設定を定義します。これにはパス、キーポイントの詳細、その他関連情報が含まれます。Dog-poseデータセットの場合、dog-pose.yamlhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yamlから入手できます。

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this section使用方法#

Dog-poseデータセットでYOLO26n-poseモデルを100 エポック(画像サイズ640)トレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルのトレーニングページを参照してください。

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionサンプル画像とアノテーション#

以下は、Dog-poseデータセットからの画像とそれに対応するアノテーションの例です:

Dog pose estimation dataset mosaic training batch
  • モザイク画像: この画像は、モザイク処理されたデータセット画像で構成されるトレーニングバッチを示しています。モザイク処理は、トレーニング中に複数の画像を1つの画像に結合し、各トレーニングバッチ内のオブジェクトやシーンの多様性を高める技術です。これにより、さまざまなオブジェクトのサイズ、アスペクト比、およびコンテキストに対してモデルが汎化する能力を向上させます。

この例では、Dog-poseデータセットに含まれる画像の多様性と複雑さ、およびトレーニングプロセス中にモザイク処理を使用する利点を紹介しています。

Link to this section引用と謝辞#

研究や開発作業でDog-poseデータセットを使用する場合は、以下の論文を引用してください:

引用
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

コンピュータビジョンコミュニティのためにこの貴重なリソースを作成・維持してくださったスタンフォード大学のチームに感謝いたします。Dog-poseデータセットとその作成者の詳細については、Stanford Dogs Datasetのウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionDog-poseデータセットとは何か、そしてそれをUltralytics YOLO26でどのように使用しますか?#

Dog-Poseデータセットは、犬の姿勢推定のために24個のキーポイントがアノテーションされた6,773枚の学習画像と1,703枚のテスト画像で構成されています。Ultralytics YOLO26を用いたモデルのトレーニングと検証用に設計されており、動物の行動分析、ペットの監視、獣医学的研究などのアプリケーションをサポートします。このデータセットの包括的なアノテーションは、犬の正確な姿勢推定モデルを開発するために理想的です。

Link to this sectionUltralyticsでDog-poseデータセットを使用してYOLO26モデルをトレーニングするにはどうすればよいですか?#

Dog-poseデータセットでYOLO26n-poseモデルを100エポック(画像サイズ640)でトレーニングするには、以下の例に従ってください:

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

トレーニング引数の詳細リストについては、モデルのトレーニングページを参照してください。

Link to this sectionDog-poseデータセットを使用する利点は何ですか?#

Dog-poseデータセットにはいくつかの利点があります:

大規模で多様なデータセット: 8,400枚以上の画像を収録しており、幅広い犬の姿勢、品種、背景を網羅する大量のデータを提供することで、堅牢なモデルのトレーニングと評価を可能にします。

詳細なキーポイントアノテーション: 各画像には、キーポイントごとに3次元(x、y、視認性)を持つ24個のキーポイントが含まれており、正確な姿勢検出モデルをトレーニングするための精密なアノテーションを提供します。

現実世界のシナリオ: 様々な環境からの画像が含まれており、ペット監視や行動分析といった現実世界のアプリケーションに対して、モデルの汎化能力を向上させます。

転移学習の利点: このデータセットは転移学習技術と相性が良く、人間の姿勢データセットで事前学習されたモデルを、犬特有の特徴に適応させることができます。

機能と使用方法の詳細については、データセットの紹介セクションを参照してください。

Link to this sectionDog-poseデータセットを使用する際、モザイク処理はYOLO26のトレーニングプロセスにどのように役立ちますか?#

Dog-poseデータセットのサンプル画像に示されているように、モザイク処理は複数の画像を1つの合成画像に統合し、各トレーニングバッチにおけるオブジェクトとシーンの多様性を豊かにします。この技術にはいくつかの利点があります:

  • 各バッチにおける犬の姿勢、サイズ、背景の多様性が向上する
  • 異なるコンテキストやスケールで犬を検出するモデルの能力が向上する
  • より多様な視覚パターンをモデルに学習させることで汎化能力が強化される
  • トレーニング例の斬新な組み合わせを作成することで過学習を軽減する

このアプローチにより、現実世界のシナリオでより優れた性能を発揮する堅牢なモデルが構築されます。サンプル画像については、サンプル画像とアノテーションセクションを参照してください。

Link to this sectionDog-poseデータセットのYAMLファイルはどこにありますか?また、どのように使用しますか?#

Dog-poseデータセットのYAMLファイルは、https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yamlにあります。このファイルは、パス、クラス、キーポイントの詳細、その他関連情報を含むデータセット設定を定義します。YAMLはキーポイントごとに3次元(x、y、視認性)を持つ24個のキーポイントを指定しており、詳細な姿勢推定タスクに適しています。

このファイルをYOLO26のトレーニングスクリプトで使用するには、使用方法セクションに示されているように、トレーニングコマンドで参照するだけです。データセットは初回使用時に自動的にダウンロードされるため、セットアップは簡単です。

その他のFAQや詳細なドキュメントについては、Ultralyticsドキュメントをご覧ください。

コメント