Tiger-Poseデータセット

はじめに

Ultralyticsが紹介するTiger-Poseデータセットは、ポーズ推定タスク用に設計された多用途のコレクションです。このデータセットはYouTube動画から取得された263枚の画像で構成されており、そのうち210枚が学習用、53枚が検証用に割り当てられています。ポーズ推定アルゴリズムのテストやトラブルシューティングに最適なリソースです。

210枚という扱いやすい学習セットサイズにもかかわらず、Tiger-Poseデータセットは多様性を備えており、学習パイプラインの評価や潜在的なエラーの特定、さらに大規模なデータセットでポーズ推定を行う前の準備段階としても有効です。

このデータセットは、Ultralytics Platform および YOLO26 での使用を想定しています。

データセットの構造

  • 合計画像数: 263枚(学習用210枚 / 検証用53枚)
  • キーポイント: 各トラ(虎)につき12個(可視性フラグなし)
  • Directory layout: YOLO-format keypoints stored under labels/{train,val} alongside images/{train,val} directories.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

データセットYAML

YAML (Yet Another Markup Language) ファイルは、データセットの構成詳細を指定するために使用されます。これには、ファイルパス、クラス定義、その他の関連情報などの重要なデータが含まれます。特にtiger-pose.yamlファイルについては、Ultralytics Tiger-Poseデータセット構成ファイルをご確認ください。

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

使用方法

Tiger-PoseデータセットでYOLO26n-poseモデルを画像サイズ640で100エポック学習させるには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルの学習ページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

サンプル画像とアノテーション

Tiger-Poseデータセットの画像の例と、それに対応するアノテーションを以下に示します:

Tiger pose estimation dataset mosaic training batch
  • モザイク画像: この画像は、モザイク処理されたデータセット画像で構成される学習バッチを示しています。モザイク処理は、学習中に複数の画像を1枚の画像に結合し、各学習バッチ内の物体やシーンの多様性を高めるために使用される手法です。これは、異なる物体のサイズ、アスペクト比、コンテキストに対してモデルが汎化する能力を向上させるのに役立ちます。

この例では、Tiger-Poseデータセットに含まれる画像の多様性と複雑さ、および学習プロセス中にモザイク処理を使用する利点を紹介しています。

推論の例

推論の例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

引用と謝辞

このデータセットはAGPL-3.0 Licenseの下で公開されています。

FAQ

Ultralytics Tiger-Poseデータセットは何に使用されますか?

Ultralytics Tiger-Poseデータセットはポーズ推定タスク用に設計されており、YouTube動画から取得した263枚の画像で構成されています。データセットは210枚の学習用画像と53枚の検証用画像に分割されています。これはUltralytics PlatformおよびYOLO26を使用してポーズ推定アルゴリズムをテスト、学習、および調整するのに特に役立ちます。

Tiger-PoseデータセットでYOLO26モデルを学習させるにはどうすればよいですか?

Tiger-PoseデータセットでYOLO26n-poseモデルを画像サイズ640で100エポック学習させるには、以下のコードスニペットを使用してください。詳細については、学習ページをご覧ください:

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

tiger-pose.yamlファイルにはどのような構成が含まれていますか?

tiger-pose.yamlファイルは、Tiger-Poseデータセットの構成詳細を指定するために使用されます。これには、ファイルパスやクラス定義などの重要なデータが含まれています。正確な構成を確認するには、Ultralytics Tiger-Poseデータセット構成ファイルをご覧ください。

Tiger-Poseデータセットで学習したYOLO26モデルを使用して推論を実行するにはどうすればよいですか?

Tiger-Poseデータセットで学習したYOLO26モデルを使用して推論を実行するには、以下のコードスニペットを使用できます。詳細なガイドについては、予測ページをご覧ください:

推論の例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

ポーズ推定にTiger-Poseデータセットを使用する利点は何ですか?

Tiger-Poseデータセットは、学習用画像が210枚という扱いやすいサイズでありながら、ポーズ推定パイプラインのテストに最適な多様な画像コレクションを提供します。このデータセットは潜在的なエラーの特定に役立ち、より大きなデータセットを扱う前の準備段階として機能します。さらに、Ultralytics PlatformYOLO26といった高度なツールを使用してポーズ推定アルゴリズムの学習と調整をサポートし、モデルのパフォーマンスと精度を向上させます。

コメント