Tiger-Pose 数据集

介绍

Ultralytics 推出了 Tiger-Pose 数据集,这是一个专为姿态估计任务设计的通用数据集。该数据集包含 263 张图片,来源于一段 YouTube 视频,其中 210 张用于训练,53 张用于验证。它是测试和排查姿态估计算法的绝佳资源。

尽管 Tiger-Pose 数据集的训练集仅有 210 张图片,但它具有多样性,非常适合评估训练流程、识别潜在错误,并作为处理更大规模 姿态估计 数据集之前的有效准备步骤。

此数据集旨在与 Ultralytics PlatformYOLO26 配合使用。

数据集结构

  • 图片总数:263 张(210 张训练集 / 53 张验证集)。
  • 关键点:每只老虎 12 个(无可见度标记)。
  • 目录布局:YOLO 格式的关键点存储在 labels/{train,val} 目录下,并与 images/{train,val} 目录并列。


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

数据集 YAML

YAML (Yet Another Markup Language) 文件用于指定数据集的配置详情。它包含了诸如文件路径、类定义及其他相关信息等关键数据。具体来说,对于 tiger-pose.yaml 文件,你可以查看 Ultralytics Tiger-Pose 数据集配置文件

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

使用方法

若要使用图像大小为 640 在 Tiger-Pose 数据集上训练 YOLO26n-pose 模型 100 个 轮次 (epochs),你可以使用以下代码片段。有关可用参数的完整列表,请参考模型 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

样本图像和标注

以下是来自 Tiger-Pose 数据集的一些图片示例,以及它们相应的标注:

Tiger pose estimation dataset mosaic training batch
  • 马赛克图像:此图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练期间使用的技术,它将多张图像合并为单张图像,以增加每个训练批次中目标和场景的多样性。这有助于提高模型对不同目标尺寸、长宽比和上下文的泛化能力。

该示例展示了 Tiger-Pose 数据集中图片的多样性和复杂性,以及在训练过程中使用马赛克增强 (mosaicing) 的好处。

推理示例

推理示例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

引文与致谢

该数据集根据 AGPL-3.0 License 发布。

常见问题 (FAQ)

Ultralytics Tiger-Pose 数据集有什么用途?

Ultralytics Tiger-Pose 数据集专为姿态估计任务而设计,包含 263 张来源于 YouTube 视频 的图片。该数据集分为 210 张训练图片和 53 张验证图片。它特别适用于利用 Ultralytics PlatformYOLO26 来测试、训练和改进姿态估计算法。

如何使用 Tiger-Pose 数据集训练 YOLO26 模型?

若要使用图像大小为 640 在 Tiger-Pose 数据集上训练 YOLO26n-pose 模型 100 个轮次,请使用以下代码片段。有关更多详情,请访问 训练 页面:

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

tiger-pose.yaml 文件包含哪些配置?

tiger-pose.yaml 文件用于指定 Tiger-Pose 数据集的配置详情。它包含了文件路径和类定义等关键数据。要查看具体配置,你可以查看 Ultralytics Tiger-Pose 数据集配置文件

如何使用在 Tiger-Pose 数据集上训练的 YOLO26 模型运行推理?

若要使用在 Tiger-Pose 数据集上训练的 YOLO26 模型执行推理,你可以使用以下代码片段。有关详细指南,请访问 预测 页面:

推理示例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

使用 Tiger-Pose 数据集进行姿态估计有哪些好处?

尽管 Tiger-Pose 数据集只有 210 张训练图片,规模适中,但它提供了一系列多样化的图片,非常适合测试姿态估计流程。该数据集有助于识别潜在错误,并作为处理更大规模数据集之前的预备步骤。此外,该数据集支持利用 Ultralytics PlatformYOLO26 等先进工具进行姿态估计算法的训练和改进,从而提高模型性能和 准确性

评论