Tiger-Pose 数据集
介绍
Ultralytics 推出了 Tiger-Pose 数据集,这是一个专为姿态估计任务设计的通用数据集。该数据集包含 263 张图片,来源于一段 YouTube 视频,其中 210 张用于训练,53 张用于验证。它是测试和排查姿态估计算法的绝佳资源。
尽管 Tiger-Pose 数据集的训练集仅有 210 张图片,但它具有多样性,非常适合评估训练流程、识别潜在错误,并作为处理更大规模 姿态估计 数据集之前的有效准备步骤。
此数据集旨在与 Ultralytics Platform 和 YOLO26 配合使用。
数据集结构
- 图片总数:263 张(210 张训练集 / 53 张验证集)。
- 关键点:每只老虎 12 个(无可见度标记)。
- 目录布局:YOLO 格式的关键点存储在
labels/{train,val}目录下,并与images/{train,val}目录并列。
Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform
数据集 YAML
YAML (Yet Another Markup Language) 文件用于指定数据集的配置详情。它包含了诸如文件路径、类定义及其他相关信息等关键数据。具体来说,对于 tiger-pose.yaml 文件,你可以查看 Ultralytics Tiger-Pose 数据集配置文件。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Keypoint names per class
kpt_names:
0:
- nose
- head
- withers
- tail_base
- right_hind_hock
- right_hind_paw
- left_hind_paw
- left_hind_hock
- right_front_wrist
- right_front_paw
- left_front_wrist
- left_front_paw
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip使用方法
若要使用图像大小为 640 在 Tiger-Pose 数据集上训练 YOLO26n-pose 模型 100 个 轮次 (epochs),你可以使用以下代码片段。有关可用参数的完整列表,请参考模型 训练 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)样本图像和标注
以下是来自 Tiger-Pose 数据集的一些图片示例,以及它们相应的标注:
- 马赛克图像:此图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练期间使用的技术,它将多张图像合并为单张图像,以增加每个训练批次中目标和场景的多样性。这有助于提高模型对不同目标尺寸、长宽比和上下文的泛化能力。
该示例展示了 Tiger-Pose 数据集中图片的多样性和复杂性,以及在训练过程中使用马赛克增强 (mosaicing) 的好处。
推理示例
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)引文与致谢
该数据集根据 AGPL-3.0 License 发布。
常见问题 (FAQ)
Ultralytics Tiger-Pose 数据集有什么用途?
Ultralytics Tiger-Pose 数据集专为姿态估计任务而设计,包含 263 张来源于 YouTube 视频 的图片。该数据集分为 210 张训练图片和 53 张验证图片。它特别适用于利用 Ultralytics Platform 和 YOLO26 来测试、训练和改进姿态估计算法。
如何使用 Tiger-Pose 数据集训练 YOLO26 模型?
若要使用图像大小为 640 在 Tiger-Pose 数据集上训练 YOLO26n-pose 模型 100 个轮次,请使用以下代码片段。有关更多详情,请访问 训练 页面:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)tiger-pose.yaml 文件包含哪些配置?
tiger-pose.yaml 文件用于指定 Tiger-Pose 数据集的配置详情。它包含了文件路径和类定义等关键数据。要查看具体配置,你可以查看 Ultralytics Tiger-Pose 数据集配置文件。
如何使用在 Tiger-Pose 数据集上训练的 YOLO26 模型运行推理?
若要使用在 Tiger-Pose 数据集上训练的 YOLO26 模型执行推理,你可以使用以下代码片段。有关详细指南,请访问 预测 页面:
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)使用 Tiger-Pose 数据集进行姿态估计有哪些好处?
尽管 Tiger-Pose 数据集只有 210 张训练图片,规模适中,但它提供了一系列多样化的图片,非常适合测试姿态估计流程。该数据集有助于识别潜在错误,并作为处理更大规模数据集之前的预备步骤。此外,该数据集支持利用 Ultralytics Platform 和 YOLO26 等先进工具进行姿态估计算法的训练和改进,从而提高模型性能和 准确性。