跳至内容

老虎姿势数据集

导言

Ultralytics介绍了 Tiger-Pose 数据集,这是一个专为姿势估计任务设计的多功能数据集。该数据集由来自YouTube 视频的 263 张图片组成,其中 210 张用于训练,53 张用于验证。它是测试姿势估计算法和排除故障的绝佳资源。

尽管虎姿态数据集只有 210 张图像,但它的大小却易于管理,而且具有多样性,因此适合评估训练管道、识别潜在错误,并在使用更大的数据集进行姿态估计之前,作为一个有价值的初步步骤。

该数据集用于Ultralytics HUB 和YOLOv8.



观看: 使用Ultralytics HUB 在老虎姿势数据集上训练YOLOv8 姿势模型

数据集 YAML

YAML(另一种标记语言)文件可用于指定数据集的配置细节。它包含文件路径、类定义和其他相关信息等重要数据。具体来说,对于 tiger-pose.yaml 文件,您可以检查 Ultralytics 老虎姿势数据集配置文件.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

使用方法

要在图像大小为 640 的 Tiger-Pose 数据集上对YOLOv8n-pose 模型进行 100 次训练,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

图片和注释示例

下面是老虎姿势数据集中的一些图像示例及其相应的注释:

数据集样本图像

  • 镶嵌图像:该图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练过程中使用的技术,可将多幅图像合并为单幅图像,以增加每个训练批次中物体和场景的多样性。这有助于提高模型对不同物体尺寸、长宽比和环境的泛化能力。

该示例展示了 Tiger-Pose 数据集中图像的多样性和复杂性,以及在训练过程中使用镶嵌技术的好处。

推理示例

推理示例

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

引文和致谢

该数据集根据AGPL-3.0 许可发布。



创建于 2023-11-12,更新于 2024-02-03
作者:glenn-jocher(5)、RizwanMunawar(1)

评论