Dataset Tiger-Pose

Giới thiệu

Ultralytics giới thiệu dataset Tiger-Pose, một bộ dữ liệu linh hoạt được thiết kế cho các tác vụ ước tính tư thế. Dataset này bao gồm 263 hình ảnh lấy từ một video YouTube, với 210 hình ảnh được phân bổ cho huấn luyện và 53 cho xác thực. Đây là một tài nguyên tuyệt vời để kiểm thử và khắc phục sự cố cho các thuật toán ước tính tư thế.

Mặc dù có tập huấn luyện vừa phải với 210 hình ảnh, dataset Tiger-Pose vẫn cung cấp sự đa dạng, giúp nó trở nên phù hợp để đánh giá các pipeline huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò như một bước khởi đầu giá trị trước khi làm việc với các dataset lớn hơn cho ước tính tư thế.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Cấu trúc tập dữ liệu

  • Tổng số hình ảnh: 263 (210 train / 53 val).
  • Keypoints: 12 trên mỗi con hổ (không có cờ hiển thị).
  • Cấu trúc thư mục: Các keypoints ở định dạng YOLO được lưu trữ trong labels/{train,val} cùng với các thư mục images/{train,val}.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

Dataset YAML

Tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để chỉ định các chi tiết cấu hình của một dataset. Nó bao gồm các dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và các thông tin liên quan khác. Cụ thể, đối với tệp tiger-pose.yaml, bạn có thể xem Tệp Cấu hình Dataset Tiger-Pose của Ultralytics.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Cách sử dụng

Để huấn luyện model YOLO26n-pose trên dataset Tiger-Pose trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các tham số có sẵn, hãy tham khảo trang Huấn luyện của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Hình ảnh và chú thích mẫu

Dưới đây là một số ví dụ về các hình ảnh từ dataset Tiger-Pose, cùng với các chú thích tương ứng của chúng:

Tiger pose estimation dataset mosaic training batch
  • Mosaiced Image: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép lại (mosaic). Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các vật thể và cảnh quan trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và bối cảnh vật thể khác nhau.

Ví dụ này minh họa sự đa dạng và độ phức tạp của các hình ảnh trong dataset Tiger-Pose cũng như những lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.

Ví dụ suy luận

Ví dụ suy luận
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Trích dẫn và Ghi nhận

Tập dữ liệu đã được phát hành theo AGPL-3.0 License.

Câu hỏi thường gặp (FAQ)

Dataset Ultralytics Tiger-Pose được sử dụng để làm gì?

Dataset Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh lấy từ một video YouTube. Dataset này được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích để kiểm thử, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng cách sử dụng Ultralytics PlatformYOLO26.

Làm cách nào để tôi huấn luyện model YOLO26 trên dataset Tiger-Pose?

Để huấn luyện model YOLO26n-pose trên dataset Tiger-Pose trong 100 epoch với kích thước ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Huấn luyện:

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Tệp tiger-pose.yaml bao gồm những cấu hình nào?

Tệp tiger-pose.yaml được sử dụng để chỉ định các chi tiết cấu hình của dataset Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tệp và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể kiểm tra Tệp Cấu hình Dataset Tiger-Pose của Ultralytics.

Làm cách nào tôi có thể chạy suy luận bằng model YOLO26 đã được huấn luyện trên dataset Tiger-Pose?

Để thực hiện suy luận bằng model YOLO26 đã được huấn luyện trên dataset Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:

Ví dụ suy luận
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Việc sử dụng dataset Tiger-Pose cho ước tính tư thế mang lại những lợi ích gì?

Dataset Tiger-Pose, mặc dù có kích thước vừa phải là 210 hình ảnh cho việc huấn luyện, cung cấp một bộ sưu tập hình ảnh đa dạng lý tưởng để kiểm thử các pipeline ước tính tư thế. Dataset này giúp xác định các lỗi tiềm ẩn và đóng vai trò như một bước chuẩn bị trước khi làm việc với các dataset lớn hơn. Ngoài ra, dataset này hỗ trợ huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng cách sử dụng các công cụ tiên tiến như Ultralytics PlatformYOLO26, giúp nâng cao hiệu suất và độ chính xác của model.

Bình luận