Bộ dữ liệu Tư thế hổ
Giới thiệu
Ultralytics giới thiệu dataset Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các tác vụ ước tính tư thế. Dataset này bao gồm 263 hình ảnh lấy từ một video trên YouTube, với 210 hình ảnh được phân bổ cho huấn luyện và 53 hình ảnh cho xác thực. Nó đóng vai trò là một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố các thuật toán ước tính tư thế.
Mặc dù có phân chia huấn luyện dễ quản lý gồm 210 hình ảnh, tập dữ liệu Tiger-Pose vẫn mang lại sự đa dạng, khiến nó phù hợp để đánh giá các quy trình huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ quan trọng trước khi làm việc với các tập dữ liệu lớn hơn cho ước tính tư thế.
Bộ dữ liệu này được thiết kế để sử dụng với Nền tảng Ultralytics và YOLO26.
Cấu trúc bộ dữ liệu
- Tổng số hình ảnh: 263 (210 huấn luyện / 53 xác thực).
- Điểm chính: 12 điểm trên mỗi con hổ (không có cờ hiển thị).
- Bố cục thư mục: Các keypoint ở định dạng YOLO được lưu trữ trong
labels/{train,val}cùng vớiimages/{train,val}thư mục.
Xem: Huấn luyện Mô hình tư thế YOLO26 trên Tập dữ liệu Tiger-Pose Sử dụng Nền tảng Ultralytics
YAML bộ dữ liệu
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin, định nghĩa lớp và các thông tin liên quan khác. Đặc biệt, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.
ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Keypoint names per class
kpt_names:
0:
- nose
- head
- withers
- tail_base
- right_hind_hock
- right_hind_paw
- left_hind_paw
- left_hind_hock
- right_front_wrist
- right_front_paw
- left_front_wrist
- left_front_paw
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip
Cách sử dụng
Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=tiger-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640
Ảnh và Chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu Tiger-Pose, cùng với các annotation (chú thích) tương ứng của chúng:

- Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.
Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose, cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh (mosaicing) trong quá trình huấn luyện.
Ví dụ về suy luận
Ví dụ về suy luận
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo pose predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Trích dẫn và Lời cảm ơn
Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.
Câu hỏi thường gặp
Bộ dữ liệu Ultralytics Tiger-Pose được sử dụng để làm gì?
Tập dữ liệu Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh được lấy từ một video YouTube. Tập dữ liệu được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế sử dụng Nền tảng Ultralytics và YOLO26.
Làm cách nào để huấn luyện một mô hình YOLO26 trên tập dữ liệu Tiger-Pose?
Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Huấn luyện:
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=tiger-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640
Những cấu hình nào mà tiger-pose.yaml bao gồm tập tin?
Hàm tiger-pose.yaml tập tin được sử dụng để chỉ định chi tiết cấu hình của bộ dữ liệu Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể xem Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.
Làm cách nào để chạy suy luận sử dụng mô hình YOLO26 được huấn luyện trên tập dữ liệu Tiger-Pose?
Để thực hiện suy luận sử dụng mô hình YOLO26 được huấn luyện trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:
Ví dụ về suy luận
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo pose predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Những lợi ích khi sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?
Tập dữ liệu Tiger-Pose, mặc dù có kích thước dễ quản lý với 210 hình ảnh để huấn luyện, cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để kiểm tra các pipeline ước tính tư thế. Tập dữ liệu giúp xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ trước khi làm việc với các tập dữ liệu lớn hơn. Ngoài ra, tập dữ liệu hỗ trợ việc huấn luyện và tinh chỉnh các thuật toán ước tính tư thế sử dụng các công cụ tiên tiến như Nền tảng Ultralytics và YOLO26, nâng cao hiệu suất và độ chính xác của mô hình.