Bộ dữ liệu Tư thế hổ
Giới thiệu
Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các tác vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh lấy từ một Video YouTube, với 210 hình ảnh được phân bổ cho huấn luyện và 53 hình ảnh cho xác thực. Nó đóng vai trò là một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố các thuật toán ước tính tư thế.
Mặc dù có kích thước có thể quản lý được là 210 hình ảnh, nhưng bộ dữ liệu Tiger-Pose mang lại sự đa dạng, khiến nó phù hợp để đánh giá các quy trình huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò là một bước sơ bộ có giá trị trước khi làm việc với các bộ dữ liệu lớn hơn để ước tính tư thế.
Tập dữ liệu này được thiết kế để sử dụng với Ultralytics HUB và YOLO11.
Xem: Huấn luyện mô hình YOLO11 Pose trên bộ dữ liệu Tiger-Pose bằng Ultralytics HUB
YAML bộ dữ liệu
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin, định nghĩa lớp và các thông tin liên quan khác. Đặc biệt, đối với tiger-pose.yaml
tập tin, bạn có thể kiểm tra Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.
ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip
Cách sử dụng
Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Training (Huấn luyện) của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Ảnh và Chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu Tiger-Pose, cùng với các annotation (chú thích) tương ứng của chúng:
- Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.
Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose, cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh (mosaicing) trong quá trình huấn luyện.
Ví dụ về suy luận
Ví dụ về suy luận
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Trích dẫn và Lời cảm ơn
Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.
Câu hỏi thường gặp
Bộ dữ liệu Ultralytics Tiger-Pose được sử dụng để làm gì?
Bộ dữ liệu Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh lấy từ một video YouTube. Bộ dữ liệu được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng Ultralytics HUB và YOLO11.
Làm cách nào để huấn luyện mô hình YOLO11 trên bộ dữ liệu Tiger-Pose?
Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Training (Huấn luyện):
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Những cấu hình nào mà tiger-pose.yaml
bao gồm tập tin?
Hàm tiger-pose.yaml
tập tin được sử dụng để chỉ định chi tiết cấu hình của bộ dữ liệu Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể xem Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.
Làm thế nào để chạy suy luận bằng mô hình YOLO11 được huấn luyện trên bộ dữ liệu Tiger-Pose?
Để thực hiện suy luận bằng mô hình YOLO11 được huấn luyện trên bộ dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:
Ví dụ về suy luận
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Những lợi ích khi sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?
Bộ dữ liệu Tiger-Pose, mặc dù có kích thước có thể quản lý được là 210 hình ảnh để huấn luyện, nhưng cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để kiểm tra các quy trình ước tính tư thế. Bộ dữ liệu giúp xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ trước khi làm việc với các bộ dữ liệu lớn hơn. Ngoài ra, bộ dữ liệu hỗ trợ việc huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ nâng cao như Ultralytics HUB và YOLO11, nâng cao hiệu suất và độ chính xác.