Bộ dữ liệu tư thế hổ
Giới thiệu
Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các nhiệm vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh có nguồn gốc từ Video YouTube, với 210 hình ảnh được phân bổ để đào tạo và 53 hình ảnh để xác nhận. Nó phục vụ như một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố thuật toán ước tính tư thế.
Mặc dù có kích thước có thể quản lý là 210 hình ảnh, bộ dữ liệu tư thế hổ cung cấp sự đa dạng, làm cho nó phù hợp để đánh giá các đường ống đào tạo, xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ có giá trị trước khi làm việc với các bộ dữ liệu lớn hơn để ước tính tư thế.
Bộ dữ liệu này được thiết kế để sử dụng với Ultralytics HUB và YOLO11 .
Xem: Huấn luyện mô hình tư thế YOLO11 trên tập dữ liệu Tiger-Pose bằng cách sử dụng Ultralytics TRUNG TÂM
Tập dữ liệu YAML
Tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để chỉ định chi tiết cấu hình của tập dữ liệu. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và thông tin thích hợp khác. Cụ thể, đối với tiger-pose.yaml
tập tin, bạn có thể kiểm tra Ultralytics Tệp cấu hình tập dữ liệu Tiger-pose.
ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (75.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip
Sử dụng
Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu Tiger-Pose, cùng với các chú thích tương ứng của chúng:
- Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.
Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose và lợi ích của việc sử dụng khảm trong quá trình huấn luyện.
Ví dụ suy luận
Ví dụ suy luận
Trích dẫn và xác nhận
Tập dữ liệu đã được phát hành có sẵn theo AGPL-3.0 Giấy phép.
FAQ
Cái gì Ultralytics Bộ dữ liệu Tiger-Pose được sử dụng để làm gì?
Các Ultralytics Bộ dữ liệu Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh lấy từ video YouTube . Bộ dữ liệu được chia thành 210 hình ảnh đào tạo và 53 hình ảnh xác thực. Nó đặc biệt hữu ích để thử nghiệm, đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng Ultralytics HUB và YOLO11 .
Làm thế nào để đào tạo mô hình YOLO11 trên tập dữ liệu Tiger-Pose?
Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Đào tạo :
Ví dụ về tàu hỏa
Cấu hình nào tiger-pose.yaml
tập tin bao gồm?
Các tiger-pose.yaml
được sử dụng để chỉ định chi tiết cấu hình của tập dữ liệu Tiger-Pose. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể kiểm tra Ultralytics Tệp cấu hình tập dữ liệu Tiger-pose.
Làm thế nào tôi có thể chạy suy luận bằng cách sử dụng mô hình YOLO11 được đào tạo trên tập dữ liệu Tiger-Pose?
Để thực hiện suy luận bằng mô hình YOLO11 được đào tạo trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để biết hướng dẫn chi tiết, hãy truy cập trang Dự đoán :
Ví dụ suy luận
Lợi ích của việc sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?
Bộ dữ liệu Tiger-Pose, mặc dù có kích thước dễ quản lý là 210 hình ảnh để đào tạo, cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để thử nghiệm các đường ống ước tính tư thế. Bộ dữ liệu giúp xác định các lỗi tiềm ẩn và hoạt động như một bước sơ bộ trước khi làm việc với các bộ dữ liệu lớn hơn. Ngoài ra, bộ dữ liệu hỗ trợ đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ tiên tiến như Ultralytics HUB và YOLO11 , nâng cao hiệu suất và độ chính xác của mô hình.