Bỏ để qua phần nội dung

Bộ dữ liệu tư thế hổ

Giới thiệu

Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các nhiệm vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh có nguồn gốc từ Video YouTube, với 210 hình ảnh được phân bổ để đào tạo và 53 hình ảnh để xác nhận. Nó phục vụ như một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố thuật toán ước tính tư thế.

Mặc dù có kích thước có thể quản lý là 210 hình ảnh, bộ dữ liệu tư thế hổ cung cấp sự đa dạng, làm cho nó phù hợp để đánh giá các đường ống đào tạo, xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ có giá trị trước khi làm việc với các bộ dữ liệu lớn hơn để ước tính tư thế.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics HUBYOLOv8.



Xem: Xe lửa YOLOv8 Mô hình tư thế trên tập dữ liệu Tiger-Pose bằng cách sử dụng Ultralytics Trung tâm

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để chỉ định chi tiết cấu hình của tập dữ liệu. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và thông tin thích hợp khác. Cụ thể, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Ultralytics Tệp cấu hình tập dữ liệu Tiger-pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Sử dụng

Để đào tạo một YOLOv8nMô hình -pose trên tập dữ liệu Tiger-Pose cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu Tiger-Pose, cùng với các chú thích tương ứng của chúng:

Hình ảnh mẫu tập dữ liệu

  • Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose và lợi ích của việc sử dụng khảm trong quá trình huấn luyện.

Ví dụ suy luận

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Trích dẫn và xác nhận

Tập dữ liệu đã được phát hành có sẵn theo AGPL-3.0 Giấy phép.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (8), RizwanMunawar (1)

Ý kiến