Bỏ để qua phần nội dung

Bộ dữ liệu tư thế hổ

Giới thiệu

Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các nhiệm vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh có nguồn gốc từ Video YouTube, với 210 hình ảnh được phân bổ để đào tạo và 53 hình ảnh để xác nhận. Nó phục vụ như một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố thuật toán ước tính tư thế.

Mặc dù có kích thước có thể quản lý là 210 hình ảnh, bộ dữ liệu tư thế hổ cung cấp sự đa dạng, làm cho nó phù hợp để đánh giá các đường ống đào tạo, xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ có giá trị trước khi làm việc với các bộ dữ liệu lớn hơn để ước tính tư thế.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics HUBYOLOv8.



Xem: Xe lửa YOLOv8 Mô hình tư thế trên tập dữ liệu Tiger-Pose bằng cách sử dụng Ultralytics Trung tâm

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để chỉ định chi tiết cấu hình của tập dữ liệu. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và thông tin thích hợp khác. Cụ thể, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Ultralytics Tệp cấu hình tập dữ liệu Tiger-pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Sử dụng

Để đào tạo một YOLOv8nMô hình -pose trên tập dữ liệu Tiger-Pose cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n-pose.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu Tiger-Pose, cùng với các chú thích tương ứng của chúng:

Hình ảnh mẫu tập dữ liệu

  • Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose và lợi ích của việc sử dụng khảm trong quá trình huấn luyện.

Ví dụ suy luận

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Trích dẫn và xác nhận

Tập dữ liệu đã được phát hành có sẵn theo AGPL-3.0 Giấy phép.

FAQ

Cái gì Ultralytics Bộ dữ liệu Tiger-Pose được sử dụng để làm gì?

Các Ultralytics Bộ dữ liệu Tiger-Pose được thiết kế cho các nhiệm vụ ước tính tư thế, bao gồm 263 hình ảnh có nguồn gốc từ video YouTube. Bộ dữ liệu được chia thành 210 hình ảnh đào tạo và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng cách sử dụng Ultralytics HUBYOLOv8.

Làm cách nào để đào tạo một YOLOv8 mô hình trên bộ dữ liệu Tiger-Pose?

Để đào tạo một YOLOv8nMô hình -pose trên tập dữ liệu Tiger-Pose cho 100 kỷ nguyên với kích thước hình ảnh là 640, sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Đào tạo :

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Cấu hình nào tiger-pose.yaml tập tin bao gồm?

Các tiger-pose.yaml được sử dụng để chỉ định chi tiết cấu hình của tập dữ liệu Tiger-Pose. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể kiểm tra Ultralytics Tệp cấu hình tập dữ liệu Tiger-pose.

Làm thế nào tôi có thể chạy suy luận bằng cách sử dụng YOLOv8 mô hình được đào tạo trên bộ dữ liệu Tiger-Pose?

Để thực hiện suy luận bằng cách sử dụng YOLOv8 mô hình được đào tạo trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán :

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Lợi ích của việc sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?

Bộ dữ liệu Tiger-Pose, mặc dù có kích thước 210 hình ảnh có thể quản lý được để đào tạo, cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để kiểm tra các đường ống ước tính tư thế. Tập dữ liệu giúp xác định các lỗi tiềm ẩn và hoạt động như một bước sơ bộ trước khi làm việc với các bộ dữ liệu lớn hơn. Ngoài ra, bộ dữ liệu hỗ trợ đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ nâng cao như Ultralytics HUBYOLOv8, nâng cao hiệu suất và độ chính xác của mô hình.



Đã tạo 2023-11-12, Cập nhật 2024-07-17
Tác giả: hnliu_2@stu.xidian.edu.cn (1), glenn-jocher (9), RizwanMunawar (1)

Ý kiến