Bỏ qua nội dung

Bộ dữ liệu tư thế con hổ

Giới thiệu

Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập đa năng được thiết kế cho các tác vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh có nguồn gốc từ một Video YouTube , với 210 hình ảnh được phân bổ để đào tạo và 53 hình ảnh để xác thực. Nó đóng vai trò là một nguồn tài nguyên tuyệt vời để thử nghiệm và khắc phục sự cố thuật toán ước tính tư thế.

Mặc dù có kích thước dễ quản lý là 210 hình ảnh, tập dữ liệu tiger-pose vẫn mang tính đa dạng, phù hợp để đánh giá quy trình đào tạo, xác định lỗi tiềm ẩn và đóng vai trò là bước sơ bộ có giá trị trước khi làm việc với các tập dữ liệu lớn hơn để ước tính tư thế.

Bộ dữ liệu này được thiết kế để sử dụng với Ultralytics HUBYOLO11 .



Đồng hồ: Xe lửa YOLO11 Mô hình tư thế trên tập dữ liệu Tiger-Pose sử dụng Ultralytics TRUNG TÂM

Bộ dữ liệu YAML

Tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để chỉ định chi tiết cấu hình của một tập dữ liệu. Tệp này bao gồm dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và các thông tin liên quan khác. Cụ thể, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Ultralytics Tệp cấu hình bộ dữ liệu Tiger-Pose.

ultralytics /cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Cách sử dụng

Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu Tiger-Pose, cùng với chú thích tương ứng:

Hình ảnh mẫu của bộ dữ liệu

  • Mosaiced Image : Hình ảnh này minh họa một lô đào tạo bao gồm các hình ảnh tập dữ liệu mosaic. Mosaicing là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng tính đa dạng của các đối tượng và cảnh trong mỗi lô đào tạo. Điều này giúp cải thiện khả năng khái quát hóa của mô hình đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu Tiger-Pose cũng như lợi ích của việc sử dụng khảm trong quá trình đào tạo.

Ví dụ suy luận

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Trích dẫn và Lời cảm ơn

Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0 .

CÂU HỎI THƯỜNG GẶP

Cái gì là Ultralytics Bộ dữ liệu Tiger-Pose được sử dụng để làm gì?

Các Ultralytics Bộ dữ liệu Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh lấy từ video YouTube . Bộ dữ liệu được chia thành 210 hình ảnh đào tạo và 53 hình ảnh xác thực. Nó đặc biệt hữu ích để thử nghiệm, đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng Ultralytics HUBYOLO11 .

Làm thế nào để tôi đào tạo một YOLO11 mô hình trên tập dữ liệu Tiger-Pose?

Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Đào tạo :

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Cấu hình nào làm tiger-pose.yaml tập tin bao gồm?

Các tiger-pose.yaml tệp được sử dụng để chỉ định chi tiết cấu hình của tập dữ liệu Tiger-Pose. Nó bao gồm dữ liệu quan trọng như đường dẫn tệp và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể kiểm tra Ultralytics Tệp cấu hình bộ dữ liệu Tiger-Pose.

Làm thế nào tôi có thể chạy suy luận bằng cách sử dụng một YOLO11 mô hình được đào tạo trên tập dữ liệu Tiger-Pose?

Để thực hiện suy luận bằng cách sử dụng YOLO11 mô hình được đào tạo trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để biết hướng dẫn chi tiết, hãy truy cập trang Dự đoán :

Ví dụ suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Lợi ích của việc sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?

Bộ dữ liệu Tiger-Pose, mặc dù có kích thước dễ quản lý là 210 hình ảnh để đào tạo, cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để thử nghiệm các đường ống ước tính tư thế. Bộ dữ liệu giúp xác định các lỗi tiềm ẩn và hoạt động như một bước sơ bộ trước khi làm việc với các bộ dữ liệu lớn hơn. Ngoài ra, bộ dữ liệu hỗ trợ đào tạo và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ tiên tiến như Ultralytics HUBYOLO11 , nâng cao hiệu suất và độ chính xác của mô hình.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận