Chuyển đến nội dung

Bộ dữ liệu Tư thế hổ

Giới thiệu

Ultralytics giới thiệu bộ dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các tác vụ ước tính tư thế. Bộ dữ liệu này bao gồm 263 hình ảnh lấy từ một Video YouTube, với 210 hình ảnh được phân bổ cho huấn luyện và 53 hình ảnh cho xác thực. Nó đóng vai trò là một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố các thuật toán ước tính tư thế.

Mặc dù có kích thước có thể quản lý được là 210 hình ảnh, nhưng bộ dữ liệu Tiger-Pose mang lại sự đa dạng, khiến nó phù hợp để đánh giá các quy trình huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò là một bước sơ bộ có giá trị trước khi làm việc với các bộ dữ liệu lớn hơn để ước tính tư thế.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics HUBYOLO11.



Xem: Huấn luyện mô hình YOLO11 Pose trên bộ dữ liệu Tiger-Pose bằng Ultralytics HUB

YAML bộ dữ liệu

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin, định nghĩa lớp và các thông tin liên quan khác. Đặc biệt, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Cách sử dụng

Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Training (Huấn luyện) của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Ảnh và Chú thích mẫu

Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu Tiger-Pose, cùng với các annotation (chú thích) tương ứng của chúng:

Ảnh mẫu bộ dữ liệu

  • Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.

Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose, cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh (mosaicing) trong quá trình huấn luyện.

Ví dụ về suy luận

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Trích dẫn và Lời cảm ơn

Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.

Câu hỏi thường gặp

Bộ dữ liệu Ultralytics Tiger-Pose được sử dụng để làm gì?

Bộ dữ liệu Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh lấy từ một video YouTube. Bộ dữ liệu được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng Ultralytics HUBYOLO11.

Làm cách nào để huấn luyện mô hình YOLO11 trên bộ dữ liệu Tiger-Pose?

Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Training (Huấn luyện):

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Những cấu hình nào mà tiger-pose.yaml bao gồm tập tin?

Hàm tiger-pose.yaml tập tin được sử dụng để chỉ định chi tiết cấu hình của bộ dữ liệu Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể xem Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.

Làm thế nào để chạy suy luận bằng mô hình YOLO11 được huấn luyện trên bộ dữ liệu Tiger-Pose?

Để thực hiện suy luận bằng mô hình YOLO11 được huấn luyện trên bộ dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Những lợi ích khi sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?

Bộ dữ liệu Tiger-Pose, mặc dù có kích thước có thể quản lý được là 210 hình ảnh để huấn luyện, nhưng cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để kiểm tra các quy trình ước tính tư thế. Bộ dữ liệu giúp xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ trước khi làm việc với các bộ dữ liệu lớn hơn. Ngoài ra, bộ dữ liệu hỗ trợ việc huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ nâng cao như Ultralytics HUBYOLO11, nâng cao hiệu suất và độ chính xác.



📅 Đã tạo 1 năm trước ✏️ Cập nhật 5 tháng trước

Bình luận