Chuyển đến nội dung

Bộ dữ liệu Tư thế hổ

Giới thiệu

Ultralytics giới thiệu dataset Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các tác vụ ước tính tư thế. Dataset này bao gồm 263 hình ảnh lấy từ một video trên YouTube, với 210 hình ảnh được phân bổ cho huấn luyện và 53 hình ảnh cho xác thực. Nó đóng vai trò là một nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố các thuật toán ước tính tư thế.

Mặc dù có phân chia huấn luyện dễ quản lý gồm 210 hình ảnh, tập dữ liệu Tiger-Pose vẫn mang lại sự đa dạng, khiến nó phù hợp để đánh giá các quy trình huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ quan trọng trước khi làm việc với các tập dữ liệu lớn hơn cho ước tính tư thế.

Bộ dữ liệu này được thiết kế để sử dụng với Nền tảng UltralyticsYOLO26.

Cấu trúc bộ dữ liệu

  • Tổng số hình ảnh: 263 (210 huấn luyện / 53 xác thực).
  • Điểm chính: 12 điểm trên mỗi con hổ (không có cờ hiển thị).
  • Bố cục thư mục: Các keypoint ở định dạng YOLO được lưu trữ trong labels/{train,val} cùng với images/{train,val} thư mục.



Xem: Huấn luyện Mô hình tư thế YOLO26 trên Tập dữ liệu Tiger-Pose Sử dụng Nền tảng Ultralytics

YAML bộ dữ liệu

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin, định nghĩa lớp và các thông tin liên quan khác. Đặc biệt, đối với tiger-pose.yaml tập tin, bạn có thể kiểm tra Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Cách sử dụng

Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=tiger-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640

Ảnh và Chú thích mẫu

Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu Tiger-Pose, cùng với các annotation (chú thích) tương ứng của chúng:

Bộ dữ liệu ước tính tư thế hổ dạng ảnh ghép huấn luyện lô

  • Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.

Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Tiger-Pose, cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh (mosaicing) trong quá trình huấn luyện.

Ví dụ về suy luận

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo pose predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Trích dẫn và Lời cảm ơn

Bộ dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.

Câu hỏi thường gặp

Bộ dữ liệu Ultralytics Tiger-Pose được sử dụng để làm gì?

Tập dữ liệu Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh được lấy từ một video YouTube. Tập dữ liệu được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế sử dụng Nền tảng UltralyticsYOLO26.

Làm cách nào để huấn luyện một mô hình YOLO26 trên tập dữ liệu Tiger-Pose?

Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epochs với kích thước ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Huấn luyện:

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=tiger-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640

Những cấu hình nào mà tiger-pose.yaml bao gồm tập tin?

Hàm tiger-pose.yaml tập tin được sử dụng để chỉ định chi tiết cấu hình của bộ dữ liệu Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tập tin và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể xem Tệp cấu hình bộ dữ liệu Ultralytics Tiger-Pose.

Làm cách nào để chạy suy luận sử dụng mô hình YOLO26 được huấn luyện trên tập dữ liệu Tiger-Pose?

Để thực hiện suy luận sử dụng mô hình YOLO26 được huấn luyện trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo pose predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Những lợi ích khi sử dụng bộ dữ liệu Tiger-Pose để ước tính tư thế là gì?

Tập dữ liệu Tiger-Pose, mặc dù có kích thước dễ quản lý với 210 hình ảnh để huấn luyện, cung cấp một bộ sưu tập hình ảnh đa dạng, lý tưởng để kiểm tra các pipeline ước tính tư thế. Tập dữ liệu giúp xác định các lỗi tiềm ẩn và đóng vai trò là bước sơ bộ trước khi làm việc với các tập dữ liệu lớn hơn. Ngoài ra, tập dữ liệu hỗ trợ việc huấn luyện và tinh chỉnh các thuật toán ước tính tư thế sử dụng các công cụ tiên tiến như Nền tảng UltralyticsYOLO26, nâng cao hiệu suất và độ chính xác của mô hình.



📅 Được tạo 2 năm trước ✏️ Cập nhật 7 ngày trước
glenn-jocherUltralyticsAssistantMatthewNoyceRizwanMunawarjk4ehnliu_2@stu.xidian.edu.cn

Bình luận