Meet YOLO26: next-gen vision AI.

Link to this sectionTập dữ liệu Tiger-Pose#

Link to this sectionGiới thiệu#

Ultralytics giới thiệu tập dữ liệu Tiger-Pose, một bộ sưu tập linh hoạt được thiết kế cho các tác vụ ước tính tư thế (pose estimation). Tập dữ liệu này bao gồm 263 hình ảnh được trích xuất từ một video YouTube, với 210 hình ảnh dành cho huấn luyện và 53 hình ảnh để xác thực. Đây là nguồn tài nguyên tuyệt vời để kiểm tra và khắc phục sự cố cho các thuật toán ước tính tư thế.

Mặc dù có số lượng hình ảnh huấn luyện vừa phải là 210, tập dữ liệu Tiger-Pose vẫn mang lại sự đa dạng, phù hợp để đánh giá các pipeline huấn luyện, xác định các lỗi tiềm ẩn và đóng vai trò như một bước chuẩn bị hữu ích trước khi làm việc với các tập dữ liệu lớn hơn cho ước tính tư thế.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Link to this sectionCấu trúc tập dữ liệu#

  • Tổng số hình ảnh: 263 (210 train / 53 val).
  • Keypoint: 12 điểm mỗi con hổ (không có cờ hiển thị).
  • Cấu trúc thư mục: Các keypoint định dạng YOLO được lưu trữ trong labels/{train,val} cùng với các thư mục images/{train,val}.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

Link to this sectionYAML tập dữ liệu#

Một tệp YAML (Yet Another Markup Language) đóng vai trò là phương tiện để xác định chi tiết cấu hình của tập dữ liệu. Nó bao gồm các dữ liệu quan trọng như đường dẫn tệp, định nghĩa lớp và các thông tin liên quan khác. Cụ thể, đối với tệp tiger-pose.yaml, bạn có thể xem Tệp Cấu hình Tập dữ liệu Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Link to this sectionCách sử dụng#

Để huấn luyện model YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epoch với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện của model.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh mẫu và chú thích#

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu Tiger-Pose, cùng với các chú thích tương ứng:

Tiger pose estimation dataset mosaic training batch
  • Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu Tiger-Pose cũng như những lợi ích của việc sử dụng kỹ thuật Mosaic trong quá trình huấn luyện.

Link to this sectionVí dụ về Inference#

Ví dụ về Inference
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Link to this sectionTrích dẫn và Ghi nhận#

Tập dữ liệu đã được phát hành theo Giấy phép AGPL-3.0.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu Ultralytics Tiger-Pose được sử dụng để làm gì?#

Tập dữ liệu Ultralytics Tiger-Pose được thiết kế cho các tác vụ ước tính tư thế, bao gồm 263 hình ảnh được trích xuất từ một video YouTube. Tập dữ liệu được chia thành 210 hình ảnh huấn luyện và 53 hình ảnh xác thực. Nó đặc biệt hữu ích cho việc kiểm tra, huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng cách sử dụng Ultralytics PlatformYOLO26.

Link to this sectionLàm thế nào để huấn luyện model YOLO26 trên tập dữ liệu Tiger-Pose?#

Để huấn luyện model YOLO26n-pose trên tập dữ liệu Tiger-Pose trong 100 epoch với kích thước hình ảnh là 640, hãy sử dụng các đoạn mã sau. Để biết thêm chi tiết, hãy truy cập trang Huấn luyện:

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Link to this sectionTệp tiger-pose.yaml bao gồm những cấu hình nào?#

Tệp tiger-pose.yaml được sử dụng để xác định chi tiết cấu hình của tập dữ liệu Tiger-Pose. Nó bao gồm các dữ liệu quan trọng như đường dẫn tệp và định nghĩa lớp. Để xem cấu hình chính xác, bạn có thể kiểm tra Tệp Cấu hình Tập dữ liệu Ultralytics Tiger-Pose.

Link to this sectionLàm thế nào để thực hiện inference bằng model YOLO26 đã huấn luyện trên tập dữ liệu Tiger-Pose?#

Để thực hiện inference bằng model YOLO26 đã huấn luyện trên tập dữ liệu Tiger-Pose, bạn có thể sử dụng các đoạn mã sau. Để có hướng dẫn chi tiết, hãy truy cập trang Dự đoán:

Ví dụ về Inference
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Link to this sectionNhững lợi ích của việc sử dụng tập dữ liệu Tiger-Pose cho ước tính tư thế là gì?#

Mặc dù có kích thước vừa phải với 210 hình ảnh huấn luyện, tập dữ liệu Tiger-Pose cung cấp một bộ sưu tập đa dạng các hình ảnh, rất lý tưởng để kiểm tra các pipeline ước tính tư thế. Tập dữ liệu giúp xác định các lỗi tiềm ẩn và đóng vai trò như một bước chuẩn bị trước khi làm việc với các tập dữ liệu lớn hơn. Ngoài ra, tập dữ liệu còn hỗ trợ việc huấn luyện và tinh chỉnh các thuật toán ước tính tư thế bằng các công cụ tiên tiến như Ultralytics PlatformYOLO26, giúp nâng cao hiệu suất và độ chính xác của model.

Người đóng góp

Bình luận