Link to this sectionTập dữ liệu Hand Keypoints#
Link to this sectionGiới thiệu#
Tập dữ liệu hand-keypoints chứa 26.768 hình ảnh bàn tay đã được gán nhãn với các điểm đặc trưng (keypoints), giúp nó trở nên phù hợp cho việc huấn luyện các model như Ultralytics YOLO cho các tác vụ ước tính tư thế (pose estimation). Các nhãn được tạo bằng thư viện Google MediaPipe, đảm bảo độ chính xác và tính nhất quán cao, đồng thời tập dữ liệu này tương thích với các định dạng Ultralytics YOLO26.
Watch: Hand Keypoints Estimation with Ultralytics YOLO26 | Human Hand Pose Estimation Tutorial
Link to this sectionCác điểm mốc trên bàn tay#

Link to this sectionKeypoints#
Tập dữ liệu này bao gồm các keypoints dùng cho việc phát hiện bàn tay. Các keypoints được gán nhãn như sau:
- Cổ tay
- Ngón cái (4 điểm)
- Ngón trỏ (4 điểm)
- Ngón giữa (4 điểm)
- Ngón áp út (4 điểm)
- Ngón út (4 điểm)
Mỗi bàn tay có tổng cộng 21 keypoints.
Link to this sectionTính năng chính#
- Tập dữ liệu lớn: 26.768 hình ảnh với các nhãn keypoints bàn tay.
- Tính tương thích với YOLO26: Các nhãn được cung cấp theo định dạng keypoint của YOLO và sẵn sàng để sử dụng với các model YOLO26.
- 21 Keypoints: Biểu diễn tư thế bàn tay chi tiết bao gồm cổ tay và bốn điểm trên mỗi ngón tay.
Link to this sectionCấu trúc tập dữ liệu#
Tập dữ liệu keypoints bàn tay được chia thành hai tập con:
- Train: Tập con này chứa 18.776 hình ảnh từ tập dữ liệu hand keypoints, đã được gán nhãn để huấn luyện các model ước tính tư thế.
- Val: Tập con này chứa 7.992 hình ảnh có thể được sử dụng cho mục đích kiểm thử (validation) trong quá trình huấn luyện model.
Link to this sectionỨng dụng#
Các keypoint bàn tay có thể được sử dụng cho nhận diện cử chỉ, điều khiển AR/VR, thao tác robot và phân tích chuyển động bàn tay trong lĩnh vực chăm sóc sức khỏe. Chúng cũng có thể được áp dụng trong hoạt ảnh cho tính năng motion capture và các hệ thống xác thực sinh trắc học để đảm bảo bảo mật. Việc theo dõi chi tiết vị trí các ngón tay cho phép tương tác chính xác với các đối tượng ảo và giao diện điều khiển không chạm.
Link to this sectionYAML tập dữ liệu#
Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Tệp này chứa thông tin về đường dẫn, các lớp (classes) và các thông tin liên quan khác của tập dữ liệu. Đối với tập dữ liệu Hand Keypoints, tệp hand-keypoints.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Keypoint names per class
kpt_names:
0:
- wrist
- thumb_cmc
- thumb_mcp
- thumb_ip
- thumb_tip
- index_mcp
- index_pip
- index_dip
- index_tip
- middle_mcp
- middle_pip
- middle_dip
- middle_tip
- ring_mcp
- ring_pip
- ring_dip
- ring_tip
- pinky_mcp
- pinky_pip
- pinky_dip
- pinky_tip
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zipLink to this sectionCách sử dụng#
Để huấn luyện một model YOLO26n-pose trên tập dữ liệu Hand Keypoints trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã dưới đây. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện (Training) của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)Link to this sectionHình ảnh mẫu và chú thích#
Tập dữ liệu Hand keypoints chứa một tập hợp đa dạng các hình ảnh bàn tay người đã được gán nhãn với keypoints. Dưới đây là một số ví dụ về các hình ảnh từ tập dữ liệu, cùng với các nhãn tương ứng:

- Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.
Ví dụ này minh họa sự đa dạng và độ phức tạp của các hình ảnh trong tập dữ liệu Hand Keypoints cũng như lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.
Link to this sectionTrích dẫn và Ghi nhận#
Nếu bạn sử dụng tập dữ liệu hand-keypoints trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận các nguồn sau:
Chúng tôi xin cảm ơn các nguồn sau vì đã cung cấp hình ảnh được sử dụng trong tập dữ liệu này:
Các hình ảnh đã được thu thập và sử dụng theo giấy phép tương ứng được cung cấp bởi mỗi nền tảng và được phân phối theo Giấy phép Creative Commons Ghi công-Phi thương mại-Chia sẻ tương tự 4.0 Quốc tế.
Chúng tôi cũng muốn ghi nhận người tạo ra tập dữ liệu này, Rion Dsilva, vì đóng góp tuyệt vời của anh ấy cho nghiên cứu Vision AI.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionLàm thế nào để huấn luyện model YOLO26 trên tập dữ liệu Hand Keypoints?#
Để huấn luyện model YOLO26 trên tập dữ liệu Hand Keypoints, bạn có thể sử dụng Python hoặc giao diện dòng lệnh (CLI). Dưới đây là ví dụ về cách huấn luyện model YOLO26n-pose trong 100 epoch với kích thước ảnh 640:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.
Link to this sectionCác tính năng chính của tập dữ liệu Hand Keypoints là gì?#
Tập dữ liệu Hand Keypoints được thiết kế cho các tác vụ pose estimation nâng cao và bao gồm một số tính năng chính:
- Tập dữ liệu lớn: Chứa 26.768 hình ảnh với các nhãn keypoints bàn tay.
- Tính tương thích với YOLO26: Sẵn sàng để sử dụng với các model YOLO26.
- 21 Keypoints: Biểu diễn tư thế bàn tay chi tiết, bao gồm các khớp cổ tay và ngón tay.
Để biết thêm chi tiết, bạn có thể khám phá phần Tập dữ liệu Hand Keypoints.
Link to this sectionNhững ứng dụng nào có thể hưởng lợi từ việc sử dụng tập dữ liệu Hand Keypoints?#
Tập dữ liệu Hand Keypoints có thể được áp dụng trong nhiều lĩnh vực khác nhau, bao gồm:
- Nhận diện cử chỉ: Cải thiện tương tác giữa người và máy.
- Điều khiển AR/VR: Cải thiện trải nghiệm người dùng trong thực tế tăng cường và thực tế ảo.
- Thao tác robot: Cho phép điều khiển chính xác bàn tay robot.
- Chăm sóc sức khỏe: Phân tích các chuyển động bàn tay để chẩn đoán y khoa.
- Hoạt họa: Ghi lại chuyển động cho các đoạn hoạt họa thực tế.
- Xác thực sinh trắc học: Tăng cường các hệ thống bảo mật.
Để biết thêm thông tin, hãy tham khảo phần Ứng dụng (Applications).
Link to this sectionTập dữ liệu Hand Keypoints được cấu trúc như thế nào?#
Tập dữ liệu Hand Keypoints được chia thành hai tập con:
- Train: Chứa 18.776 hình ảnh để huấn luyện các model ước tính tư thế.
- Val: Chứa 7.992 hình ảnh cho mục đích kiểm thử trong quá trình huấn luyện model.
Cấu trúc này đảm bảo quá trình huấn luyện và kiểm thử toàn diện. Để biết thêm chi tiết, hãy xem phần Cấu trúc tập dữ liệu (Dataset Structure).
Link to this sectionLàm thế nào để sử dụng tệp YAML tập dữ liệu cho việc huấn luyện?#
Cấu hình tập dữ liệu được định nghĩa trong một tệp YAML, bao gồm các đường dẫn, các lớp và các thông tin liên quan khác. Tệp hand-keypoints.yaml có thể được tìm thấy tại hand-keypoints.yaml.
Để sử dụng tệp YAML này cho việc huấn luyện, hãy chỉ định nó trong script huấn luyện hoặc lệnh CLI của bạn như được hiển thị trong ví dụ huấn luyện ở trên. Để biết thêm chi tiết, hãy tham khảo phần Dataset YAML.