Tập dữ liệu COCO8-Pose
Giới thiệu
Ultralytics COCO8-Pose là một dataset pose detection nhỏ nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của tập COCO train 2017, 4 cho huấn luyện và 4 cho xác thực. Dataset này lý tưởng để kiểm tra và gỡ lỗi các mô hình object detection hoặc để thử nghiệm các phương pháp detection mới. Với 8 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các pipeline huấn luyện để tìm lỗi và hoạt động như một bước kiểm tra tính hợp lệ trước khi huấn luyện các dataset lớn hơn.
Cấu trúc bộ dữ liệu
- Tổng số ảnh: 8 (4 huấn luyện / 4 xác thực).
- Lớp: 1 (người) với 17 điểm khóa trên mỗi chú thích.
- Bố cục thư mục được khuyến nghị:
datasets/coco8-pose/images/{train,val}vàdatasets/coco8-pose/labels/{train,val}với các điểm khóa định dạng YOLO được lưu trữ dưới dạng.txttệp.
Bộ dữ liệu này được thiết kế để sử dụng với Nền tảng Ultralytics và YOLO26.
YAML bộ dữ liệu
Tệp yaml (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của tập dữ liệu. Đối với tập dữ liệu COCO8-Pose, coco8-pose.yaml tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.
Ultralytics/cfg/datasets/COCO8-Pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose/
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-pose ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]
# Classes
names:
0: person
# Keypoint names per class
kpt_names:
0:
- nose
- left_eye
- right_eye
- left_ear
- right_ear
- left_shoulder
- right_shoulder
- left_elbow
- right_elbow
- left_wrist
- right_wrist
- left_hip
- right_hip
- left_knee
- right_knee
- left_ankle
- right_ankle
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-pose.zip
Cách sử dụng
Để huấn luyện mô hình YOLO26n-pose trên tập dữ liệu COCO8-Pose trong 100 epoch với kích thước ảnh 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, vui lòng tham khảo trang Huấn luyện mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640
Ảnh và Chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu COCO8-Pose, cùng với các chú thích tương ứng của chúng:

- Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.
Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu COCO8-Pose cũng như lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng tập dữ liệu COCO trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Chúng tôi xin ghi nhận Liên minh COCO vì đã tạo và duy trì tài nguyên quý giá này cho cộng đồng thị giác máy tính. Để biết thêm thông tin về tập dữ liệu COCO và những người tạo ra nó, hãy truy cập trang web tập dữ liệu COCO.
Câu hỏi thường gặp
Bộ dữ liệu COCO8-Pose là gì và nó được sử dụng với Ultralytics YOLO26 như thế nào?
Tập dữ liệu COCO8-Pose là một tập dữ liệu phát hiện tư thế nhỏ gọn, đa năng, bao gồm 8 hình ảnh đầu tiên từ bộ COCO train 2017, với 4 hình ảnh để huấn luyện và 4 hình ảnh để xác thực. Nó được thiết kế để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng cũng như thử nghiệm các phương pháp phát hiện mới. Tập dữ liệu này lý tưởng cho các thử nghiệm nhanh với Ultralytics YOLO26. Để biết thêm chi tiết về cấu hình tập dữ liệu, hãy xem tệp YAML của tập dữ liệu.
Làm thế nào để tôi huấn luyện mô hình YOLO26 bằng bộ dữ liệu COCO8-Pose trong Ultralytics?
Để huấn luyện mô hình YOLO26n-pose trên tập dữ liệu COCO8-Pose trong 100 epoch với kích thước ảnh 640, hãy làm theo các ví dụ sau:
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=coco8-pose.yaml model=yolo26n-pose.pt epochs=100 imgsz=640
Để có danh sách đầy đủ các đối số huấn luyện, hãy tham khảo trang Huấn luyện của mô hình.
Những lợi ích khi sử dụng tập dữ liệu COCO8-Pose là gì?
Tập dữ liệu COCO8-Pose mang lại một số lợi ích:
- Kích thước Nhỏ gọn: Chỉ với 8 hình ảnh, rất dễ quản lý và hoàn hảo cho các thử nghiệm nhanh.
- Dữ liệu Đa dạng: Mặc dù có kích thước nhỏ, nhưng nó bao gồm nhiều cảnh khác nhau, hữu ích cho việc kiểm tra pipeline kỹ lưỡng.
- Gỡ lỗi lỗi: Lý tưởng để xác định lỗi huấn luyện và thực hiện kiểm tra tính hợp lệ trước khi mở rộng quy mô sang các tập dữ liệu lớn hơn.
Để biết thêm về các tính năng và cách sử dụng, hãy xem phần Giới Thiệu về Bộ Dữ Liệu.
Kỹ thuật mosaicing mang lại lợi ích gì cho quá trình huấn luyện YOLO26 khi sử dụng bộ dữ liệu COCO8-Pose?
Kỹ thuật mosaicing, được minh họa trong các hình ảnh mẫu của tập dữ liệu COCO8-Pose, kết hợp nhiều hình ảnh thành một, làm tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Kỹ thuật này giúp cải thiện khả năng tổng quát hóa của mô hình trên nhiều kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau, từ đó nâng cao hiệu suất mô hình. Xem phần Hình ảnh mẫu và Chú thích để biết các hình ảnh ví dụ.
Tôi có thể tìm tệp yaml của tập dữ liệu COCO8-Pose ở đâu và cách sử dụng nó như thế nào?
Tệp YAML của tập dữ liệu COCO8-Pose có thể được tìm thấy tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml. Tệp này định nghĩa cấu hình tập dữ liệu, bao gồm đường dẫn, lớp và các thông tin liên quan khác. Sử dụng tệp này với các script huấn luyện YOLO26 như đã đề cập trong phần Ví dụ Huấn luyện.
Để xem thêm các câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Tài liệu Ultralytics.