Bộ dữ liệu COCO8-Pose
Giới thiệu
Ultralytics COCO8-Pose là một bộ dữ liệu phát hiện tư thế nhỏ nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của bộ COCO train 2017, 4 cho huấn luyện và 4 cho xác thực. Bộ dữ liệu này lý tưởng để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng, hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các quy trình huấn luyện để tìm lỗi và hoạt động như một kiểm tra tỉnh táo trước khi huấn luyện các bộ dữ liệu lớn hơn.
Bộ dữ liệu này được thiết kế để sử dụng với Ultralytics HUB và YOLO11.
YAML bộ dữ liệu
Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của bộ dữ liệu. Trong trường hợp bộ dữ liệu COCO8-Pose, coco8-pose.yaml
tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.
ultralytics/cfg/datasets/coco8-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose/
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-pose ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]
# Classes
names:
0: person
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-pose.zip
Cách sử dụng
Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu COCO8-Pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Training (Huấn luyện) của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Ảnh và Chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu COCO8-Pose, cùng với các annotation (chú thích) tương ứng của chúng:
- Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.
Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu COCO8-Pose và những lợi ích của việc sử dụng mosaicing trong quá trình huấn luyện.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng tập dữ liệu COCO trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Chúng tôi xin ghi nhận công lao của COCO Consortium vì đã tạo và duy trì nguồn tài nguyên giá trị này cho cộng đồng thị giác máy tính. Để biết thêm thông tin về bộ dữ liệu COCO và những người tạo ra nó, hãy truy cập trang web bộ dữ liệu COCO.
Câu hỏi thường gặp
Bộ dữ liệu COCO8-Pose là gì và nó được sử dụng như thế nào với Ultralytics YOLO11?
Tập dữ liệu COCO8-Pose là một tập dữ liệu phát hiện dáng người nhỏ, đa năng, bao gồm 8 hình ảnh đầu tiên từ tập COCO train 2017, với 4 hình ảnh để huấn luyện và 4 hình ảnh để xác thực. Nó được thiết kế để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng và thử nghiệm các phương pháp phát hiện mới. Tập dữ liệu này lý tưởng cho các thử nghiệm nhanh với Ultralytics YOLO11. Để biết thêm chi tiết về cấu hình tập dữ liệu, hãy xem tệp YAML của tập dữ liệu.
Làm cách nào để huấn luyện mô hình YOLO11 bằng bộ dữ liệu COCO8-Pose trong Ultralytics?
Để huấn luyện mô hình YOLO11n-pose trên tập dữ liệu COCO8-Pose trong 100 epochs với kích thước ảnh là 640, hãy làm theo các ví dụ sau:
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Để có danh sách đầy đủ các đối số huấn luyện, hãy tham khảo trang Huấn luyện của mô hình.
Những lợi ích khi sử dụng bộ dữ liệu COCO8-Pose là gì?
Tập dữ liệu COCO8-Pose mang lại một số lợi ích:
- Kích thước Nhỏ gọn: Chỉ với 8 hình ảnh, rất dễ quản lý và hoàn hảo cho các thử nghiệm nhanh.
- Dữ liệu Đa dạng: Mặc dù có kích thước nhỏ, nhưng nó bao gồm nhiều cảnh khác nhau, hữu ích cho việc kiểm tra pipeline kỹ lưỡng.
- Gỡ lỗi lỗi: Lý tưởng để xác định lỗi huấn luyện và thực hiện kiểm tra tính hợp lệ trước khi mở rộng quy mô sang các tập dữ liệu lớn hơn.
Để biết thêm về các tính năng và cách sử dụng, hãy xem phần Giới Thiệu về Bộ Dữ Liệu.
Phương pháp khảm (mosaicing) mang lại lợi ích gì cho quá trình huấn luyện YOLO11 khi sử dụng bộ dữ liệu COCO8-Pose?
Mosaic, được minh họa trong các sample_images của bộ dữ liệu COCO8-Pose, kết hợp nhiều hình ảnh thành một, làm tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Kỹ thuật này giúp cải thiện khả năng tổng quát hóa của mô hình trên các kích thước, tỷ lệ khung hình và bối cảnh khác nhau của đối tượng, cuối cùng là nâng cao hiệu suất của mô hình. Xem phần Sample Images và Chú thích để biết sample_images.
Tôi có thể tìm thấy tệp YAML của bộ dữ liệu COCO8-Pose ở đâu và tôi sử dụng nó như thế nào?
Bạn có thể tìm thấy tệp YAML của tập dữ liệu COCO8-Pose tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml. Tệp này xác định cấu hình tập dữ liệu, bao gồm đường dẫn, các lớp và thông tin liên quan khác. Sử dụng tệp này với các script huấn luyện YOLO11 như được đề cập trong phần Ví dụ huấn luyện.
Để xem thêm các câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Tài liệu Ultralytics.