Meet YOLO26: next-gen vision AI.

Link to this sectionTập dữ liệu COCO8-Pose#

Link to this sectionGiới thiệu#

Ultralytics COCO8-Pose là một tập dữ liệu phát hiện tư thế nhỏ gọn nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của bộ dữ liệu COCO train 2017, với 4 ảnh dùng để huấn luyện và 4 ảnh dùng để kiểm chứng. Tập dữ liệu này rất lý tưởng để thử nghiệm và gỡ lỗi các mô hình object detection, hoặc để thực nghiệm với các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ dàng quản lý nhưng cũng đủ đa dạng để kiểm tra các đường ống (pipeline) huấn luyện nhằm tìm lỗi và thực hiện kiểm tra sơ bộ trước khi huấn luyện trên các tập dữ liệu lớn hơn.

Link to this sectionCấu trúc tập dữ liệu#

  • Tổng số hình ảnh: 8 (4 train / 4 val).
  • Các lớp (Classes): 1 (người) với 17 điểm mấu chốt (keypoints) cho mỗi chú thích.
  • Cấu trúc thư mục khuyến nghị: datasets/coco8-pose/images/{train,val}datasets/coco8-pose/labels/{train,val} với các điểm mấu chốt theo định dạng YOLO được lưu dưới dạng các tệp .txt.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Link to this sectionYAML tập dữ liệu#

Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của tập dữ liệu. Trong trường hợp của tập dữ liệu COCO8-Pose, tệp coco8-pose.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.

ultralytics/cfg/datasets/coco8-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-pose ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Keypoint names per class
kpt_names:
  0:
    - nose
    - left_eye
    - right_eye
    - left_ear
    - right_ear
    - left_shoulder
    - right_shoulder
    - left_elbow
    - right_elbow
    - left_wrist
    - right_wrist
    - left_hip
    - right_hip
    - left_knee
    - right_knee
    - left_ankle
    - right_ankle

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-pose.zip

Link to this sectionCách sử dụng#

Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu COCO8-Pose trong 100 epochs với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của mô hình.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh mẫu và chú thích#

Dưới đây là một số ví dụ về các hình ảnh từ tập dữ liệu COCO8-Pose, cùng với các chú thích tương ứng của chúng:

COCO8-pose keypoint estimation dataset mosaic
  • Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu COCO8-Pose cũng như những lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng bộ dữ liệu COCO trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Chúng tôi xin ghi nhận COCO Consortium vì đã tạo ra và duy trì nguồn tài nguyên quý giá này cho cộng đồng computer vision. Để biết thêm thông tin về tập dữ liệu COCO và những người tạo ra nó, hãy truy cập trang web tập dữ liệu COCO.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu COCO8-Pose là gì và nó được sử dụng như thế nào với Ultralytics YOLO26?#

Tập dữ liệu COCO8-Pose là một tập dữ liệu phát hiện tư thế nhỏ, linh hoạt bao gồm 8 hình ảnh đầu tiên từ bộ dữ liệu COCO train 2017, với 4 hình ảnh để huấn luyện và 4 hình ảnh để kiểm chứng. Nó được thiết kế để thử nghiệm và gỡ lỗi các mô hình object detection cũng như thực nghiệm các phương pháp phát hiện mới. Tập dữ liệu này rất lý tưởng cho các thử nghiệm nhanh với Ultralytics YOLO26. Để biết thêm chi tiết về cấu hình tập dữ liệu, hãy xem tệp YAML tập dữ liệu.

Link to this sectionLàm cách nào để tôi huấn luyện mô hình YOLO26 sử dụng tập dữ liệu COCO8-Pose trong Ultralytics?#

Để huấn luyện một mô hình YOLO26n-pose trên tập dữ liệu COCO8-Pose trong 100 epochs với kích thước hình ảnh là 640, hãy làm theo các ví dụ sau:

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)

Để có danh sách đầy đủ các đối số huấn luyện, hãy tham khảo trang Huấn luyện model.

Link to this sectionNhững lợi ích của việc sử dụng tập dữ liệu COCO8-Pose là gì?#

Tập dữ liệu COCO8-Pose mang lại một số lợi ích:

  • Kích thước nhỏ gọn: Chỉ với 8 hình ảnh, nó rất dễ quản lý và hoàn hảo cho các thử nghiệm nhanh.
  • Dữ liệu đa dạng: Mặc dù kích thước nhỏ, nó bao gồm nhiều bối cảnh khác nhau, hữu ích cho việc kiểm tra kỹ lưỡng đường ống huấn luyện.
  • Gỡ lỗi lỗi: Lý tưởng để xác định các lỗi trong quá trình huấn luyện và thực hiện kiểm tra sơ bộ trước khi mở rộng quy mô lên các tập dữ liệu lớn hơn.

Để biết thêm về các tính năng và cách sử dụng, hãy xem phần Giới thiệu tập dữ liệu.

Link to this sectionKỹ thuật mosaicing mang lại lợi ích gì cho quá trình huấn luyện YOLO26 khi sử dụng tập dữ liệu COCO8-Pose?#

Mosaicing, được minh họa trong các hình ảnh mẫu của tập dữ liệu COCO8-Pose, kết hợp nhiều hình ảnh thành một, giúp tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Kỹ thuật này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau, từ đó nâng cao hiệu suất mô hình. Xem phần Sample Images and Annotations để biết các hình ảnh ví dụ.

Link to this sectionTôi có thể tìm tệp YAML của tập dữ liệu COCO8-Pose ở đâu và cách sử dụng nó như thế nào?#

Tệp YAML của tập dữ liệu COCO8-Pose có thể được tìm thấy tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml. Tệp này xác định cấu hình tập dữ liệu, bao gồm các đường dẫn, các lớp và thông tin liên quan khác. Sử dụng tệp này với các tập lệnh huấn luyện YOLO26 như đã đề cập trong phần Train Example.

Để biết thêm các câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Ultralytics Documentation.

Bình luận