Bộ dữ liệu Dog-Pose
Giới thiệu
Bộ dữ liệu Dog-Pose của Ultralytics là một bộ dữ liệu chất lượng cao và phong phú, được chọn lọc đặc biệt cho tác vụ ước tính điểm đặc trưng (keypoint) trên chó. Với 6.773 ảnh huấn luyện và 1.703 ảnh kiểm thử, bộ dữ liệu này cung cấp nền tảng vững chắc để huấn luyện các model ước tính tư thế (pose estimation) mạnh mẽ.
Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial
Mỗi ảnh được gán nhãn bao gồm 24 điểm đặc trưng với 3 chiều cho mỗi điểm (x, y, độ hiển thị), biến nó thành một tài nguyên giá trị cho nghiên cứu và phát triển nâng cao trong lĩnh vực thị giác máy tính (computer vision).
Tập dữ liệu này được thiết kế để sử dụng với Ultralytics Platform và YOLO26.
Cấu trúc tập dữ liệu
-
Phân chia: 6.773 ảnh train / 1.703 ảnh test kèm theo các tệp nhãn định dạng YOLO tương ứng.
-
Keypoints: 24 per dog with
(x, y, visibility)triplets. -
Bố cục:
datasets/dog-pose/ ├── images/{train,test} └── labels/{train,test}
Dataset YAML
Một tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình bộ dữ liệu. Nó bao gồm các đường dẫn, thông tin chi tiết về điểm đặc trưng và các thông tin liên quan khác. Đối với bộ dữ liệu Dog-pose, tệp dog-pose.yaml có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Keypoint names per class
kpt_names:
0:
- front_left_paw
- front_left_knee
- front_left_elbow
- rear_left_paw
- rear_left_knee
- rear_left_elbow
- front_right_paw
- front_right_knee
- front_right_elbow
- rear_right_paw
- rear_right_knee
- rear_right_elbow
- tail_start
- tail_end
- left_ear_base
- right_ear_base
- nose
- chin
- left_ear_tip
- right_ear_tip
- left_eye
- right_eye
- withers
- throat
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zipCách sử dụng
Để huấn luyện một model YOLO26n-pose trên bộ dữ liệu Dog-pose trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Hình ảnh và chú thích mẫu
Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu Dog-pose, cùng với các chú thích tương ứng:
- Mosaiced Image: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép lại (mosaic). Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các vật thể và cảnh quan trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và bối cảnh vật thể khác nhau.
Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong bộ dữ liệu Dog-pose và lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.
Trích dẫn và Ghi nhận
Nếu bạn sử dụng bộ dữ liệu Dog-pose trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau đây:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}Chúng tôi xin gửi lời cảm ơn đến đội ngũ Stanford vì đã tạo ra và duy trì tài nguyên giá trị này cho cộng đồng thị giác máy tính. Để biết thêm thông tin về bộ dữ liệu Dog-pose và những người tạo ra nó, hãy truy cập trang web Stanford Dogs Dataset.
Câu hỏi thường gặp (FAQ)
Bộ dữ liệu Dog-pose là gì và nó được sử dụng như thế nào với Ultralytics YOLO26?
Bộ dữ liệu Dog-Pose bao gồm 6.773 ảnh huấn luyện và 1.703 ảnh kiểm thử được gán nhãn với 24 điểm đặc trưng để ước tính tư thế chó. Nó được thiết kế để huấn luyện và kiểm thử các model với Ultralytics YOLO26, hỗ trợ các ứng dụng như phân tích hành vi động vật, giám sát thú cưng và nghiên cứu thú y. Các chú thích toàn diện của bộ dữ liệu làm cho nó trở nên lý tưởng để phát triển các model ước tính tư thế chính xác cho loài chó.
Làm thế nào để tôi huấn luyện một model YOLO26 sử dụng bộ dữ liệu Dog-pose trong Ultralytics?
Để huấn luyện một model YOLO26n-pose trên bộ dữ liệu Dog-pose trong 100 epochs với kích thước ảnh 640, hãy làm theo các ví dụ sau:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)Để xem danh sách đầy đủ các đối số huấn luyện, hãy tham khảo trang Training của model.
Những lợi ích của việc sử dụng bộ dữ liệu Dog-pose là gì?
Bộ dữ liệu Dog-pose mang lại một số lợi ích:
Bộ dữ liệu lớn và đa dạng: Với hơn 8.400 hình ảnh, nó cung cấp lượng dữ liệu đáng kể bao quát nhiều tư thế, giống loài và ngữ cảnh khác nhau của chó, cho phép huấn luyện và đánh giá model một cách mạnh mẽ.
Chú thích điểm đặc trưng chi tiết: Mỗi hình ảnh bao gồm 24 điểm đặc trưng với 3 chiều cho mỗi điểm (x, y, độ hiển thị), cung cấp các chú thích chính xác để huấn luyện các model phát hiện tư thế chuẩn xác.
Các tình huống thực tế: Bao gồm các hình ảnh từ môi trường đa dạng, nâng cao khả năng khái quát hóa của model đối với các ứng dụng thực tế như giám sát thú cưng và phân tích hành vi.
Lợi thế về học chuyển tiếp (Transfer Learning): Bộ dữ liệu hoạt động hiệu quả với các kỹ thuật học chuyển tiếp, cho phép các model đã được huấn luyện trước trên bộ dữ liệu tư thế người có thể thích nghi với các đặc điểm cụ thể của chó.
Để biết thêm về các tính năng và cách sử dụng, hãy xem phần Giới thiệu về Bộ dữ liệu.
Mosaicing mang lại lợi ích gì cho quá trình huấn luyện YOLO26 sử dụng bộ dữ liệu Dog-pose?
Mosaicing, như đã minh họa trong các hình ảnh mẫu từ bộ dữ liệu Dog-pose, kết hợp nhiều hình ảnh thành một tổng thể duy nhất, làm phong phú thêm sự đa dạng của các đối tượng và cảnh quan trong mỗi batch huấn luyện. Kỹ thuật này mang lại một số lợi ích:
- Tăng sự đa dạng về tư thế, kích thước và phông nền của chó trong mỗi batch
- Cải thiện khả năng phát hiện chó trong các ngữ cảnh và tỷ lệ khác nhau của model
- Nâng cao khả năng khái quát hóa bằng cách tiếp cận model với các mẫu hình ảnh đa dạng hơn
- Giảm tình trạng quá khớp (overfitting) bằng cách tạo ra các kết hợp mới của các ví dụ huấn luyện
Cách tiếp cận này dẫn đến các model mạnh mẽ hơn và hoạt động tốt hơn trong các kịch bản thực tế. Để xem hình ảnh mẫu, hãy tham khảo phần Hình ảnh mẫu và chú thích.
Tôi có thể tìm tệp YAML của bộ dữ liệu Dog-pose ở đâu và làm thế nào để sử dụng nó?
Tệp YAML của bộ dữ liệu Dog-pose có thể được tìm thấy tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Tệp này xác định cấu hình bộ dữ liệu, bao gồm các đường dẫn, lớp, chi tiết điểm đặc trưng và các thông tin liên quan khác. Tệp YAML chỉ định 24 điểm đặc trưng với 3 chiều cho mỗi điểm, khiến nó trở nên phù hợp cho các tác vụ ước tính tư thế chi tiết.
Để sử dụng tệp này với các tập lệnh huấn luyện YOLO26, chỉ cần tham chiếu nó trong lệnh huấn luyện của bạn như được hiển thị trong phần Cách dùng. Bộ dữ liệu sẽ được tự động tải xuống khi sử dụng lần đầu, giúp cho việc thiết lập trở nên đơn giản.
Để biết thêm các câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Tài liệu Ultralytics.