Meet YOLO26: next-gen vision AI.

Link to this sectionTập dữ liệu Dog-Pose#

Link to this sectionGiới thiệu#

Tập dữ liệu Dog-Pose của Ultralytics là tập dữ liệu chất lượng cao và quy mô lớn được tuyển chọn đặc biệt cho tác vụ ước tính điểm khóa (keypoint estimation) trên chó. Với 6.773 ảnh huấn luyện và 1.703 ảnh kiểm thử, tập dữ liệu này cung cấp nền tảng vững chắc để huấn luyện các model ước tính tư thế (pose estimation) mạnh mẽ.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Mỗi ảnh được gán nhãn bao gồm 24 điểm khóa với 3 chiều cho mỗi điểm khóa (x, y, độ hiển thị), biến nó thành một nguồn tài nguyên giá trị cho nghiên cứu và phát triển nâng cao trong thị giác máy tính.

Ultralytics Dog-pose display image

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Link to this sectionCấu trúc tập dữ liệu#

  • Phân tách: 6.773 ảnh train / 1.703 ảnh val với các tệp nhãn định dạng YOLO tương ứng.

  • Điểm khóa: 24 điểm mỗi con chó với các bộ ba (x, y, visibility).

  • Bố cục:

    datasets/dog-pose/
    ├── images/{train,val}
    └── labels/{train,val}

Link to this sectionYAML tập dữ liệu#

Một tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Nó bao gồm các đường dẫn, chi tiết về điểm khóa và các thông tin liên quan khác. Đối với tập dữ liệu Dog-pose, tệp dog-pose.yaml hiện có tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionCách sử dụng#

Để huấn luyện model YOLO26n-pose trên tập dữ liệu Dog-pose trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh mẫu và chú thích#

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu Dog-pose, cùng với các chú thích tương ứng:

Dog pose estimation dataset mosaic training batch
  • Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu Dog-pose và lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu Dog-pose trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Chúng tôi xin gửi lời cảm ơn tới đội ngũ Stanford vì đã tạo ra và duy trì nguồn tài nguyên giá trị này cho cộng đồng thị giác máy tính. Để biết thêm thông tin về tập dữ liệu Dog-pose và những người tạo ra nó, hãy truy cập trang web Tập dữ liệu Chó Stanford.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu Dog-pose là gì và nó được sử dụng như thế nào với Ultralytics YOLO26?#

Tập dữ liệu Dog-Pose bao gồm 6.773 ảnh huấn luyện và 1.703 ảnh kiểm thử được gán nhãn với 24 điểm khóa để ước tính tư thế chó. Nó được thiết kế để huấn luyện và kiểm định các model với Ultralytics YOLO26, hỗ trợ các ứng dụng như phân tích hành vi động vật, giám sát thú cưng và nghiên cứu thú y. Các chú thích toàn diện của tập dữ liệu làm cho nó trở nên lý tưởng để phát triển các model ước tính tư thế chính xác cho loài chó.

Link to this sectionLàm cách nào để huấn luyện model YOLO26 sử dụng tập dữ liệu Dog-pose trong Ultralytics?#

Để huấn luyện model YOLO26n-pose trên tập dữ liệu Dog-pose trong 100 epoch với kích thước ảnh 640, hãy làm theo các ví dụ sau:

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Để có danh sách đầy đủ các đối số huấn luyện, hãy tham khảo trang Huấn luyện model.

Link to this sectionLợi ích của việc sử dụng tập dữ liệu Dog-pose là gì?#

Tập dữ liệu Dog-pose mang lại một số lợi ích:

Tập dữ liệu lớn và đa dạng: Với hơn 8.400 hình ảnh, nó cung cấp dữ liệu đáng kể bao quát nhiều tư thế, giống chó và bối cảnh khác nhau, cho phép huấn luyện và đánh giá model mạnh mẽ.

Chú thích điểm khóa chi tiết: Mỗi hình ảnh bao gồm 24 điểm khóa với 3 chiều cho mỗi điểm (x, y, độ hiển thị), cung cấp các chú thích chính xác để huấn luyện các model phát hiện tư thế chuẩn xác.

Kịch bản thực tế: Bao gồm hình ảnh từ các môi trường đa dạng, nâng cao khả năng khái quát hóa của model đối với các ứng dụng thực tế như giám sát thú cưng và phân tích hành vi.

Lợi thế học chuyển tiếp (Transfer Learning): Tập dữ liệu hoạt động tốt với các kỹ thuật học chuyển tiếp, cho phép các model đã được huấn luyện trước trên tập dữ liệu tư thế người thích nghi với các đặc điểm cụ thể của loài chó.

Để biết thêm về các tính năng và cách sử dụng, hãy xem phần Giới thiệu tập dữ liệu.

Link to this sectionMosaicing mang lại lợi ích gì cho quá trình huấn luyện YOLO26 sử dụng tập dữ liệu Dog-pose?#

Mosaicing, như được minh họa trong các hình ảnh mẫu từ tập dữ liệu Dog-pose, hợp nhất nhiều hình ảnh thành một tổ hợp duy nhất, làm phong phú thêm sự đa dạng của các đối tượng và cảnh trong mỗi batch huấn luyện. Kỹ thuật này mang lại một số lợi ích:

  • Tăng sự đa dạng của các tư thế, kích thước và phông nền của chó trong mỗi batch
  • Cải thiện khả năng của model trong việc phát hiện chó ở các bối cảnh và quy mô khác nhau
  • Nâng cao khả năng khái quát hóa bằng cách để model tiếp xúc với nhiều mẫu hình ảnh đa dạng hơn
  • Giảm tình trạng overfitting (quá khớp) bằng cách tạo ra các kết hợp mới của các ví dụ huấn luyện

Cách tiếp cận này dẫn đến các model mạnh mẽ hơn, hoạt động tốt hơn trong các kịch bản thực tế. Để xem các ví dụ hình ảnh, hãy tham khảo phần Hình ảnh mẫu và Chú thích.

Link to this sectionTôi có thể tìm tệp YAML của tập dữ liệu Dog-pose ở đâu và làm cách nào để sử dụng nó?#

Tệp YAML của tập dữ liệu Dog-pose có tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Tệp này định nghĩa cấu hình tập dữ liệu, bao gồm các đường dẫn, lớp, chi tiết điểm khóa và các thông tin liên quan khác. Tệp YAML chỉ định 24 điểm khóa với 3 chiều mỗi điểm, làm cho nó phù hợp cho các tác vụ ước tính tư thế chi tiết.

Để sử dụng tệp này với các tập lệnh huấn luyện YOLO26, chỉ cần tham chiếu nó trong lệnh huấn luyện của bạn như được hiển thị trong phần Cách sử dụng. Tập dữ liệu sẽ được tự động tải xuống khi sử dụng lần đầu, giúp việc thiết lập trở nên đơn giản.

Để biết thêm các câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Tài liệu Ultralytics.

Bình luận