Bỏ để qua phần nội dung

Bộ dữ liệu tư thế chó

Giới thiệu

Bộ dữ liệu Dog-pose Ultralytics là một bộ dữ liệu chất lượng cao và mở rộng được tuyển chọn đặc biệt để ước tính điểm chính của chó. Với 6.773 hình ảnh đào tạo và 1.703 hình ảnh thử nghiệm, bộ dữ liệu này cung cấp nền tảng vững chắc để đào tạo các mô hình ước tính tư thế mạnh mẽ. Mỗi hình ảnh có chú thích bao gồm 24 điểm chính với 3 chiều cho mỗi điểm chính (x, y, khả năng hiển thị), khiến nó trở thành một nguồn tài nguyên có giá trị cho nghiên cứu và phát triển nâng cao về thị giác máy tính.

Ultralytics Hình ảnh hiển thị tư thế chó

Bộ dữ liệu này được dự định sử dụng với Ultralytics HUBYOLO11 .

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Tệp này bao gồm các đường dẫn, chi tiết điểm chính và các thông tin liên quan khác. Trong trường hợp của tập dữ liệu Dog-pose, dog-pose.yaml có sẵn tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics /cfg/datasets/dog-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Sử dụng

Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Dog-pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Sau đây là một số ví dụ về hình ảnh từ tập dữ liệu Dog-pose, cùng với chú thích tương ứng:

Hình ảnh mẫu tập dữ liệu

  • Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu Dog-pose và lợi ích của việc sử dụng khảm trong quá trình đào tạo.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu Dog-pose trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Chúng tôi muốn cảm ơn nhóm Stanford đã tạo ra và duy trì nguồn tài nguyên có giá trị này cho cộng đồng thị giác máy tính . Để biết thêm thông tin về tập dữ liệu Dog-pose và những người tạo ra nó, hãy truy cập trang web Stanford Dogs Dataset .

FAQ

Bộ dữ liệu Dog-pose là gì và nó được sử dụng như thế nào với Ultralytics YOLO11 là gì?

Bộ dữ liệu Dog-Pose có 6.000 hình ảnh được chú thích với 17 điểm chính để ước tính tư thế của chó. Lý tưởng để đào tạo và xác thực các mô hình với Ultralytics YOLO11 , nó hỗ trợ các ứng dụng như phân tích hành vi động vật và nghiên cứu thú y.

Làm thế nào để tôi đào tạo mô hình YOLO11 bằng cách sử dụng tập dữ liệu Dog-pose trong Ultralytics ?

Để đào tạo mô hình YOLO11n-pose trên tập dữ liệu Dog-pose trong 100 kỷ nguyên với kích thước hình ảnh là 640, hãy làm theo các ví dụ sau:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Để biết danh sách đầy đủ các đối số đào tạo, hãy tham khảo trang Đào tạo mẫu.

Lợi ích của việc sử dụng bộ dữ liệu Dog-pose là gì?

Bộ dữ liệu Dog-pose mang lại một số lợi ích:

Bộ dữ liệu lớn và đa dạng : Với 6.000 hình ảnh, bộ dữ liệu này cung cấp một lượng dữ liệu đáng kể bao gồm nhiều tư thế, giống chó và bối cảnh khác nhau, cho phép đào tạo và đánh giá mô hình mạnh mẽ.

Chú thích theo tư thế cụ thể : Cung cấp chú thích chi tiết để ước tính tư thế, đảm bảo dữ liệu chất lượng cao để đào tạo các mô hình phát hiện tư thế.

Các tình huống thực tế : Bao gồm hình ảnh từ nhiều môi trường khác nhau, nâng cao khả năng khái quát hóa của mô hình thành các ứng dụng thực tế.

Cải thiện hiệu suất mô hình : Tính đa dạng và quy mô của tập dữ liệu giúp cải thiện độ chính xác và độ bền của mô hình, đặc biệt đối với các tác vụ liên quan đến ước tính tư thế chi tiết.

Để biết thêm về các tính năng và cách sử dụng của nó, hãy xem phần Giới thiệu tập dữ liệu .

Khảm có lợi như thế nào cho quá trình đào tạo YOLO11 khi sử dụng tập dữ liệu Dog-pose?

Mosaicing, như minh họa trong các hình ảnh mẫu từ tập dữ liệu Dog-pose, hợp nhất nhiều hình ảnh thành một hình ảnh tổng hợp duy nhất, làm phong phú thêm sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Phương pháp này tăng cường khả năng khái quát hóa của mô hình trên các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau, dẫn đến hiệu suất được cải thiện. Đối với hình ảnh ví dụ, hãy tham khảo phần Hình ảnh mẫu và Chú thích .

Tôi có thể tìm tệp YAML của bộ dữ liệu Dog-pose ở đâu và sử dụng nó như thế nào?

Tệp YAML của tập dữ liệu Dog-pose có thể được tìm thấy tại đây . Tệp này định nghĩa cấu hình tập dữ liệu, bao gồm đường dẫn, lớp và thông tin liên quan khác. Sử dụng tệp này với các tập lệnh đào tạo YOLO11 như đã đề cập trong phần Ví dụ đào tạo .

Để biết thêm Câu hỏi thường gặp và tài liệu chi tiết, hãy truy cập Ultralytics Tài liệu.

📅 Được tạo cách đây 3 ngày ✏️ Đã cập nhật cách đây 3 ngày

Ý kiến