Tập dữ liệu Động vật hoang dã châu Phi
Tập dữ liệu này giới thiệu bốn lớp động vật phổ biến thường được tìm thấy trong các khu bảo tồn thiên nhiên ở Nam Phi. Nó bao gồm hình ảnh về động vật hoang dã châu Phi như trâu, voi, tê giác và ngựa vằn, cung cấp những hiểu biết có giá trị về đặc điểm của chúng. Rất cần thiết cho việc huấn luyện các thuật toán computer vision, tập dữ liệu này hỗ trợ xác định động vật trong nhiều môi trường sống khác nhau, từ vườn thú đến rừng rậm, đồng thời hỗ trợ nghiên cứu về động vật hoang dã.
Watch: How to Train Ultralytics YOLO26 on the African Wildlife Dataset | Inference, Metrics & ONNX Export 🐘
Cấu trúc tập dữ liệu
Tập dữ liệu phát hiện đối tượng động vật hoang dã châu Phi được chia thành ba tập con:
- Tập huấn luyện (Training set): Chứa 1052 hình ảnh, mỗi hình ảnh đều có chú thích tương ứng.
- Tập kiểm thử (Validation set): Bao gồm 225 hình ảnh, mỗi hình ảnh đều có chú thích đi kèm.
- Tập thử nghiệm (Testing set): Bao gồm 227 hình ảnh, mỗi hình ảnh đều có chú thích đi kèm.
Ứng dụng
Tập dữ liệu này có thể được áp dụng trong nhiều tác vụ computer vision khác nhau như object detection, theo dõi đối tượng và nghiên cứu. Cụ thể, nó có thể được sử dụng để huấn luyện và đánh giá các model nhận diện đối tượng động vật hoang dã châu Phi trong hình ảnh, điều này mang lại ứng dụng trong bảo tồn động vật hoang dã, nghiên cứu sinh thái và các nỗ lực giám sát tại các khu bảo tồn thiên nhiên và khu vực được bảo vệ. Ngoài ra, nó có thể đóng vai trò là nguồn tài nguyên quý giá cho mục đích giáo dục, cho phép sinh viên và các nhà nghiên cứu học tập và hiểu rõ đặc điểm cũng như hành vi của các loài động vật khác nhau.
Dataset YAML
Một tệp YAML (Yet Another Markup Language) xác định cấu hình tập dữ liệu, bao gồm các đường dẫn, lớp và các chi tiết liên quan khác. Đối với tập dữ liệu động vật hoang dã châu Phi, tệp african-wildlife.yaml nằm tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/african-wildlife.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# African Wildlife dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/african-wildlife/
# Example usage: yolo train data=african-wildlife.yaml
# parent
# ├── ultralytics
# └── datasets
# └── african-wildlife ← downloads here (100 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: african-wildlife # dataset root dir
train: images/train # train images (relative to 'path') 1052 images
val: images/val # val images (relative to 'path') 225 images
test: images/test # test images (relative to 'path') 227 images
# Classes
names:
0: buffalo
1: elephant
2: rhino
3: zebra
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/african-wildlife.zipCách sử dụng
Để huấn luyện model YOLO26n trên tập dữ liệu động vật hoang dã châu Phi trong 100 epochs với kích thước hình ảnh là 640, hãy sử dụng các mẫu code được cung cấp. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Training của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="african-wildlife.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load an African wildlife fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/african-wildlife-sample.jpg")Hình ảnh và chú thích mẫu
Tập dữ liệu động vật hoang dã châu Phi bao gồm nhiều loại hình ảnh đa dạng giới thiệu các loài động vật khác nhau và môi trường sống tự nhiên của chúng. Dưới đây là các ví dụ về hình ảnh từ tập dữ liệu, mỗi hình ảnh đều đi kèm với các chú thích tương ứng.

- Hình ảnh Mosaiced: Tại đây, chúng tôi trình bày một batch huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép lại (mosaic). Kỹ thuật huấn luyện Mosaicing kết hợp nhiều hình ảnh thành một, giúp làm phong phú thêm sự đa dạng của batch. Phương pháp này giúp tăng cường khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.
Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu động vật hoang dã châu Phi, nhấn mạnh lợi ích của việc áp dụng kỹ thuật mosaic trong quá trình huấn luyện.
Trích dẫn, Giấy phép và Lời cảm ơn
Chúng tôi xin cảm ơn tác giả gốc của tập dữ liệu, Bianca Ferreira, vì đã phát hành tập dữ liệu này cho cộng đồng. Đội ngũ Ultralytics đã cập nhật và điều chỉnh nó nội bộ để có thể sử dụng liền mạch với các model Ultralytics YOLO. Tập dữ liệu này được cung cấp theo Giấy phép AGPL-3.0.
Nếu bạn sử dụng tập dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn nó bằng các chi tiết được đề cập:
@dataset{Ferreira_African_Wildlife_Ultralytics_Adaptation_2024,
author = {Ferreira, Bianca},
title = {African Wildlife Detection Dataset (Ultralytics YOLO Adaptation)},
url = {https://docs.ultralytics.com/datasets/detect/african-wildlife/},
note = {Original dataset by Bianca Ferreira; adapted for Ultralytics YOLO by Glenn Jocher and Muhammad Rizwan Munawar},
license = {AGPL-3.0},
version = {1.0.0},
year = {2024}
}Câu hỏi thường gặp (FAQ)
Tập dữ liệu Động vật hoang dã châu Phi là gì và làm thế nào để sử dụng nó trong các dự án computer vision?
The African Wildlife Dataset includes images of four common animal species found in South African nature reserves: buffalo, elephant, rhino, and zebra. It is a valuable resource for training computer vision algorithms in object detection and animal identification. The dataset supports various tasks like object tracking, research, and conservation efforts. For more information on its structure and applications, refer to the Dataset Structure section and Applications of the dataset.
Làm thế nào để huấn luyện model YOLO26 bằng Tập dữ liệu Động vật hoang dã châu Phi?
Bạn có thể huấn luyện model YOLO26 trên Tập dữ liệu Động vật hoang dã châu Phi bằng cách sử dụng tệp cấu hình african-wildlife.yaml. Dưới đây là ví dụ về cách huấn luyện model YOLO26n trong 100 epoch với kích thước hình ảnh là 640:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="african-wildlife.yaml", epochs=100, imgsz=640)Để biết thêm các tham số và tùy chọn huấn luyện khác, hãy tham khảo tài liệu Training.
Tôi có thể tìm tệp cấu hình YAML cho Tập dữ liệu Động vật hoang dã châu Phi ở đâu?
Tệp cấu hình YAML cho Tập dữ liệu Động vật hoang dã châu Phi, có tên là african-wildlife.yaml, có thể được tìm thấy tại liên kết GitHub này. Tệp này xác định cấu hình tập dữ liệu, bao gồm các đường dẫn, lớp và các chi tiết khác quan trọng đối với việc huấn luyện các model machine learning. Xem phần Dataset YAML để biết thêm chi tiết.
Tôi có thể xem hình ảnh và chú thích mẫu từ Tập dữ liệu Động vật hoang dã châu Phi không?
Có, Tập dữ liệu Động vật hoang dã châu Phi bao gồm nhiều loại hình ảnh đa dạng giới thiệu các loài động vật khác nhau trong môi trường sống tự nhiên của chúng. Bạn có thể xem hình ảnh mẫu và các chú thích tương ứng trong phần Sample Images and Annotations. Phần này cũng minh họa việc sử dụng kỹ thuật mosaic để kết hợp nhiều hình ảnh thành một nhằm làm phong phú thêm sự đa dạng của batch, giúp tăng cường khả năng tổng quát hóa của model.
Tập dữ liệu Động vật hoang dã châu Phi có thể được sử dụng như thế nào để hỗ trợ bảo tồn và nghiên cứu động vật hoang dã?
Tập dữ liệu Động vật hoang dã châu Phi rất lý tưởng để hỗ trợ bảo tồn và nghiên cứu động vật hoang dã bằng cách cho phép huấn luyện và đánh giá các model nhận diện động vật hoang dã châu Phi trong các môi trường sống khác nhau. Các model này có thể hỗ trợ giám sát quần thể động vật, nghiên cứu hành vi của chúng và nhận diện các nhu cầu bảo tồn. Ngoài ra, tập dữ liệu có thể được sử dụng cho mục đích giáo dục, giúp sinh viên và các nhà nghiên cứu hiểu rõ đặc điểm cũng như hành vi của các loài động vật khác nhau. Thông tin chi tiết có thể được tìm thấy trong phần Applications.