Bộ dữ liệu Construction-PPE
Bộ dữ liệu Construction-PPE được thiết kế để cải thiện việc tuân thủ an toàn tại các công trường xây dựng bằng cách cho phép phát hiện các thiết bị bảo hộ thiết yếu như mũ bảo hiểm, áo phản quang, găng tay, ủng và kính bảo hộ, cùng với các chú thích cho thiết bị bị thiếu. Được biên soạn từ môi trường xây dựng thực tế, bộ dữ liệu bao gồm cả các trường hợp tuân thủ và không tuân thủ, biến nó thành một nguồn tài nguyên có giá trị để đào tạo các model AI nhằm giám sát an toàn nơi làm việc.
Watch: How to train Ultralytics YOLO on Personal Protective Equipment Dataset | VisionAI in Construction 👷
Cấu trúc tập dữ liệu
Bộ dữ liệu Construction-PPE được chia thành ba tập con chính:
- Training Set: Bộ sưu tập chính các hình ảnh xây dựng đã được chú thích, mô tả công nhân với việc sử dụng PPE đầy đủ và một phần.
- Validation Set: Một tập con được chỉ định dùng để tinh chỉnh và đánh giá hiệu suất model trong quá trình phát hiện PPE và giám sát sự tuân thủ.
- Test Set: Một tập con độc lập dành riêng để đánh giá hiệu quả của model cuối cùng trong việc phát hiện PPE và xác định các vấn đề tuân thủ.
Mỗi hình ảnh đều được chú thích theo định dạng Ultralytics YOLO, đảm bảo khả năng tương thích với các pipeline object detection và tracking hiện đại nhất.
Bộ dữ liệu cung cấp 11 lớp được chia thành các danh mục tích cực (đã đeo PPE) và tiêu cực (thiếu PPE). Cấu trúc song song tích cực/tiêu cực này cho phép các model phát hiện thiết bị được đeo đúng cách và xác định các vi phạm an toàn.
Giá trị kinh doanh
- Xây dựng vẫn là một trong những ngành nghề nguy hiểm nhất trên thế giới, với hơn 51 trong số 123 thương vong tử vong liên quan đến công việc tại Vương quốc Anh trong giai đoạn 2023/2024 xảy ra trong lĩnh vực xây dựng. Tuy nhiên, vấn đề không còn nằm ở sự thiếu hụt các quy định khi 42% công nhân xây dựng thừa nhận không phải lúc nào cũng tuân thủ các quy trình.
- Ngành xây dựng vốn đã được quản lý bởi một hệ thống các tiêu chuẩn sức khỏe và an toàn (HSE) rộng khắp, nhưng các đội ngũ HSE lại gặp thách thức trong việc thực thi nhất quán. Các đội ngũ HSE thường bị quá tải, phải cân bằng giữa giấy tờ và kiểm toán, đồng thời thiếu khả năng giám sát mọi ngóc ngách của một môi trường bận rộn và luôn thay đổi trong thời gian thực.
- Đây là lúc công nghệ phát hiện thiết bị bảo hộ cá nhân (PPE) dựa trên thị giác máy tính trở nên vô giá. Bằng cách tự động kiểm tra xem công nhân có đang đeo mũ bảo hiểm, áo phản quang và các thiết bị bảo hộ cá nhân khác hay không, bạn có thể đảm bảo các quy tắc HSE không chỉ tồn tại mà còn được thực thi hiệu quả và nhất quán trên tất cả các công trường. Ngoài việc tuân thủ, thị giác máy tính cung cấp các chỉ số rủi ro hàng đầu bằng cách tiết lộ mức độ tuân thủ các thực hành an toàn của các đội ngũ, cho phép các tổ chức phát hiện xu hướng tuân thủ đi xuống và ngăn chặn sự cố trước khi chúng xảy ra.
- Thêm vào đó, khả năng phát hiện thiết bị bảo hộ cá nhân cũng đã được biết đến với công dụng xác định những người xâm nhập công trường trái phép, vì những người không được trang bị thiết bị an toàn phù hợp là những người đầu tiên kích hoạt thông báo. Cuối cùng, phát hiện PPE là một trường hợp sử dụng thị giác máy tính đơn giản nhưng mạnh mẽ, mang lại sự giám sát toàn diện, thông tin chi tiết có thể hành động và báo cáo tiêu chuẩn hóa, giúp các công ty xây dựng giảm thiểu rủi ro, bảo vệ công nhân và bảo vệ dự án của họ.
Ứng dụng
Construction-PPE thúc đẩy nhiều ứng dụng thị giác máy tính tập trung vào an toàn:
- Giám sát tuân thủ tự động: Đào tạo các model AI để kiểm tra ngay lập tức xem công nhân có đang đeo thiết bị an toàn bắt buộc như mũ bảo hiểm, áo phản quang hoặc găng tay hay không, giúp giảm thiểu rủi ro tại công trường.
- Phân tích an toàn nơi làm việc: Theo dõi việc sử dụng PPE theo thời gian, phát hiện các vi phạm thường xuyên và tạo thông tin chi tiết để cải thiện văn hóa an toàn.
- Hệ thống giám sát thông minh: Kết nối các model phát hiện với camera để gửi cảnh báo thời gian thực khi thiếu PPE, ngăn ngừa tai nạn trước khi chúng xảy ra.
- Robot và hệ thống tự hành: Cho phép máy bay không người lái hoặc robot thực hiện kiểm tra PPE trên các công trường lớn, hỗ trợ kiểm tra nhanh hơn và an toàn hơn.
- Nghiên cứu và giáo dục: Cung cấp bộ dữ liệu thực tế cho sinh viên và các nhà nghiên cứu đang khám phá vấn đề an toàn nơi làm việc và tương tác giữa người và vật thể.
Dataset YAML
Bộ dữ liệu Construction-PPE bao gồm một tệp cấu hình YAML xác định các đường dẫn hình ảnh đào tạo và xác thực cùng với danh sách đầy đủ các lớp đối tượng. Bạn có thể truy cập tệp construction-ppe.yaml trực tiếp trong kho lưu trữ Ultralytics tại đây: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/construction-ppe.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Construction-PPE dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/construction-ppe/
# Example usage: yolo train data=construction-ppe.yaml
# parent
# ├── ultralytics
# └── datasets
# └── construction-ppe ← downloads here (178.4 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: construction-ppe # dataset root dir
train: images/train # train images (relative to 'path') 1132 images
val: images/val # val images (relative to 'path') 143 images
test: images/test # test images (relative to 'path') 141 images
# Classes
names:
0: helmet
1: gloves
2: vest
3: boots
4: goggles
5: none
6: Person
7: no_helmet
8: no_goggle
9: no_gloves
10: no_boots
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/construction-ppe.zipCách sử dụng
Bạn có thể đào tạo một model YOLO26n trên bộ dữ liệu Construction-PPE trong 100 epoch với kích thước hình ảnh là 640. Các ví dụ sau đây cho thấy cách bắt đầu nhanh chóng. Để biết thêm các tùy chọn và cấu hình nâng cao, hãy xem Hướng dẫn đào tạo.
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo26n.pt")
# Train the model on Construction-PPE dataset
model.train(data="construction-ppe.yaml", epochs=100, imgsz=640)Hình ảnh và chú thích mẫu
Bộ dữ liệu ghi lại hình ảnh công nhân xây dựng trong nhiều môi trường, điều kiện ánh sáng và tư thế khác nhau. Cả hai trường hợp tuân thủ và không tuân thủ đều được bao gồm.

Giấy phép và Ghi công
Construction-PPE được phát triển và phát hành theo Giấy phép AGPL-3.0, hỗ trợ nghiên cứu nguồn mở và các ứng dụng thương mại với sự ghi công phù hợp.
Nếu bạn sử dụng bộ dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn nó:
@dataset{Dalvi_Construction_PPE_Dataset_2025,
author = {Mrunmayee Dalvi and Niyati Singh and Sahil Bhingarde and Ketaki Chalke},
title = {Construction-PPE: Personal Protective Equipment Detection Dataset},
month = {January},
year = {2025},
version = {1.0.0},
license = {AGPL-3.0},
url = {https://docs.ultralytics.com/datasets/detect/construction-ppe/},
publisher = {Ultralytics}
}Câu hỏi thường gặp (FAQ)
Điều gì làm cho bộ dữ liệu Construction-PPE trở nên độc đáo?
Không giống như các bộ dữ liệu xây dựng chung chung, Construction-PPE bao gồm một cách rõ ràng các lớp thiết bị bị thiếu. Cách tiếp cận dán nhãn kép này cho phép các model không chỉ phát hiện PPE mà còn gắn cờ các vi phạm trong thời gian thực.
Những danh mục đối tượng nào được bao gồm?
Bộ dữ liệu bao gồm mũ bảo hiểm, áo phản quang, găng tay, ủng, kính bảo hộ và công nhân, cùng với các đối tác "thiếu PPE" của họ. Điều này đảm bảo phạm vi tuân thủ toàn diện.
Làm thế nào tôi có thể đào tạo một model YOLO sử dụng bộ dữ liệu Construction-PPE?
Để đào tạo một model YOLO26 sử dụng bộ dữ liệu Construction-PPE, bạn có thể sử dụng các đoạn mã sau:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="construction-ppe.yaml", epochs=100, imgsz=640)Bộ dữ liệu này có phù hợp cho các ứng dụng thực tế không?
Có. Các hình ảnh được biên soạn từ các công trường xây dựng thực tế trong nhiều điều kiện khác nhau. Điều này làm cho nó cực kỳ hiệu quả để xây dựng các hệ thống giám sát an toàn nơi làm việc có thể triển khai được.
Lợi ích của việc sử dụng bộ dữ liệu Construction-PPE trong các dự án AI là gì?
Bộ dữ liệu cho phép phát hiện thời gian thực các thiết bị bảo hộ cá nhân, giúp giám sát an toàn của công nhân tại các công trường xây dựng. Với các lớp cho cả thiết bị được đeo và thiết bị bị thiếu, nó hỗ trợ các hệ thống AI có thể tự động gắn cờ các vi phạm an toàn, tạo thông tin chi tiết về tuân thủ và giảm thiểu rủi ro. Nó cũng cung cấp một tài nguyên thực tế để phát triển các giải pháp thị giác máy tính trong an toàn nơi làm việc, robot và nghiên cứu học thuật.