Chuyển đến nội dung

Bộ dữ liệu HomeObjects-3K

Bộ dữ liệu HomeObjects-3K trong Colab

Bộ dữ liệu HomeObjects-3K là một tập hợp các hình ảnh vật thể gia dụng phổ biến được tuyển chọn, được thiết kế để huấn luyện, kiểm tra và đánh giá chuẩn các mô hình thị giác máy tính. Với ~3.000 hình ảnh và 12 lớp đối tượng riêng biệt, bộ dữ liệu này lý tưởng cho nghiên cứu và ứng dụng trong việc hiểu cảnh trong nhà, thiết bị nhà thông minh, robot và thực tế tăng cường.



Xem: Cách Huấn luyện Ultralytics YOLO11 trên Bộ dữ liệu HomeObjects-3K | Phát hiện, Xác thực & Xuất ONNX 🚀

Cấu trúc bộ dữ liệu

Bộ dữ liệu HomeObjects-3K được tổ chức thành các tập hợp con sau:

  • Tập huấn luyện: Bao gồm 2.285 hình ảnh được chú thích, có các đối tượng như ghế sofa, ghế tựa, bàn, đèn và nhiều đối tượng khác.
  • Tập dữ liệu xác thực: Bao gồm 404 ảnh đã được đánh dấu để đánh giá hiệu suất của mô hình.

Mỗi hình ảnh được gắn nhãn bằng cách sử dụng các hộp giới hạn phù hợp với định dạng Ultralytics YOLO. Sự đa dạng của ánh sáng trong nhà, tỷ lệ đối tượng và hướng làm cho nó mạnh mẽ cho các tình huống triển khai trong thế giới thực.

Các lớp đối tượng

Bộ dữ liệu hỗ trợ 12 danh mục đối tượng hàng ngày, bao gồm đồ nội thất, đồ điện tử và đồ trang trí. Các lớp này được chọn để phản ánh các vật phẩm phổ biến thường gặp trong môi trường gia đình trong nhà và hỗ trợ các tác vụ thị giác như phát hiện đối tượngtheo dõi đối tượng.

Các lớp HomeObjects-3K

  1. giường
  2. ghế sofa
  3. ghế
  4. bảng
  5. đèn
  6. tv
  7. máy tính xách tay
  8. tủ quần áo
  9. cửa sổ
  10. cửa
  11. cây trồng trong chậu
  12. khung ảnh

Các ứng dụng

HomeObjects-3K cho phép một loạt các ứng dụng trong thị giác máy tính trong nhà, trải rộng cả nghiên cứu và phát triển sản phẩm thực tế:

  • Phát hiện vật thể trong nhà: Sử dụng các mô hình như Ultralytics YOLO11 để tìm và định vị các vật dụng gia đình thông thường như giường, ghế, đèn và máy tính xách tay trong hình ảnh. Điều này giúp hiểu được các cảnh trong nhà theo thời gian thực.

  • Phân tích bố cục cảnh: Trong robot và hệ thống nhà thông minh, điều này giúp các thiết bị hiểu cách bố trí các phòng, vị trí của các vật thể như cửa ra vào, cửa sổ và đồ đạc, để chúng có thể điều hướng an toàn và tương tác với môi trường của chúng một cách thích hợp.

  • Ứng dụng AR: Cung cấp sức mạnh cho các tính năng nhận dạng đối tượng trong các ứng dụng sử dụng thực tế tăng cường. Ví dụ: phát hiện TV hoặc tủ quần áo và hiển thị thêm thông tin hoặc hiệu ứng trên chúng.

  • Giáo dục và nghiên cứu: Hỗ trợ các dự án học tập và học thuật bằng cách cung cấp cho sinh viên và nhà nghiên cứu một bộ dữ liệu sẵn sàng sử dụng để thực hành phát hiện đối tượng trong nhà với các ví dụ thực tế.

  • Kiểm kê tài sản và theo dõi tài sản gia đình: Tự động phát hiện và liệt kê các vật dụng gia đình trong ảnh hoặc video, hữu ích cho việc quản lý đồ đạc, sắp xếp không gian hoặc hình dung đồ đạc trong bất động sản.

YAML bộ dữ liệu

Cấu hình cho tập dữ liệu HomeObjects-3K được cung cấp thông qua tệp YAML. Tệp này phác thảo thông tin cần thiết như đường dẫn hình ảnh cho các thư mục huấn luyện và xác thực, và danh sách các lớp đối tượng. Bạn có thể truy cập HomeObjects-3K.yaml tệp trực tiếp từ kho lưu trữ Ultralytics tại: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml

ultralytics/cfg/datasets/HomeObjects-3K.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── homeobjects-3K ← downloads here (390 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: homeobjects-3K # dataset root dir
train: images/train # train images (relative to 'path') 2285 images
val: images/val # val images (relative to 'path') 404 images

# Classes
names:
  0: bed
  1: sofa
  2: chair
  3: table
  4: lamp
  5: tv
  6: laptop
  7: wardrobe
  8: window
  9: door
  10: potted plant
  11: photo frame

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip

Cách sử dụng

Bạn có thể huấn luyện mô hình YOLO11n trên bộ dữ liệu HomeObjects-3K trong 100 epochs với kích thước hình ảnh là 640. Các ví dụ dưới đây cho thấy cách bắt đầu. Để biết thêm các tùy chọn huấn luyện và cài đặt chi tiết, hãy xem hướng dẫn Huấn luyện.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Ảnh và Chú thích mẫu

Tập dữ liệu có một bộ sưu tập phong phú các hình ảnh cảnh trong nhà ghi lại một loạt các đồ vật gia dụng trong môi trường gia đình tự nhiên. Dưới đây là các hình ảnh mẫu từ tập dữ liệu, mỗi hình ảnh được ghép nối với các chú thích tương ứng để minh họa vị trí, tỷ lệ và mối quan hệ không gian của đối tượng.

Ảnh mẫu bộ dữ liệu HomeObjects-3K, làm nổi bật các đối tượng khác nhau như giường, ghế, cửa, ghế sofa và cây.

Giấy phép và Ghi công

HomeObjects-3K được phát triển và phát hành bởi nhóm Ultralytics theo Giấy phép AGPL-3.0, hỗ trợ nghiên cứu mã nguồn mở và sử dụng thương mại với ghi nhận phù hợp.

Nếu bạn sử dụng bộ dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn nó bằng các chi tiết đã đề cập:

@dataset{Jocher_Ultralytics_Datasets_2025,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {May},
    title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
    version = {1.0.0},
    year = {2025}
}

Câu hỏi thường gặp

Bộ dữ liệu HomeObjects-3K được thiết kế cho mục đích gì?

HomeObjects-3K được tạo ra để nâng cao khả năng hiểu biết của AI về các cảnh trong nhà. Nó tập trung vào việc phát hiện các vật dụng gia đình hàng ngày—như giường, ghế sofa, TV và đèn—làm cho nó trở nên lý tưởng cho các ứng dụng trong nhà thông minh, robot, thực tế tăng cường và hệ thống giám sát nội thất. Cho dù bạn đang đào tạo các mô hình cho các thiết bị biên thời gian thực hay nghiên cứu học thuật, bộ dữ liệu này cung cấp một nền tảng cân bằng.

Những danh mục đối tượng nào được bao gồm và tại sao chúng được chọn?

Bộ dữ liệu này bao gồm 12 vật dụng gia đình thường gặp nhất: giường, диван, ghế, bàn, đèn, TV, máy tính xách tay, tủ quần áo, cửa sổ, cửa ra vào, cây trồng trong горшок và khung ảnh. Những đối tượng này được chọn để phản ánh môi trường trong nhà thực tế và hỗ trợ các tác vụ đa mục đích như điều hướng bằng робот hoặc tạo khung cảnh trong các ứng dụng AR/VR.

Làm cách nào để huấn luyện mô hình YOLO bằng bộ dữ liệu HomeObjects-3K?

Để huấn luyện một mô hình YOLO như YOLO11n, bạn sẽ chỉ cần HomeObjects-3K.yaml tập tin cấu hình và mô hình đã được huấn luyện trước weights. Cho dù bạn đang sử dụng Python hay CLI, quá trình huấn luyện có thể được khởi chạy bằng một lệnh duy nhất. Bạn có thể tùy chỉnh các tham số như epochs, kích thước ảnh và kích thước batch tùy thuộc vào hiệu suất mục tiêu và thiết lập phần cứng của bạn.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Bộ dữ liệu này có phù hợp cho các dự án cấp độ người mới bắt đầu không?

Chắc chắn rồi. Với việc dán nhãn sạch và chú thích tương thích YOLO được tiêu chuẩn hóa, HomeObjects-3K là một điểm khởi đầu tuyệt vời cho sinh viên và người có sở thích muốn khám phá object detection (phát hiện đối tượng) thực tế trong các tình huống trong nhà. Nó cũng mở rộng tốt cho các ứng dụng phức tạp hơn trong môi trường thương mại.

Tôi có thể tìm định dạng chú thích và YAML ở đâu?

Tham khảo phần Dataset YAML. Định dạng này là YOLO tiêu chuẩn, giúp nó tương thích với hầu hết các quy trình phát hiện đối tượng.



📅 Đã tạo 3 tháng trước ✏️ Cập nhật 1 tháng trước

Bình luận