Skip to main content

Bộ dữ liệu HomeObjects-3K

HomeObjects-3K Dataset In Colab

Bộ dữ liệu HomeObjects-3K là tập hợp các hình ảnh vật dụng gia đình phổ biến, được thiết kế để huấn luyện, kiểm thử và đánh giá chuẩn (benchmarking) computer vision các model. Với khoảng 3.000 hình ảnh và 12 lớp vật thể riêng biệt, bộ dữ liệu này lý tưởng cho các nghiên cứu và ứng dụng trong lĩnh vực hiểu bối cảnh trong nhà, thiết bị nhà thông minh, robot học và thực tế tăng cường (AR).



Watch: How to Train Ultralytics YOLO26 on HomeObjects-3K Dataset | Detection, Validation & ONNX Export 🚀

Cấu trúc bộ dữ liệu

Bộ dữ liệu HomeObjects-3K được chia thành các tập con sau:

  • Tập huấn luyện (Training Set): Bao gồm 2.285 hình ảnh đã gán nhãn, chứa các vật thể như ghế sofa, ghế ngồi, bàn, đèn và nhiều vật dụng khác.
  • Tập xác thực (Validation Set): Bao gồm 404 hình ảnh đã gán nhãn được sử dụng để đánh giá hiệu suất của model.

Mỗi hình ảnh được gán nhãn bằng bbox tương ứng với định dạng Ultralytics YOLO. Sự đa dạng về ánh sáng trong nhà, quy mô vật thể và góc nhìn giúp bộ dữ liệu này trở nên mạnh mẽ cho các tình huống triển khai thực tế.

Các lớp vật thể

Bộ dữ liệu hỗ trợ 12 danh mục vật thể hàng ngày, bao gồm nội thất, đồ điện tử và các vật dụng trang trí. Các lớp này được chọn lọc để phản ánh các vật dụng phổ biến trong môi trường gia đình và hỗ trợ các tác vụ thị giác như object detectiontheo dõi đối tượng.

!!! Tip "Các lớp HomeObjects-3K"

0. bed
1. sofa
2. chair
3. table
4. lamp
5. tv
6. laptop
7. wardrobe
8. window
9. door
10. potted plant
11. photo frame

Ứng dụng

HomeObjects-3K cho phép triển khai nhiều ứng dụng trong thị giác máy tính trong nhà, từ nghiên cứu học thuật đến phát triển sản phẩm thực tế:

  • Phát hiện vật thể trong nhà: Sử dụng các model như Ultralytics YOLO26 để tìm và xác định vị trí các vật dụng gia đình phổ biến như giường, ghế, đèn và laptop trong hình ảnh. Điều này giúp hiểu rõ bối cảnh trong nhà theo thời gian thực.

  • Phân tích bố cục cảnh: Trong robot và hệ thống nhà thông minh, điều này giúp thiết bị hiểu cách bố trí phòng ốc, vị trí của các vật thể như cửa ra vào, cửa sổ và đồ nội thất, từ đó di chuyển an toàn và tương tác đúng cách với môi trường.

  • Các ứng dụng AR: Cung cấp tính năng nhận diện vật thể trong các ứng dụng sử dụng thực tế tăng cường. Ví dụ: phát hiện TV hoặc tủ quần áo để hiển thị thêm thông tin hoặc hiệu ứng lên trên các vật thể đó.

  • Giáo dục và nghiên cứu: Hỗ trợ học tập và các dự án học thuật bằng cách cung cấp cho sinh viên và nhà nghiên cứu một bộ dữ liệu sẵn sàng sử dụng để thực hành phát hiện vật thể trong nhà với các ví dụ thực tế.

  • Kiểm kê gia đình và theo dõi tài sản: Tự động phát hiện và liệt kê các vật dụng trong nhà thông qua ảnh hoặc video, hữu ích cho việc quản lý tài sản, sắp xếp không gian hoặc trực quan hóa đồ nội thất trong lĩnh vực bất động sản.

Dataset YAML

Cấu hình cho bộ dữ liệu HomeObjects-3K được cung cấp thông qua một file YAML. File này phác thảo các thông tin thiết yếu như đường dẫn hình ảnh cho các thư mục huấn luyện và kiểm thử, cùng danh sách các lớp vật thể. Bạn có thể truy cập file HomeObjects-3K.yaml trực tiếp từ kho lưu trữ Ultralytics tại: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml

ultralytics/cfg/datasets/HomeObjects-3K.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── homeobjects-3K ← downloads here (390 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: homeobjects-3K # dataset root dir
train: images/train # train images (relative to 'path') 2285 images
val: images/val # val images (relative to 'path') 404 images

# Classes
names:
  0: bed
  1: sofa
  2: chair
  3: table
  4: lamp
  5: tv
  6: laptop
  7: wardrobe
  8: window
  9: door
  10: potted plant
  11: photo frame

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip

Cách sử dụng

Bạn có thể huấn luyện một model YOLO26n trên bộ dữ liệu HomeObjects-3K trong 100 epoch với kích thước ảnh là 640. Các ví dụ bên dưới cho thấy cách bắt đầu. Để biết thêm các tùy chọn huấn luyện và cài đặt chi tiết, hãy kiểm tra Training.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo26n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)

Hình ảnh mẫu và chú thích

Bộ dữ liệu này có một bộ sưu tập phong phú các hình ảnh cảnh trong nhà, ghi lại nhiều loại đồ gia dụng trong môi trường sống tự nhiên. Dưới đây là các hình ảnh mẫu từ bộ dữ liệu, mỗi hình ảnh đi kèm với các chú thích tương ứng để minh họa vị trí, tỷ lệ và mối quan hệ không gian của vật thể.

Mẫu bộ dữ liệu HomeObjects-3K với các đồ gia dụng

Giấy phép và Ghi công

HomeObjects-3K được phát triển và phát hành bởi đội ngũ Ultralytics theo giấy phép Giấy phép AGPL-3.0, hỗ trợ nghiên cứu mã nguồn mở và sử dụng thương mại với sự ghi nhận phù hợp.

Nếu bạn sử dụng bộ dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn nó bằng cách sử dụng các thông tin chi tiết được đề cập:

Quote
@dataset{Jocher_Ultralytics_Datasets_2025,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {May},
    title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/homeobjects-3k/},
    version = {1.0.0},
    year = {2025}
}

Câu hỏi thường gặp (FAQ)

Bộ dữ liệu HomeObjects-3K được thiết kế để làm gì?

HomeObjects-3K được tạo ra để thúc đẩy khả năng hiểu các cảnh trong nhà của AI. Nó tập trung vào việc phát hiện các vật dụng gia đình hàng ngày—như giường, sofa, TV và đèn—làm cho nó trở nên lý tưởng cho các ứng dụng trong nhà thông minh, robot, thực tế tăng cường và hệ thống giám sát nội thất. Cho dù bạn đang huấn luyện model cho các thiết bị biên thời gian thực hay phục vụ nghiên cứu học thuật, bộ dữ liệu này cung cấp một nền tảng cân bằng.

Những danh mục vật thể nào được bao gồm, và tại sao chúng lại được chọn?

Bộ dữ liệu bao gồm 12 vật dụng gia đình phổ biến nhất: giường, sofa, ghế, bàn, đèn, TV, laptop, tủ quần áo, cửa sổ, cửa ra vào, cây trồng trong chậu và khung ảnh. Những vật thể này được chọn để phản ánh môi trường trong nhà thực tế và hỗ trợ các tác vụ đa mục đích như di chuyển bằng robot hoặc tạo cảnh trong các ứng dụng AR/VR.

Làm thế nào để tôi có thể huấn luyện một model YOLO bằng cách sử dụng bộ dữ liệu HomeObjects-3K?

Để huấn luyện một model YOLO như YOLO26n, bạn chỉ cần file cấu hình HomeObjects-3K.yaml và các trọng số model đã huấn luyện trước (pretrained model). Cho dù bạn đang sử dụng Python hay CLI, quá trình huấn luyện có thể được khởi chạy bằng một lệnh duy nhất. Bạn có thể tùy chỉnh các tham số như số epoch, kích thước ảnh và batch size tùy thuộc vào hiệu suất mục tiêu và cấu hình phần cứng của bạn.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo26n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)

Bộ dữ liệu này có phù hợp với các dự án cấp độ người mới bắt đầu không?

Chắc chắn rồi. Với nhãn sạch và các chú thích tương thích với YOLO tiêu chuẩn, HomeObjects-3K là điểm khởi đầu tuyệt vời cho sinh viên và những người đam mê muốn khám phá việc phát hiện vật thể trong thực tế trong các tình huống trong nhà. Nó cũng có khả năng mở rộng tốt cho các ứng dụng phức tạp hơn trong môi trường thương mại.

Tôi có thể tìm định dạng chú thích và YAML ở đâu?

Tham khảo Dataset YAML phần. Định dạng này là YOLO tiêu chuẩn, giúp nó tương thích với hầu hết các pipeline phát hiện vật thể.

Bình luận