Link to this sectionTập dữ liệu HomeObjects-3K#
Tập dữ liệu HomeObjects-3K là một bộ sưu tập hình ảnh các đồ vật gia dụng thông dụng, được thiết kế để huấn luyện, kiểm thử và đánh giá hiệu năng (benchmarking) cho các mô hình thị giác máy tính (computer vision). Với khoảng 3.000 hình ảnh và 12 lớp đối tượng riêng biệt, tập dữ liệu này rất lý tưởng cho nghiên cứu và các ứng dụng trong việc hiểu bối cảnh trong nhà, thiết bị nhà thông minh, robot và thực tế tăng cường.
Watch: How to Train Ultralytics YOLO26 on HomeObjects-3K Dataset | Detection, Validation & ONNX Export 🚀
Link to this sectionCấu trúc tập dữ liệu#
Tập dữ liệu HomeObjects-3K được tổ chức thành các tập con sau:
- Tập Huấn luyện (Training Set): Bao gồm 2.285 hình ảnh đã được chú thích, chứa các đối tượng như ghế sofa, ghế ngồi, bàn, đèn và nhiều vật dụng khác.
- Tập Kiểm chứng (Validation Set): Bao gồm 404 hình ảnh đã được chú thích, dùng để đánh giá hiệu suất của mô hình.
Mỗi hình ảnh được dán nhãn bằng các bounding box theo định dạng Ultralytics YOLO. Sự đa dạng về ánh sáng trong nhà, quy mô đối tượng và hướng đặt làm cho tập dữ liệu này trở nên mạnh mẽ cho các kịch bản triển khai thực tế.
Link to this sectionCác lớp đối tượng#
Tập dữ liệu hỗ trợ 12 danh mục đối tượng thường nhật, bao gồm nội thất, đồ điện tử và các vật dụng trang trí. Các lớp này được chọn để phản ánh các vật dụng phổ biến trong môi trường gia đình và hỗ trợ các tác vụ thị giác như phát hiện đối tượng (object detection) và theo dõi đối tượng (object tracking).
- giường
- sofa
- ghế
- bàn
- đèn
- tv
- laptop
- tủ quần áo
- cửa sổ
- cửa ra vào
- cây cảnh
- khung ảnh
Link to this sectionỨng dụng#
HomeObjects-3K mở ra nhiều ứng dụng đa dạng trong thị giác máy tính trong nhà, trải dài từ nghiên cứu đến phát triển sản phẩm thực tế:
-
Phát hiện đối tượng trong nhà: Sử dụng các mô hình như Ultralytics YOLO26 để tìm và xác định vị trí các vật dụng gia đình thông dụng như giường, ghế, đèn và laptop trong hình ảnh. Điều này giúp hiểu bối cảnh trong nhà theo thời gian thực.
-
Phân tích bố cục cảnh: Trong các hệ thống robot và nhà thông minh, điều này giúp các thiết bị hiểu cách sắp xếp phòng ốc, vị trí của các vật thể như cửa ra vào, cửa sổ và đồ nội thất, từ đó giúp di chuyển an toàn và tương tác hiệu quả với môi trường xung quanh.
-
Các ứng dụng AR: Cung cấp năng lượng cho các tính năng nhận diện đối tượng (object recognition) trong các ứng dụng sử dụng thực tế tăng cường. Ví dụ, phát hiện TV hoặc tủ quần áo để hiển thị thêm thông tin hoặc các hiệu ứng tương ứng.
-
Giáo dục và nghiên cứu: Hỗ trợ việc học tập và các dự án học thuật bằng cách cung cấp cho sinh viên và nhà nghiên cứu một tập dữ liệu sẵn sàng sử dụng để thực hành phát hiện đối tượng trong nhà với các ví dụ thực tế.
-
Kiểm kê nhà cửa và theo dõi tài sản: Tự động phát hiện và liệt kê các vật dụng trong nhà thông qua hình ảnh hoặc video, hữu ích cho việc quản lý tài sản, sắp xếp không gian hoặc hình ảnh hóa nội thất trong bất động sản.
Link to this sectionYAML tập dữ liệu#
Cấu hình cho tập dữ liệu HomeObjects-3K được cung cấp thông qua một tệp YAML. Tệp này phác thảo các thông tin thiết yếu như đường dẫn hình ảnh cho các thư mục huấn luyện và kiểm chứng, cùng danh sách các lớp đối tượng.
Bạn có thể truy cập tệp HomeObjects-3K.yaml trực tiếp từ kho lưu trữ của Ultralytics tại: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
# └── homeobjects-3K ← downloads here (390 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: homeobjects-3K # dataset root dir
train: images/train # train images (relative to 'path') 2285 images
val: images/val # val images (relative to 'path') 404 images
# Classes
names:
0: bed
1: sofa
2: chair
3: table
4: lamp
5: tv
6: laptop
7: wardrobe
8: window
9: door
10: potted plant
11: photo frame
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zipLink to this sectionSử dụng#
Bạn có thể huấn luyện mô hình YOLO26n trên tập dữ liệu HomeObjects-3K trong 100 epoch với kích thước hình ảnh là 640. Các ví dụ bên dưới cho thấy cách bắt đầu. Để biết thêm các tùy chọn huấn luyện và cài đặt chi tiết, hãy xem hướng dẫn Huấn luyện (Training).
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo26n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)Link to this sectionHình ảnh mẫu và chú thích#
Tập dữ liệu có bộ sưu tập phong phú các hình ảnh về bối cảnh trong nhà, ghi lại nhiều loại đồ dùng gia đình trong môi trường tự nhiên. Dưới đây là các hình ảnh mẫu từ tập dữ liệu, mỗi hình ảnh được ghép nối với các chú thích tương ứng để minh họa vị trí, quy mô và mối quan hệ không gian của các đối tượng.

Link to this sectionGiấy phép và Ghi công#
HomeObjects-3K được phát triển và phát hành bởi đội ngũ Ultralytics theo Giấy phép AGPL-3.0, hỗ trợ nghiên cứu mã nguồn mở và sử dụng thương mại với sự ghi công phù hợp.
Nếu bạn sử dụng tập dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn nó bằng cách sử dụng các thông tin chi tiết được đề cập:
@dataset{Jocher_Ultralytics_Datasets_2025,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {May},
title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/homeobjects-3k/},
version = {1.0.0},
year = {2025}
}Link to this sectionCâu hỏi thường gặp (FAQ)#
Link to this sectionTập dữ liệu HomeObjects-3K được thiết kế để làm gì?#
HomeObjects-3K được tạo ra nhằm nâng cao khả năng hiểu bối cảnh trong nhà của AI. Tập dữ liệu tập trung vào việc phát hiện các vật dụng gia đình thường nhật—như giường, sofa, TV và đèn—giúp nó trở nên lý tưởng cho các ứng dụng trong nhà thông minh, robot, thực tế tăng cường và hệ thống giám sát nội thất. Cho dù bạn đang huấn luyện các mô hình cho các thiết bị cạnh (edge devices) thời gian thực hay nghiên cứu học thuật, tập dữ liệu này cung cấp một nền tảng cân bằng.
Link to this sectionNhững danh mục đối tượng nào được bao gồm và tại sao chúng lại được chọn?#
Tập dữ liệu bao gồm 12 vật dụng gia đình phổ biến nhất: giường, sofa, ghế, bàn, đèn, tv, laptop, tủ quần áo, cửa sổ, cửa ra vào, cây cảnh và khung ảnh. Các đối tượng này được chọn để phản ánh môi trường trong nhà thực tế và hỗ trợ các tác vụ đa mục đích như điều hướng robot hoặc tạo bối cảnh trong các ứng dụng AR/VR.
Link to this sectionLàm thế nào để tôi có thể huấn luyện mô hình YOLO sử dụng tập dữ liệu HomeObjects-3K?#
Để huấn luyện một mô hình YOLO như YOLO26n, bạn chỉ cần tệp cấu hình HomeObjects-3K.yaml và các trọng số mô hình đã huấn luyện sẵn (pretrained model). Cho dù sử dụng Python hay CLI, việc huấn luyện có thể được khởi chạy bằng một lệnh duy nhất. Bạn có thể tùy chỉnh các tham số như epoch, kích thước hình ảnh và kích thước batch tùy thuộc vào hiệu suất mục tiêu và thiết lập phần cứng của mình.
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo26n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)Link to this sectionTập dữ liệu này có phù hợp cho các dự án dành cho người mới bắt đầu không?#
Hoàn toàn phù hợp. Với việc dán nhãn sạch và các chú thích tương thích với YOLO tiêu chuẩn, HomeObjects-3K là điểm bắt đầu tuyệt vời cho sinh viên và những người đam mê muốn khám phá việc phát hiện đối tượng trong thực tế cho các kịch bản trong nhà. Nó cũng có khả năng mở rộng tốt cho các ứng dụng phức tạp hơn trong môi trường thương mại.
Link to this sectionTôi có thể tìm thấy định dạng chú thích và YAML ở đâu?#
Tham khảo phần Dataset YAML. Định dạng này là YOLO tiêu chuẩn, giúp nó tương thích với hầu hết các đường ống (pipelines) phát hiện đối tượng.