Conjunto de datos HomeObjects-3K
El conjunto de datos HomeObjects-3K es una colección seleccionada de imágenes de objetos domésticos comunes, diseñada para el entrenamiento, las pruebas y la evaluación comparativa de modelos de visión artificial. Con aproximadamente 3000 imágenes y 12 clases de objetos distintos, este conjunto de datos es ideal para la investigación y las aplicaciones en la comprensión de escenas interiores, dispositivos domésticos inteligentes, robótica y realidad aumentada.
Ver: Cómo entrenar Ultralytics YOLO11 en el conjunto de datos HomeObjects-3K | Detección, validación y exportación ONNX 🚀
Estructura del conjunto de datos
El conjunto de datos HomeObjects-3K está organizado en los siguientes subconjuntos:
- Conjunto de entrenamiento: Comprende 2285 imágenes anotadas con objetos como sofás, sillas, mesas, lámparas y más.
- Conjunto de Validación: Incluye 404 imágenes anotadas designadas para evaluar el rendimiento del modelo.
Cada imagen está etiquetada utilizando bounding boxes alineados con el formato Ultralytics YOLO. La diversidad de iluminación interior, escala de objetos y orientaciones la hace robusta para escenarios de implementación en el mundo real.
Clases de Objetos
El conjunto de datos admite 12 categorías de objetos cotidianos, que cubren muebles, productos electrónicos y artículos decorativos. Estas clases se eligen para reflejar los elementos comunes que se encuentran en entornos domésticos interiores y admiten tareas de visión como la detección de objetos y el seguimiento de objetos.
Clases de HomeObjects-3K
- cama
- sofá
- silla
- tabla
- lámpara
- tv
- ordenador portátil
- armario
- ventana
- puerta
- planta en maceta
- marco de fotos
Aplicaciones
HomeObjects-3K permite un amplio espectro de aplicaciones en visión artificial de interiores, que abarca tanto la investigación como el desarrollo de productos del mundo real:
-
Detección de objetos en interiores: Utilice modelos como Ultralytics YOLO11 para encontrar y localizar elementos comunes del hogar, como camas, sillas, lámparas y ordenadores portátiles en imágenes. Esto ayuda a comprender en tiempo real las escenas interiores.
-
Análisis de la disposición de la escena: En robótica y sistemas domésticos inteligentes, esto ayuda a los dispositivos a comprender cómo están dispuestas las habitaciones, dónde están los objetos como puertas, ventanas y muebles, para que puedan navegar de forma segura e interactuar con su entorno correctamente.
-
Aplicaciones de RA: Potencia las funciones de reconocimiento de objetos en aplicaciones que utilizan realidad aumentada. Por ejemplo, detecta televisores o armarios y muestra información o efectos adicionales sobre ellos.
-
Educación e investigación: Apoya el aprendizaje y los proyectos académicos al proporcionar a estudiantes e investigadores un conjunto de datos listo para usar para practicar la detección de objetos en interiores con ejemplos del mundo real.
-
Inventario del hogar y seguimiento de activos: Detecta y enumera automáticamente los artículos del hogar en fotos o videos, lo que resulta útil para administrar pertenencias, organizar espacios o visualizar muebles en bienes raíces.
YAML del conjunto de datos
La configuración para el conjunto de datos HomeObjects-3K se proporciona a través de un archivo YAML. Este archivo describe información esencial como las rutas de las imágenes para los directorios de entrenamiento y validación, y la lista de clases de objetos.
Puede acceder al HomeObjects-3K.yaml
archivo directamente desde el repositorio de Ultralytics en: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml
ultralytics/cfg/datasets/HomeObjects-3K.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
# └── homeobjects-3K ← downloads here (390 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: homeobjects-3K # dataset root dir
train: images/train # train images (relative to 'path') 2285 images
val: images/val # val images (relative to 'path') 404 images
# Classes
names:
0: bed
1: sofa
2: chair
3: table
4: lamp
5: tv
6: laptop
7: wardrobe
8: window
9: door
10: potted plant
11: photo frame
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip
Uso
Puedes entrenar un modelo YOLO11n en el conjunto de datos HomeObjects-3K durante 100 épocas utilizando un tamaño de imagen de 640. Los siguientes ejemplos muestran cómo empezar. Para obtener más opciones de entrenamiento y configuraciones detalladas, consulta la guía de Entrenamiento.
Ejemplo de entrenamiento
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
sample_images y anotaciones
El conjunto de datos presenta una rica colección de imágenes de escenas interiores que capturan una amplia gama de objetos domésticos en entornos domésticos naturales. A continuación, se muestran ejemplos visuales del conjunto de datos, cada uno emparejado con sus anotaciones correspondientes para ilustrar las posiciones, escalas y relaciones espaciales de los objetos.
Licencia y Atribución
HomeObjects-3K es desarrollado y publicado por el equipo de Ultralytics bajo la Licencia AGPL-3.0, apoyando la investigación de código abierto y el uso comercial con la atribución adecuada.
Si utilizas este conjunto de datos en tu investigación, por favor cítalo utilizando los detalles mencionados:
@dataset{Jocher_Ultralytics_Datasets_2025,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {May},
title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
version = {1.0.0},
year = {2025}
}
Preguntas frecuentes
¿Para qué está diseñado el conjunto de datos HomeObjects-3K?
HomeObjects-3K está diseñado para avanzar en la comprensión de la IA de escenas interiores. Se centra en la detección de objetos domésticos cotidianos, como camas, sofás, televisores y lámparas, lo que lo hace ideal para aplicaciones en hogares inteligentes, robótica, realidad aumentada y sistemas de monitorización de interiores. Tanto si está entrenando modelos para dispositivos edge en tiempo real como para investigación académica, este conjunto de datos proporciona una base equilibrada.
¿Qué categorías de objetos se incluyen y por qué se seleccionaron?
El conjunto de datos incluye 12 de los artículos para el hogar más comunes: cama, sofá, silla, mesa, lámpara, televisor, computadora portátil, armario, ventana, puerta, planta en maceta y marco de fotos. Estos objetos fueron elegidos para reflejar entornos interiores realistas y para respaldar tareas de usos múltiples, como la navegación robótica o la generación de escenas en aplicaciones de AR/VR.
¿Cómo puedo entrenar un modelo YOLO utilizando el conjunto de datos HomeObjects-3K?
Para entrenar un modelo YOLO como YOLO11n, solo necesitarás el HomeObjects-3K.yaml
archivo de configuración y el modelo preentrenado pesos. Ya sea que esté utilizando Python o la CLI, el entrenamiento se puede iniciar con un solo comando. Puede personalizar parámetros como épocas, tamaño de imagen y tamaño de lote según el rendimiento objetivo y la configuración del hardware.
Ejemplo de entrenamiento
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
¿Es este conjunto de datos adecuado para proyectos de nivel principiante?
Absolutamente. Con un etiquetado limpio y anotaciones estandarizadas compatibles con YOLO, HomeObjects-3K es un excelente punto de partida para estudiantes y aficionados que desean explorar la detección de objetos del mundo real en escenarios de interior. También se adapta bien a aplicaciones más complejas en entornos comerciales.
¿Dónde puedo encontrar el formato de anotación y el YAML?
Consulte la sección Dataset YAML. El formato es YOLO estándar, lo que lo hace compatible con la mayoría de los pipelines de detección de objetos.