Saltar al contenido

Conjuntos de datos HUB

Ultralytics Los conjuntos de datos HUB son una solución práctica para gestionar y aprovechar tus conjuntos de datos personalizados.

Una vez cargados, los conjuntos de datos pueden utilizarse inmediatamente para el entrenamiento de modelos. Este enfoque integrado facilita una transición fluida desde la gestión del conjunto de datos al entrenamiento del modelo, simplificando significativamente todo el proceso.



Observa: Ver: Cargar conjuntos de datos en Ultralytics HUB | Recorrido completo de la función de carga de conjuntos de datos

Cargar conjunto de datos

Ultralytics Los conjuntos de datos HUB son iguales que los conjuntos de datos YOLOv5 y YOLOv8 🚀. Utilizan la misma estructura y los mismos formatos de etiquetas para que todo sea sencillo.

Antes de subir un conjunto de datos a Ultralytics HUB, asegúrate de colocar el archivo YAML de tu conjunto de datos dentro del directorio raíz del conjunto de datos y de que el YAML, el directorio y el ZIP de tu conjunto de datos tengan el mismo nombre, como se muestra en el ejemplo siguiente, y luego comprime el directorio del conjunto de datos.

Por ejemplo, si tu conjunto de datos se llama "coco8", como nuestro COCO8 conjunto de datos de ejemplo, entonces deberías tener un coco8.yaml dentro de tu coco8/ que creará un directorio coco8.zip al cerrar la cremallera:

zip -r coco8.zip coco8

Puedes descargar nuestro conjunto de datos de ejemplo COCO8 y descomprimirlo para ver exactamente cómo estructurar tu conjunto de datos.

Estructura del conjunto de datos COCO8

El conjunto de datos YAML tiene el mismo formato estándar YOLOv5 y YOLOv8 YAML.

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip

Después de comprimir tu conjunto de datos, debes validarlo antes de subirlo a Ultralytics HUB. Ultralytics HUB realiza la comprobación de validación del conjunto de datos después de subirlo, así que si te aseguras de que tu conjunto de datos tiene el formato correcto y no contiene errores con antelación, puedes evitar cualquier contratiempo debido al rechazo del conjunto de datos.

from ultralytics.hub import check_dataset

check_dataset('path/to/coco8.zip')

Una vez que tu conjunto de datos ZIP esté listo, navega a la página Conjuntos de datos haciendo clic en el botón Conjuntos de datos de la barra lateral.

Ultralytics Captura de pantalla HUB de la página de inicio con una flecha apuntando al botón Conjuntos de datos en la barra lateral

Haz clic en el botón Cargar conjunto de datos situado en la parte superior derecha de la página. Esta acción activará el cuadro de diálogo Cargar conjunto de datos.

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando al botón Cargar conjunto de datos

Sube tu conjunto de datos en el campo Archivo .zip del conjunto de datos.

Tienes la opción adicional de establecer un nombre y una descripción personalizados para tu conjunto de datos Ultralytics HUB.

Cuando estés satisfecho con la configuración de tu conjunto de datos, haz clic en Cargar.

Ultralytics Captura de pantalla HUB del cuadro de diálogo Cargar conjunto de datos con una flecha apuntando al botón Cargar

Una vez cargado y procesado tu conjunto de datos, podrás acceder a él desde la página Conjuntos de datos.

Ultralytics Captura de pantalla HUB de la página Conjuntos de datos con una flecha apuntando a uno de los conjuntos de datos

Puedes ver las imágenes de tu conjunto de datos agrupadas por divisiones (Entrenamiento, Validación, Prueba).

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando a la pestaña Imágenes

Consejo

Cada imagen puede ampliarse para una mejor visualización.

Ultralytics Captura de pantalla HUB de la pestaña Imágenes dentro de la página Conjunto de datos con una flecha señalando el icono de expansión

Ultralytics Captura de pantalla HUB de la pestaña Imágenes dentro de la página Conjunto de datos con una de las imágenes expandida

Además, puedes analizar tu conjunto de datos haciendo clic en la pestaña Visión general.

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando a la pestaña Resumen

A continuación, entrena un modelo con tu conjunto de datos.

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando al botón Entrenar modelo

Compartir conjunto de datos

Información

Ultralytics La función de compartir de HUB proporciona una forma cómoda de compartir conjuntos de datos con otras personas. Esta función está diseñada tanto para los usuarios existentes de Ultralytics HUB como para los que aún no han creado una cuenta.

Nota

Tienes control sobre el acceso general a tus conjuntos de datos.

Puedes elegir establecer el acceso general en "Privado", en cuyo caso, sólo tú tendrás acceso a él. Alternativamente, puedes establecer el acceso general en "No listado", lo que concede acceso de visualización a cualquier persona que tenga el enlace directo al conjunto de datos, independientemente de que tenga o no una cuenta en Ultralytics HUB.

Ve a la página Conjunto de datos del conjunto de datos que quieras compartir, abre el desplegable de acciones del conjunto de datos y haz clic en la opción Compartir. Esta acción activará el cuadro de diálogo Compartir conjunto de datos.

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando a la opción Compartir

Consejo

También puedes compartir un conjunto de datos directamente desde la página Conjuntos de datos.

Ultralytics Captura de pantalla HUB de la página Conjuntos de datos con una flecha apuntando a la opción Compartir de uno de los conjuntos de datos

Establece el acceso general en "Sin clasificar" y haz clic en Guardar.

Ultralytics Captura de pantalla HUB del cuadro de diálogo Compartir conjunto de datos con una flecha apuntando al desplegable y otra al botón Guardar

Ahora, cualquiera que tenga el enlace directo a tu conjunto de datos podrá verlo.

Consejo

Puedes hacer clic fácilmente en el enlace del conjunto de datos que aparece en el cuadro de diálogo Compartir conjunto de datos para copiarlo.

Ultralytics Captura de pantalla HUB del cuadro de diálogo Compartir conjunto de datos con una flecha apuntando al enlace del conjunto de datos

Editar / Eliminar conjunto de datos

Ve a la página Conjunto de datos del conjunto de datos que quieras editar, abre el desplegable de acciones del conjunto de datos y haz clic en la opción Editar. Esta acción activará el cuadro de diálogo Actualizar conjunto de datos.

Ultralytics Captura de pantalla HUB de la página Conjunto de datos con una flecha apuntando a la opción Editar y Eliminar

Aplica las modificaciones deseadas a tu conjunto de datos y luego confirma los cambios haciendo clic en Guardar.

Ve a la página Conjunto de datos del conjunto de datos que quieras eliminar, abre el desplegable de acciones del conjunto de datos y haz clic en la opción Eliminar. Esta acción eliminará el conjunto de datos.

Nota

Si cambias de opinión, puedes restaurar el conjunto de datos desde la página Papelera.

Ultralytics Captura de pantalla HUB de la página Papelera con una flecha apuntando a la opción Restaurar de uno de los conjuntos de datos



Creado 2023-11-12, Actualizado 2024-02-13
Autores: glenn-jocher (4), priytosh-tripathi (1), RizwanMunawar (1), sergiuwaxmann (1), Laughing-q (1)

Comentarios