Conjuntos de datos de Ultralytics HUB
Los conjuntos de datos de Ultralytics HUB son una solución práctica para gestionar y aprovechar sus conjuntos de datos personalizados.
Una vez cargados, los conjuntos de datos se pueden utilizar inmediatamente para el entrenamiento del modelo. Este enfoque integrado facilita una transición perfecta desde la gestión de conjuntos de datos hasta el entrenamiento del modelo, lo que simplifica significativamente todo el proceso.
Ver: Subir conjuntos de datos a Ultralytics HUB | Tutorial completo de la función de carga de conjuntos de datos
Subir conjunto de datos
Los conjuntos de datos de Ultralytics HUB son como los conjuntos de datos YOLOv5 y YOLOv8 🚀. Utilizan la misma estructura y los mismos formatos de etiquetas para mantener todo simple.
Antes de cargar un conjunto de datos a Ultralytics HUB, asegúrate de colocar tu archivo YAML del conjunto de datos dentro del directorio raíz del conjunto de datos y de que tu YAML del conjunto de datos, directorio y ZIP tengan el mismo nombre, como se muestra en el siguiente ejemplo, y luego comprime el directorio del conjunto de datos.
Por ejemplo, si tu conjunto de datos se llama "coco8", como el nuestro COCO8 dataset de ejemplo, entonces deberías tener un coco8.yaml
dentro de su coco8/
directorio, que creará un coco8.zip
cuando está comprimido:
zip -r coco8.zip coco8
Puede descargar nuestro conjunto de datos de ejemplo COCO8 y descomprimirlo para ver exactamente cómo estructurar su conjunto de datos.
El YAML del conjunto de datos es el mismo formato YAML estándar de YOLOv5 y YOLOv8.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
Después de comprimir tu conjunto de datos, debes validarlo antes de subirlo a Ultralytics HUB. Ultralytics HUB realiza la comprobación de validación del conjunto de datos después de la carga, por lo que, si te aseguras de que tu conjunto de datos esté correctamente formateado y libre de errores de antemano, puedes evitar cualquier contratiempo debido al rechazo del conjunto de datos.
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Una vez que su ZIP del conjunto de datos esté listo, navegue a la página Conjuntos de datos haciendo clic en el botón Conjuntos de datos en la barra lateral y haga clic en el botón Cargar conjunto de datos en la parte superior derecha de la página.
Esta acción activará el diálogo Cargar conjunto de datos.
Seleccione la tarea del conjunto de datos y cárguelo en el campo Archivo .zip del conjunto de datos.
También tiene la opción de establecer un nombre y una descripción personalizados para su conjunto de datos de Ultralytics HUB.
Cuando esté satisfecho con la configuración de su conjunto de datos, haga clic en Subir.
Una vez que tu conjunto de datos se haya cargado y procesado, podrás acceder a él desde la página Conjuntos de datos.
Puedes ver las imágenes de tu conjunto de datos agrupadas por divisiones (Entrenamiento, Validación, Prueba).
Consejo
Cada imagen se puede ampliar para una mejor visualización.
Además, puedes analizar tu conjunto de datos haciendo clic en la pestaña Descripción general.
A continuación, entrene un modelo en su conjunto de datos.
Descargar el conjunto de datos
Navegue a la página del conjunto de datos que desea descargar, abra el menú desplegable de acciones del conjunto de datos y haga clic en la opción Descargar. Esta acción iniciará la descarga de su conjunto de datos.
Compartir Dataset
Información
La funcionalidad para compartir de Ultralytics HUB proporciona una forma conveniente de compartir conjuntos de datos con otros. Esta función está diseñada para dar cabida tanto a los usuarios existentes de Ultralytics HUB como a aquellos que aún no han creado una cuenta.
Nota
Tienes control sobre el acceso general de tus conjuntos de datos.
Puede elegir establecer el acceso general como "Privado", en cuyo caso, solo usted tendrá acceso a él. Alternativamente, puede establecer el acceso general como "No listado", lo que otorga acceso de visualización a cualquier persona que tenga el enlace directo al conjunto de datos, independientemente de si tiene una cuenta de Ultralytics HUB o no.
Navegue a la página del conjunto de datos que desea compartir, abra el menú desplegable de acciones del conjunto de datos y haga clic en la opción Compartir. Esta acción activará el diálogo Compartir conjunto de datos.
Establezca el acceso general en "No listado" y haga clic en Guardar.
Ahora, cualquiera que tenga el enlace directo a su conjunto de datos puede verlo.
Consejo
Puede hacer clic fácilmente en el enlace del conjunto de datos que se muestra en el diálogo Compartir Conjunto de Datos para copiarlo.
Editar Dataset
Navegue a la página del conjunto de datos que desea editar, abra el menú desplegable de acciones del conjunto de datos y haga clic en la opción Editar. Esta acción activará el diálogo Actualizar conjunto de datos.
Aplica las modificaciones deseadas a tu conjunto de datos y, a continuación, confirma los cambios haciendo clic en Guardar.
Eliminar conjunto de datos
Navegue a la página del conjunto de datos que desea eliminar, abra el menú desplegable de acciones del conjunto de datos y haga clic en la opción Eliminar. Esta acción eliminará el conjunto de datos.