Ir al contenido

Operaciones de gesti贸n de conjuntos de datos con Ultralytics HUB-SDK

隆Bienvenido a la documentaci贸n de gesti贸n de conjuntos de datos de Ultralytics HUB-SDK! 馃憢

La gesti贸n eficaz de los conjuntos de datos es crucial en el mundo del aprendizaje autom谩tico. Tanto si eres un cient铆fico de datos experimentado como un principiante en este campo, saber c贸mo manejar las operaciones de conjuntos de datos puede agilizar tu flujo de trabajo. Esta p谩gina cubre los aspectos b谩sicos de la realizaci贸n de operaciones en conjuntos de datos utilizando Ultralytics HUB-SDK en Python. Los ejemplos proporcionados ilustran c贸mo obtener, crear, actualizar, eliminar, listar conjuntos de datos, obtener una URL para acceder a conjuntos de datos y cargar conjuntos de datos.

隆Vamos a sumergirnos! 馃殌

Obtener un conjunto de datos por ID

驴Busca un conjunto de datos espec铆fico? Obt茅ngalo r谩pidamente utilizando su ID 煤nico con el siguiente fragmento de c贸digo. As铆 podr谩 acceder a la informaci贸n esencial, incluidos sus datos.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Crear un conjunto de datos

驴Listo para empezar un nuevo proyecto? Siga los pasos que se indican a continuaci贸n para crear un nuevo conjunto de datos. Todo lo que necesita es definir un nombre amigable para su conjunto de datos y utilizar la funci贸n create_dataset m茅todo.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Actualizar un conjunto de datos

A medida que los proyectos evolucionan, tambi茅n deber铆an hacerlo sus conjuntos de datos. Si necesita modificar los metadatos de su conjunto de datos, es tan sencillo como ejecutar el siguiente c贸digo con los nuevos detalles.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Eliminar un conjunto de datos

Si alguna vez necesita eliminar un conjunto de datos, ya sea para despejar su espacio de trabajo o porque ya no lo necesita, puede eliminarlo permanentemente invocando la funci贸n delete como se muestra aqu铆.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Lista de conjuntos de datos

Para navegar por sus conjuntos de datos o encontrar el que necesita, puede listar todos sus conjuntos de datos con paginaci贸n. Es 煤til cuando se trata de un gran n煤mero de conjuntos de datos.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

Obtener URL del almac茅n

Esta pr谩ctica funci贸n obtiene una URL para acceder al almacenamiento de conjuntos de datos, lo que facilita la descarga de archivos de conjuntos de datos o artefactos almacenados a distancia.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

Cargar conjunto de datos

Cargar su conjunto de datos es un proceso sencillo. Establezca el ID del conjunto de datos y la ruta del archivo que desea cargar y, a continuaci贸n, utilice el bot贸n upload_dataset como se detalla a continuaci贸n.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

Recuerde que, cuando trabaje con conjuntos de datos, siempre es una buena pr谩ctica comprobar y verificar cada paso del proceso. Vuelve a comprobar los ID de los conjuntos de datos y las rutas de los archivos para asegurarte de que todo funciona correctamente.

Si te encuentras con alg煤n problema o tienes alguna pregunta, nuestro amable equipo de asistencia est谩 a tu disposici贸n para ayudarte a superar cualquier dificultad. 馃

Feliz lucha con los datos, 隆y que tus modelos sean precisos y perspicaces! 馃専

Comentarios