Salta para o conte√ļdo

Opera√ß√Ķes de gest√£o de conjuntos de dados com Ultralytics HUB -SDK

Bem-vindo √† documenta√ß√£o de gest√£o de conjuntos de dados do Ultralytics HUB -SDK! ūüĎč

A gest√£o eficiente de conjuntos de dados √© crucial no mundo da aprendizagem autom√°tica. Quer sejas um cientista de dados experiente ou um principiante na √°rea, saber como lidar com opera√ß√Ķes de conjuntos de dados pode simplificar o teu fluxo de trabalho. Esta p√°gina aborda os princ√≠pios b√°sicos da execu√ß√£o de opera√ß√Ķes em conjuntos de dados usando Ultralytics HUB -SDK em Python. Os exemplos fornecidos ilustram como obter, criar, atualizar, eliminar, listar conjuntos de dados, obter um URL para acesso ao conjunto de dados e carregar conjuntos de dados.

Vamos l√° mergulhar! ūüöÄ

Obtém um conjunto de dados por ID

Est√°s √† procura de um conjunto de dados espec√≠fico? Vai busc√°-lo rapidamente utilizando o seu ID √ļnico com o fragmento de c√≥digo abaixo. Isto permitir-te-√° aceder a informa√ß√Ķes essenciais, incluindo os seus dados.

# Fetch a dataset by ID
dataset = client.dataset('<Dataset ID>')  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Cria um conjunto de dados

Estás pronto para iniciar um novo projeto? Segue os passos abaixo para criar um novo conjunto de dados. Tudo o que precisas é de definir um nome amigável para o teu conjunto de dados e utilizar a função create_dataset método.

# Import client library comes before this snippet

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Actualiza um conjunto de dados

À medida que os projectos evoluem, os teus conjuntos de dados também devem evoluir. Se precisares de modificar os metadados do teu conjunto de dados, é tão simples como executar o seguinte código com os novos detalhes.

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Eliminar um conjunto de dados

Se alguma vez precisares de remover um conjunto de dados, seja para organizar o teu espaço de trabalho ou porque já não é necessário, podes eliminá-lo permanentemente invocando o comando delete como aqui se mostra.

# Select the dataset by its ID
dataset = client.dataset('<Dataset ID>')  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Lista de conjuntos de dados

Para navegar pelos teus conjuntos de dados ou encontrar o que precisas, podes listar todos os teus conjuntos de dados com pagina√ß√£o. √Č √ļtil quando lida com um grande n√ļmero de conjuntos de dados.

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

Obtém o URL do armazenamento

Esta função conveniente obtém um URL para acesso ao armazenamento de conjuntos de dados, facilitando o download de ficheiros de conjuntos de dados ou artefactos armazenados remotamente.

# Define the dataset ID for which you want a download link
datasetId = "<Dataset ID>"  # Don't forget to replace this with the actual dataset ID
dataset = client.dataset(datasetId)

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link("archive")
print("Download URL:", url)

Carrega o conjunto de dados

O carregamento do teu conjunto de dados é um processo simples. Define o ID do teu conjunto de dados e o caminho do ficheiro que pretendes carregar, depois utiliza a função upload_dataset como indicado a seguir.

# Set your dataset ID
dataset_id = "<Dataset ID>"  # Substitute with the real dataset ID

# Select the dataset
dataset = client.dataset(dataset_id)

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

Lembra-te, quando estás a trabalhar com conjuntos de dados, é sempre uma boa prática verificar cada passo do processo. Verifica novamente as IDs do conjunto de dados e os caminhos dos ficheiros para garantir que tudo corre bem.

Se encontrares algum problema ou tiveres alguma d√ļvida, a nossa simp√°tica equipa de apoio est√° aqui para te ajudar a ultrapassar quaisquer desafios. ūü§Ě

Boa gest√£o de dados e que os teus modelos sejam precisos e perspicazes! ūüĆü


Coment√°rios