DatensatzverwaltungsvorgÀnge mit Ultralytics HUB-SDK
Willkommen bei der Ultralytics HUB-SDK Dataset Management Dokumentation! đ
Die effiziente Verwaltung von DatensĂ€tzen ist in der Welt des maschinellen Lernens von entscheidender Bedeutung. Egal, ob Sie ein erfahrener Datenwissenschaftler oder ein AnfĂ€nger auf diesem Gebiet sind - wenn Sie wissen, wie Sie mit Datensatzoperationen umgehen, können Sie Ihren Arbeitsablauf rationalisieren. Diese Seite befasst sich mit den Grundlagen der DurchfĂŒhrung von Operationen mit DatensĂ€tzen unter Verwendung von Ultralytics HUB-SDK in Python. Die Beispiele veranschaulichen, wie man DatensĂ€tze abruft, erstellt, aktualisiert, löscht, auflistet, eine URL fĂŒr den Zugriff auf DatensĂ€tze abruft und DatensĂ€tze hochlĂ€dt.
Lasst uns eintauchen! đ
Abrufen eines Datensatzes nach ID
Sie suchen einen bestimmten Datensatz? Holen Sie ihn schnell mit Hilfe seiner eindeutigen ID mit dem nachstehenden Codeschnipsel. Auf diese Weise können Sie auf wichtige Informationen, einschlieĂlich der Daten, zugreifen.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>") # Replace with your actual Dataset ID
print(dataset.data) # This prints the dataset information
Einen Datensatz erstellen
Sind Sie bereit, ein neues Projekt zu beginnen? Folgen Sie den nachstehenden Schritten, um ein neues Dataset zu erstellen. Sie mĂŒssen lediglich einen freundlichen Namen fĂŒr Ihr Dataset festlegen und die Funktion create_dataset
Methode.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define your dataset properties
data = {"meta": {"name": "My Dataset"}} # Replace 'My Dataset' with your desired dataset name
# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")
Aktualisieren eines Datensatzes
Wenn sich Projekte weiterentwickeln, sollten das auch Ihre DatensĂ€tze. Wenn Sie die Metadaten Ihres Datensatzes Ă€ndern mĂŒssen, brauchen Sie nur den folgenden Code mit den neuen Details auszufĂŒhren.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Obtain the dataset
dataset = client.dataset("<Dataset ID>") # Insert the correct Dataset ID
# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}}) # Modify 'Updated Name' as required
print("Dataset updated with new information.")
Löschen eines Datensatzes
Wenn Sie jemals einen Datensatz entfernen mĂŒssen, sei es, um Ihren Arbeitsbereich zu entrĂŒmpeln oder weil er nicht mehr benötigt wird, können Sie ihn dauerhaft löschen, indem Sie den Befehl delete
Methode wie hier gezeigt.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>") # Ensure the Dataset ID is specified
# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")
DatensÀtze auflisten
Um Ihre DatensĂ€tze zu durchsuchen oder den gewĂŒnschten Datensatz zu finden, können Sie alle Ihre DatensĂ€tze mit Paginierung auflisten. Dies ist hilfreich, wenn Sie mit einer groĂen Anzahl von DatensĂ€tzen arbeiten.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results) # Show the datasets on the current page
# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)
# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)
URL aus dem Speicher holen
Diese bequeme Funktion ruft eine URL fĂŒr den Zugriff auf den Datensatzspeicher ab und macht das Herunterladen von Datensatzdateien oder aus der Ferne gespeicherten Artefakten zu einem Kinderspiel.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>") # Don't forget to replace Dataset ID with the actual dataset ID
# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)
Datensatz hochladen
Das Hochladen Ihres Datensatzes ist ein unkomplizierter Vorgang. Legen Sie die ID Ihres Datensatzes und den Dateipfad fest, den Sie hochladen möchten, und verwenden Sie dann die Funktion upload_dataset
Funktion wie unten beschrieben.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset
dataset = client.dataset("<Dataset ID>") # Substitute with the real dataset ID
# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>") # Make sure to specify the correct file path
print("Dataset has been uploaded.")
Denken Sie daran, dass es bei der Arbeit mit DatensĂ€tzen immer eine gute Praxis ist, jeden Schritt des Prozesses zu ĂŒberprĂŒfen und zu verifizieren. ĂberprĂŒfen Sie Ihre Dataset-IDs und Dateipfade, um sicherzustellen, dass alles reibungslos funktioniert.
Sollten Sie auf Probleme stoĂen oder Fragen haben, steht Ihnen unser freundliches Support-Team zur VerfĂŒgung, um Sie bei allen Herausforderungen zu unterstĂŒtzen. đ€
Wir wĂŒnschen Ihnen viel SpaĂ bei der Datenverarbeitung und hoffen, dass Ihre Modelle genau und aufschlussreich sind! đ