Zum Inhalt springen

DatensatzverwaltungsvorgÀnge mit Ultralytics HUB-SDK

Willkommen bei der Ultralytics HUB-SDK Dataset Management Dokumentation! 👋

Die effiziente Verwaltung von DatensĂ€tzen ist in der Welt des maschinellen Lernens entscheidend. Egal, ob du ein erfahrener Datenwissenschaftler oder ein AnfĂ€nger auf diesem Gebiet bist, wenn du weißt, wie du mit DatensĂ€tzen umgehen musst, kannst du deinen Arbeitsablauf optimieren. Auf dieser Seite werden die Grundlagen fĂŒr die DurchfĂŒhrung von Operationen mit DatensĂ€tzen mit Ultralytics HUB-SDK in Python behandelt. Die Beispiele zeigen dir, wie du DatensĂ€tze abrufst, erstellst, aktualisierst, löschst, auflistest, eine URL fĂŒr den Zugriff auf DatensĂ€tze abrufst und DatensĂ€tze hochlĂ€dst.

Lass uns eintauchen! 🚀

Einen Datensatz nach ID abrufen

Du suchst nach einem bestimmten Datensatz? Mit dem folgenden Codeschnipsel kannst du ihn schnell ĂŒber seine eindeutige ID abrufen. So kannst du auf die wichtigsten Informationen zugreifen, einschließlich der Daten.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset('<Dataset ID>')  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Einen Datensatz erstellen

Bist du bereit, ein neues Projekt zu starten? Befolge die folgenden Schritte, um ein neues Dataset zu erstellen. Du musst nur einen freundlichen Namen fĂŒr dein Dataset festlegen und die create_dataset Methode.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Einen Datensatz aktualisieren

Wenn sich Projekte weiterentwickeln, sollten das auch deine DatensĂ€tze. Wenn du die Metadaten deines Datensatzes Ă€ndern musst, ist es ganz einfach, den folgenden Code mit den neuen Details auszufĂŒhren.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Löschen eines Datensatzes

Wenn du jemals einen Datensatz entfernen musst, sei es, um deinen Arbeitsbereich zu entrĂŒmpeln oder weil du ihn nicht mehr brauchst, kannst du ihn dauerhaft löschen, indem du die Funktion delete Methode wie hier gezeigt.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset('<Dataset ID>')  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

DatensÀtze auflisten

Um deine DatensĂ€tze zu durchsuchen oder den gewĂŒnschten Datensatz zu finden, kannst du alle deine DatensĂ€tze mit Paginierung auflisten. Das ist hilfreich, wenn du mit einer großen Anzahl von DatensĂ€tzen arbeitest.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

URL vom Speicher abrufen

Diese praktische Funktion ruft eine URL fĂŒr den Zugriff auf den Datensatzspeicher ab und macht das Herunterladen von Dateien oder Artefakten, die aus der Ferne gespeichert wurden, zum Kinderspiel.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link 
dataset = client.dataset("<Dataset ID>")    # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

Datensatz hochladen

Das Hochladen deines Datensatzes ist ein unkomplizierter Vorgang. Gib die ID deines Datensatzes und den Dateipfad an, den du hochladen möchtest, und benutze dann die upload_dataset Funktion wie unten beschrieben.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")    # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

Wenn du mit DatensĂ€tzen arbeitest, ist es immer eine gute Praxis, jeden Schritt des Prozesses zu ĂŒberprĂŒfen. ÜberprĂŒfe deine Datensatz-IDs und Dateipfade, um sicherzustellen, dass alles reibungslos funktioniert.

Solltest du auf Probleme stoßen oder Fragen haben, hilft dir unser freundliches Support-Team bei allen Herausforderungen weiter. đŸ€

Viel Spaß beim Datenkramen und möge dein Modell genau und aufschlussreich sein! 🌟


Kommentare