Datensatzverwaltungsvorgänge mit Ultralytics HUB-SDK

Willkommen bei der Ultralytics HUB-SDK Dataset Management Dokumentation! 👋

Die effiziente Verwaltung von Datensätzen ist in der Welt des maschinellen Lernens entscheidend. Egal, ob du ein erfahrener Datenwissenschaftler oder ein Anfänger auf diesem Gebiet bist, wenn du weißt, wie du mit Datensätzen umgehen musst, kannst du deinen Arbeitsablauf optimieren. Auf dieser Seite werden die Grundlagen für die Durchführung von Operationen mit Datensätzen mit Ultralytics HUB-SDK in Python behandelt. Die Beispiele zeigen dir, wie du Datensätze abrufst, erstellst, aktualisierst, löschst, auflistest, eine URL für den Zugriff auf Datensätze abrufst und Datensätze hochlädst.

Lass uns eintauchen! 🚀

Einen Datensatz nach ID abrufen

Du suchst nach einem bestimmten Datensatz? Mit dem folgenden Codeschnipsel kannst du ihn schnell über seine eindeutige ID abrufen. So kannst du auf die wichtigsten Informationen zugreifen, einschließlich der Daten.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Einen Datensatz erstellen

Bist du bereit, ein neues Projekt zu starten? Befolge die folgenden Schritte, um ein neues Dataset zu erstellen. Du musst nur einen freundlichen Namen für dein Dataset festlegen und die create_dataset Methode.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Einen Datensatz aktualisieren

Wenn sich Projekte weiterentwickeln, sollten das auch deine Datensätze. Wenn du die Metadaten deines Datensatzes ändern musst, ist es ganz einfach, den folgenden Code mit den neuen Details auszuführen.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Löschen eines Datensatzes

Wenn du jemals einen Datensatz entfernen musst, sei es, um deinen Arbeitsbereich zu entrümpeln oder weil du ihn nicht mehr brauchst, kannst du ihn dauerhaft löschen, indem du die Funktion delete Methode wie hier gezeigt.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Datensätze auflisten

Um deine Datensätze zu durchsuchen oder den gewünschten Datensatz zu finden, kannst du alle deine Datensätze mit Paginierung auflisten. Das ist hilfreich, wenn du mit einer großen Anzahl von Datensätzen arbeitest.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

URL vom Speicher abrufen

Diese praktische Funktion ruft eine URL für den Zugriff auf den Datensatzspeicher ab und macht das Herunterladen von Dateien oder Artefakten, die aus der Ferne gespeichert wurden, zum Kinderspiel.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

Datensatz hochladen

Das Hochladen deines Datensatzes ist ein unkomplizierter Vorgang. Gib die ID deines Datensatzes und den Dateipfad an, den du hochladen möchtest, und benutze dann die upload_dataset Funktion wie unten beschrieben.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

Wenn du mit Datensätzen arbeitest, ist es immer eine gute Praxis, jeden Schritt des Prozesses zu überprüfen. Überprüfe deine Datensatz-IDs und Dateipfade, um sicherzustellen, dass alles reibungslos funktioniert.

Solltest du auf Probleme stoßen oder Fragen haben, hilft dir unser freundliches Support-Team bei allen Herausforderungen weiter. 🤝

Viel Spaß beim Datenkramen und möge dein Modell genau und aufschlussreich sein! 🌟