İçeriğe geç

Ultralytics HUB-SDK ile Veri Kümesi Yönetimi

Ultralytics HUB-SDK Veri Kümesi Yönetimi belgelerine hoş geldiniz! 👋

Verimli veri kümesi yönetimi makine öğreniminde çok önemlidir. İster deneyimli bir veri bilimcisi ister yeni başlayan biri olun, veri kümesi işlemlerini nasıl yapacağınızı bilmek iş akışınızı kolaylaştırabilir. Bu sayfa, Python'da Ultralytics HUB-SDK kullanarak veri kümeleri üzerinde işlem yapmanın temellerini kapsar. Verilen örnekler, veri kümelerinin nasıl alınacağını, oluşturulacağını, güncelleneceğini, silineceğini ve listeleneceğini ve ayrıca veri kümesi erişimi için bir URL'nin nasıl alınacağını ve veri kümelerinin nasıl yükleneceğini göstermektedir.

Hadi içeri dalalım! 🚀

Kimliğe Göre Veri Kümesi Alma

Belirli bir veri kümesini benzersiz kimliğini kullanarak hızlı bir şekilde almak için aşağıdaki kod parçacığını kullanın. Bu, verileri de dahil olmak üzere temel bilgilere erişmenizi sağlar.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Daha fazla ayrıntı için Datasets sınıfını ve yöntemlerini incelemek için Referans için hub_sdk/modules/datasets.py.

Veri Kümesi Oluşturma

Yeni bir veri kümesi oluşturmak için, veri kümeniz için kolay bir ad tanımlayın ve create_dataset yöntemi aşağıda gösterildiği gibi:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Bkz. create_dataset Daha fazla bilgi için API referansındaki yöntem.

Veri Kümesini Güncelleme

Projeler geliştikçe, veri kümenizin meta verilerini değiştirmeniz gerekebilir. Bu, aşağıdaki kodu yeni ayrıntılarla çalıştırmak kadar basittir:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Bu update yöntemi, veri kümelerinin güncellenmesi hakkında daha fazla ayrıntı sağlar.

Veri Kümesi Silme

Bir veri kümesini kaldırmak için, ister çalışma alanınızı düzenlemek için ister artık ihtiyaç duyulmadığı için olsun, kalıcı olarak silebilirsiniz. delete yöntem:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Sert silmeler de dahil olmak üzere silme seçenekleri hakkında daha fazla bilgi için bkz. delete yöntem dokümantasyonu.

Veri Setlerini Listele

Veri kümelerinize göz atmak için, tüm veri kümelerinizi sayfalandırma ile listeleyin. Bu, çok sayıda veri kümesiyle uğraşırken faydalıdır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results)  # Show the datasets on the current page

# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)

# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)

Bu DatasetList sınıfı, veri kümelerinin listelenmesi ve sayfalandırılması hakkında daha fazla ayrıntı sağlar.

Depolama Alanından URL Al

Bu işlev, veri kümesi depolama erişimi için bir URL getirerek uzaktan depolanan veri kümesi dosyalarını veya eserleri indirmeyi kolaylaştırır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

Bu get_download_link yöntem belgeleri ek ayrıntılar sağlar.

Veri Seti Yükle

Veri setinizi yüklemek oldukça basittir. Veri kümenizin kimliğini ve dosya yolunu ayarlayın, ardından upload_dataset fonksiyon:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Specify the correct file path
print("Dataset has been uploaded.")

Bu upload_dataset yöntemi, veri kümelerinin yüklenmesi hakkında daha fazla ayrıntı sağlar. Ayrıca ilgili yöntem hakkında bilgi edinebilirsiniz DatasetUpload Sınıf.

Her şeyin sorunsuz çalıştığından emin olmak için Veri Kümesi Kimliklerinizi ve dosya yollarınızı iki kez kontrol etmeyi unutmayın.

Herhangi bir sorunla karşılaşırsanız veya sorularınız varsa, destek ekibimiz size yardımcı olmak için burada. 🤝

Verilerinizle oynadığınız için mutlu olun ve modelleriniz doğru ve anlayışlı olsun! 🌟

📅1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar