İçeriğe geç

Ultralytics HUB-SDK ile Veri Kümesi Yönetimi İşlemleri

Ultralytics HUB-SDK Veri Kümesi Yönetimi Dokümantasyonuna hoş geldiniz! 👋

Veri kümelerini verimli bir şekilde yönetmek Makine Öğrenimi dünyasında çok önemlidir. İster deneyimli bir veri bilimcisi ister bu alanda yeni başlayan biri olun, veri kümesi işlemlerini nasıl yapacağınızı bilmek iş akışınızı kolaylaştırabilir. Bu sayfa, Python adresindeki Ultralytics HUB-SDK'yı kullanarak veri kümeleri üzerinde işlem yapmanın temellerini kapsamaktadır. Verilen örnekler, veri kümelerinin nasıl alınacağını, oluşturulacağını, güncelleneceğini, silineceğini, listeleneceğini, veri kümesi erişimi için bir URL alınacağını ve veri kümelerinin nasıl yükleneceğini göstermektedir.

Hadi içeri dalalım! 🚀

Kimliğe Göre Veri Kümesi Alma

Belirli bir veri kümesi mi arıyorsunuz? Aşağıdaki kod parçacığı ile benzersiz kimliğini kullanarak hızlı bir şekilde getirin. Bu, verileri de dahil olmak üzere temel bilgilere erişmenizi sağlayacaktır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset('<Dataset ID>')  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

Veri Kümesi Oluşturma

Yeni bir projeye başlamaya hazır mısınız? Yeni bir veri kümesi oluşturmak için aşağıdaki adımları izleyin. İhtiyacınız olan tek şey veri kümeniz için kolay bir ad tanımlamak ve create_dataset yöntem.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

Veri Kümesini Güncelleme

Projeler geliştikçe, veri kümeleriniz de gelişmelidir. Veri kümenizin meta verilerini değiştirmeniz gerekirse, aşağıdaki kodu yeni ayrıntılarla çalıştırmak kadar basittir.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

Veri Kümesi Silme

Çalışma alanınızı düzenlemek için veya artık gerekli olmadığı için bir veri kümesini kaldırmanız gerekirse, kalıcı olarak silmek için delete yöntemi burada gösterildiği gibi.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset('<Dataset ID>')  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

Veri Setlerini Listele

Veri kümelerinize göz atmak veya ihtiyacınız olanı bulmak için, tüm veri kümelerinizi sayfalandırma ile listeleyebilirsiniz. Çok sayıda veri kümesiyle uğraşırken faydalıdır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

Depolama Alanından URL Al

Bu kullanışlı işlev, veri kümesi depolama erişimi için bir URL getirerek uzaktan depolanan veri kümesi dosyalarını veya eserleri indirmeyi kolaylaştırır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link 
dataset = client.dataset("<Dataset ID>")    # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

Veri Seti Yükle

Veri setinizi yüklemek basit bir işlemdir. Veri kümenizin kimliğini ve yüklemek istediğiniz dosya yolunu ayarlayın, ardından upload_dataset işlevi aşağıda ayrıntılı olarak açıklanmıştır.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")    # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

Veri kümeleriyle çalışırken sürecin her adımını kontrol etmenin ve doğrulamanın her zaman iyi bir uygulama olduğunu unutmayın. Her şeyin sorunsuz çalıştığından emin olmak için Veri Kümesi Kimliklerinizi ve dosya yollarınızı iki kez kontrol edin.

Herhangi bir sorunla karşılaşırsanız veya herhangi bir sorunuz olursa, güler yüzlü destek ekibimiz her türlü zorluğun üstesinden gelmenize yardımcı olmak için buradadır. 🤝

Verilerinizle oynadığınız için mutlu olun ve modelleriniz doğru ve anlayışlı olsun! 🌟


Yorumlar