Ultralytics HUB-SDK ile Veri Kümesi Yönetimi
Ultralytics HUB-SDK Veri Kümesi Yönetimi belgelerine hoş geldiniz! 👋
Verimli veri kümesi yönetimi makine öğreniminde çok önemlidir. İster deneyimli bir veri bilimcisi ister yeni başlayan biri olun, veri kümesi işlemlerini nasıl yapacağınızı bilmek iş akışınızı kolaylaştırabilir. Bu sayfa, Python'da Ultralytics HUB-SDK kullanarak veri kümeleri üzerinde işlem yapmanın temellerini kapsar. Verilen örnekler, veri kümelerinin nasıl alınacağını, oluşturulacağını, güncelleneceğini, silineceğini ve listeleneceğini ve ayrıca veri kümesi erişimi için bir URL'nin nasıl alınacağını ve veri kümelerinin nasıl yükleneceğini göstermektedir.
Hadi içeri dalalım! 🚀
Kimliğe Göre Veri Kümesi Alma
Belirli bir veri kümesini benzersiz kimliğini kullanarak hızlı bir şekilde almak için aşağıdaki kod parçacığını kullanın. Bu, verileri de dahil olmak üzere temel bilgilere erişmenizi sağlar.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>") # Replace with your actual Dataset ID
print(dataset.data) # This prints the dataset information
Daha fazla ayrıntı için Datasets
sınıfını ve yöntemlerini incelemek için Referans için hub_sdk/modules/datasets.py
.
Veri Kümesi Oluşturma
Yeni bir veri kümesi oluşturmak için, veri kümeniz için kolay bir ad tanımlayın ve create_dataset
yöntemi aşağıda gösterildiği gibi:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define your dataset properties
data = {"meta": {"name": "My Dataset"}} # Replace 'My Dataset' with your desired dataset name
# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")
Bkz. create_dataset
Daha fazla bilgi için API referansındaki yöntem.
Veri Kümesini Güncelleme
Projeler geliştikçe, veri kümenizin meta verilerini değiştirmeniz gerekebilir. Bu, aşağıdaki kodu yeni ayrıntılarla çalıştırmak kadar basittir:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Obtain the dataset
dataset = client.dataset("<Dataset ID>") # Insert the correct Dataset ID
# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}}) # Modify 'Updated Name' as required
print("Dataset updated with new information.")
Bu update
yöntemi, veri kümelerinin güncellenmesi hakkında daha fazla ayrıntı sağlar.
Veri Kümesi Silme
Bir veri kümesini kaldırmak için, ister çalışma alanınızı düzenlemek için ister artık ihtiyaç duyulmadığı için olsun, kalıcı olarak silebilirsiniz. delete
yöntem:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>") # Ensure the Dataset ID is specified
# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")
Sert silmeler de dahil olmak üzere silme seçenekleri hakkında daha fazla bilgi için bkz. delete
yöntem dokümantasyonu.
Veri Setlerini Listele
Veri kümelerinize göz atmak için, tüm veri kümelerinizi sayfalandırma ile listeleyin. Bu, çok sayıda veri kümesiyle uğraşırken faydalıdır.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results) # Show the datasets on the current page
# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)
# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)
Bu DatasetList
sınıfı, veri kümelerinin listelenmesi ve sayfalandırılması hakkında daha fazla ayrıntı sağlar.
Depolama Alanından URL Al
Bu işlev, veri kümesi depolama erişimi için bir URL getirerek uzaktan depolanan veri kümesi dosyalarını veya eserleri indirmeyi kolaylaştırır.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>") # Replace Dataset ID with the actual dataset ID
# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)
Bu get_download_link
yöntem belgeleri ek ayrıntılar sağlar.
Veri Seti Yükle
Veri setinizi yüklemek oldukça basittir. Veri kümenizin kimliğini ve dosya yolunu ayarlayın, ardından upload_dataset
fonksiyon:
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset
dataset = client.dataset("<Dataset ID>") # Substitute with the real dataset ID
# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>") # Specify the correct file path
print("Dataset has been uploaded.")
Bu upload_dataset
yöntemi, veri kümelerinin yüklenmesi hakkında daha fazla ayrıntı sağlar. Ayrıca ilgili yöntem hakkında bilgi edinebilirsiniz DatasetUpload
Sınıf.
Her şeyin sorunsuz çalıştığından emin olmak için Veri Kümesi Kimliklerinizi ve dosya yollarınızı iki kez kontrol etmeyi unutmayın.
Herhangi bir sorunla karşılaşırsanız veya sorularınız varsa, destek ekibimiz size yardımcı olmak için burada. 🤝
Verilerinizle oynadığınız için mutlu olun ve modelleriniz doğru ve anlayışlı olsun! 🌟