सामग्री पर जाएं

डेटासेट प्रबंधन संचालन के साथ Ultralytics हब-SDK टूल

में आपका स्वागत है Ultralytics हब-एसडीके डेटासेट प्रबंधन दस्तावेज़ीकरण! 👋

मशीन लर्निंग की दुनिया में डेटासेट को कुशलतापूर्वक प्रबंधित करना महत्वपूर्ण है। चाहे आप एक अनुभवी डेटा वैज्ञानिक हों या क्षेत्र में शुरुआत कर रहे हों, डेटासेट संचालन को संभालने का तरीका जानना आपके वर्कफ़्लो को सुव्यवस्थित कर सकता है। यह पृष्ठ डेटासेट पर संचालन करने की मूल बातें शामिल करता है Ultralytics HUB-SDK में Python. दिए गए उदाहरण बताते हैं कि डेटासेट कैसे प्राप्त करें, बनाएं, अपडेट करें, हटाएं, सूची बनाएं, डेटासेट एक्सेस के लिए URL प्राप्त करें और डेटासेट अपलोड करें।

चलो गोता लगाएँ! 🚀

आईडी द्वारा डेटासेट प्राप्त करें

एक विशिष्ट डेटासेट खोज रहे हैं? नीचे दिए गए कोड स्निपेट के साथ इसकी विशिष्ट आईडी का उपयोग करके इसे तेज़ी से प्राप्त करें। यह आपको इसके डेटा सहित आवश्यक जानकारी तक पहुंचने देगा।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

डेटासेट बनाएं

एक नई परियोजना शुरू करने के लिए तैयार हैं? एक नया डेटासेट बनाने के लिए नीचे दिए गए चरणों का पालन करें। आपको बस अपने डेटासेट के लिए एक अनुकूल नाम परिभाषित करना है और create_dataset विधि।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

डेटासेट अपडेट करें

जैसे-जैसे प्रोजेक्ट विकसित होते हैं, वैसे-वैसे आपके डेटासेट भी विकसित होने चाहिए। यदि आपको अपने डेटासेट के मेटाडेटा को संशोधित करने की आवश्यकता है, तो यह नए विवरण के साथ निम्न कोड चलाने जितना आसान है।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

डेटासेट हटाएं

यदि आपको कभी भी डेटासेट को हटाने की आवश्यकता होती है, चाहे अपने कार्यक्षेत्र को अव्यवस्थित करना हो या क्योंकि अब इसकी आवश्यकता नहीं है, तो आप इसे स्थायी रूप से हटा सकते हैं delete मेथड जैसा कि यहां दिखाया गया है।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

सूची डेटासेट

अपने डेटासेट के माध्यम से ब्राउज़ करने या अपनी ज़रूरत का डेटासेट खोजने के लिए, आप अपने सभी डेटासेट को पेजिनेशन के साथ सूचीबद्ध कर सकते हैं। बड़ी संख्या में डेटासेट से निपटने में यह मददगार होता है।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

संग्रहण से URL प्राप्त करें

यह सुविधाजनक फ़ंक्शन डेटासेट स्टोरेज एक्सेस के लिए एक URL प्राप्त करता है, जिससे डेटासेट फ़ाइलों या दूरस्थ रूप से संग्रहीत कलाकृतियों को डाउनलोड करना आसान हो जाता है।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

डेटासेट अपलोड करें

अपना डेटासेट अपलोड करना एक सीधी प्रक्रिया है। अपने डेटासेट की आईडी और उस फ़ाइल पथ को सेट करें जिसे आप अपलोड करना चाहते हैं, फिर upload_dataset नीचे दिए गए विवरण के अनुसार कार्य करें।

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

याद रखें, जब आप डेटासेट के साथ काम कर रहे हों, तो प्रक्रिया के प्रत्येक चरण की जांच और सत्यापन करना हमेशा एक अच्छा अभ्यास होता है। यह सुनिश्चित करने के लिए कि सब कुछ सुचारू रूप से चलता है, अपनी डेटासेट आईडी और फ़ाइल पथ की दोबारा जांच करें।

यदि आपको कोई समस्या आती है या आपके कोई प्रश्न हैं, तो हमारी मित्रवत सहायता टीम किसी भी चुनौती के माध्यम से नेविगेट करने में आपकी सहायता करने के लिए यहां है। 🤝

खुश डेटा तकरार है, और आपके मॉडल सटीक और व्यावहारिक हो सकते हैं! 🌟


टिप्पणियाँ