انتقل إلى المحتوى

عمليات إدارة مجموعة البيانات مع Ultralytics HUB-SDK

مرحبا بكم في Ultralytics وثائق إدارة مجموعة بيانات HUB-SDK! 👋

تعد إدارة مجموعات البيانات بكفاءة أمرا بالغ الأهمية في عالم التعلم الآلي. سواء كنت عالم بيانات متمرسا أو مبتدئا في هذا المجال، فإن معرفة كيفية التعامل مع عمليات مجموعة البيانات يمكن أن تبسط سير عملك. تغطي هذه الصفحة أساسيات تنفيذ العمليات على مجموعات البيانات باستخدام Ultralytics HUB-SDK في Python. توضح الأمثلة المقدمة كيفية الحصول على مجموعات البيانات وإنشائها وتحديثها وحذفها وإدراجها والحصول على عنوان URL للوصول إلى مجموعة البيانات وتحميل مجموعات البيانات.

دعنا نتعمق! 🚀

الحصول على مجموعة بيانات حسب المعرف

هل تبحث عن مجموعة بيانات محددة؟ قم بجلبه بسرعة باستخدام المعرف الفريد الخاص به مع مقتطف الشفرة أدناه. سيتيح لك ذلك الوصول إلى المعلومات الأساسية ، بما في ذلك بياناتها.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset('<Dataset ID>')  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

إنشاء مجموعة بيانات

هل أنت مستعد لبدء مشروع جديد؟ اتبع الخطوات أدناه لإنشاء مجموعة بيانات جديدة. كل ما تحتاجه هو تحديد اسم مألوف لمجموعة البيانات الخاصة بك واستخدام create_dataset أسلوب.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

تحديث مجموعة بيانات

مع تطور المشاريع ، يجب أن تتطور مجموعات البيانات الخاصة بك. إذا كنت بحاجة إلى تعديل البيانات الوصفية لمجموعة البيانات الخاصة بك ، فسيكون الأمر بسيطا مثل تشغيل الكود التالي بالتفاصيل الجديدة.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

حذف مجموعة بيانات

إذا احتجت في أي وقت إلى إزالة مجموعة بيانات، سواء لترتيب مساحة العمل الخاصة بك أو لأنه لم تعد هناك حاجة إليها، فيمكنك حذفها نهائيا عن طريق استدعاء delete الطريقة كما هو موضح هنا.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset('<Dataset ID>')  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

قائمة مجموعات البيانات

لتصفح مجموعات البيانات الخاصة بك أو العثور على المجموعة التي تحتاجها ، يمكنك سرد جميع مجموعات البيانات الخاصة بك مع ترقيم الصفحات. إنه مفيد عند التعامل مع عدد كبير من مجموعات البيانات.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results)  # Show the datasets on the current page

# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)

# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)

الحصول على عنوان URL من التخزين

تجلب هذه الوظيفة المريحة عنوان URL للوصول إلى تخزين مجموعة البيانات ، مما يجعل تنزيل ملفات مجموعة البيانات أو القطع الأثرية المخزنة عن بعد أمرا سهلا.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link 
dataset = client.dataset("<Dataset ID>")    # Don't forget to replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

تحميل مجموعة البيانات

يعد تحميل مجموعة البيانات الخاصة بك عملية مباشرة. قم بتعيين معرف مجموعة البيانات الخاصة بك ومسار الملف الذي ترغب في تحميله ، ثم استخدم upload_dataset وظيفة كما هو مفصل أدناه.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")    # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Make sure to specify the correct file path
print("Dataset has been uploaded.")

تذكر أنه عند العمل مع مجموعات البيانات ، من الممارسات الجيدة دائما التحقق من كل خطوة من خطوات العملية والتحقق منها. تحقق جيدا من معرفات مجموعة البيانات ومسارات الملفات لضمان سير كل شيء بسلاسة.

إذا واجهت أي مشاكل أو كان لديك أي أسئلة ، فإن فريق الدعم الودود لدينا موجود هنا لمساعدتك في التغلب على أي تحديات. 🤝

جدل سعيد حول البيانات ، وقد تكون نماذجك دقيقة وثاقبة! 🌟


التعليقات