تخطي إلى المحتوى

إدارة مجموعة البيانات باستخدام Ultralytics HUB-SDK Ultralytics HUB-SDK

مرحبًا بك في وثائق إدارة مجموعة بيانات Ultralytics HUB-SDK! 👋

تعد الإدارة الفعالة لمجموعة البيانات أمرًا بالغ الأهمية في التعلم الآلي. سواءً كنت عالم بيانات متمرسًا أو مبتدئًا، فإن معرفة كيفية التعامل مع عمليات مجموعات البيانات يمكن أن تبسط سير عملك. تغطي هذه الصفحة أساسيات تنفيذ العمليات على مجموعات البيانات باستخدام Ultralytics HUB-SDK في Python. توضّح الأمثلة المقدمة كيفية الحصول على مجموعات البيانات وإنشائها وتحديثها وحذفها وإدراجها، وكذلك كيفية الحصول على عنوان URL للوصول إلى مجموعات البيانات وتحميلها.

دعونا نغوص في! 🚀

الحصول على مجموعة بيانات حسب المعرف

لجلب مجموعة بيانات محددة بسرعة باستخدام معرّفها الفريد، استخدم مقتطف الشفرة أدناه. يتيح لك ذلك الوصول إلى المعلومات الأساسية، بما في ذلك بياناتها.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>")  # Replace with your actual Dataset ID
print(dataset.data)  # This prints the dataset information

لمزيد من التفاصيل حول Datasets وطرقه، انظر فئة مرجع لـ hub_sdk/modules/datasets.py.

إنشاء مجموعة بيانات

لإنشاء مجموعة بيانات جديدة، حدّد اسمًا مألوفًا لمجموعة بياناتك واستخدم أداة create_dataset كما هو موضح أدناه:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define your dataset properties
data = {"meta": {"name": "My Dataset"}}  # Replace 'My Dataset' with your desired dataset name

# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")

انظر create_dataset في مرجع واجهة برمجة التطبيقات API لمزيد من المعلومات.

تحديث مجموعة بيانات

مع تطور المشاريع، قد تحتاج إلى تعديل البيانات الوصفية لمجموعة البيانات الخاصة بك. هذا بسيط مثل تشغيل الشيفرة التالية مع التفاصيل الجديدة:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Obtain the dataset
dataset = client.dataset("<Dataset ID>")  # Insert the correct Dataset ID

# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}})  # Modify 'Updated Name' as required
print("Dataset updated with new information.")

إن update توفر الطريقة مزيدًا من التفاصيل حول تحديث مجموعات البيانات.

حذف مجموعة بيانات

لإزالة مجموعة بيانات، سواء كان ذلك لإزالة الفوضى من مساحة العمل الخاصة بك أو لأنه لم تعد هناك حاجة إليها، يمكنك حذفها نهائيًا عن طريق استدعاء delete الطريقة:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>")  # Ensure the Dataset ID is specified

# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")

لمزيد من المعلومات حول خيارات الحذف، بما في ذلك الحذف الثابت، راجع delete وثائق الطريقة.

قائمة مجموعات البيانات

لتصفح مجموعات البيانات الخاصة بك، قم بإدراج جميع مجموعات البيانات الخاصة بك مع ترقيم الصفحات. هذا مفيد عند التعامل مع عدد كبير من مجموعات البيانات.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Retrieve the first page of datasets
datasets = client.dataset_list(page_size=10)
print("Current dataset:", datasets.results)  # Show the datasets on the current page

# Move to the next page and show results
datasets.next()
print("Next page result:", datasets.results)

# Go back to the previous page
datasets.previous()
print("Previous page result:", datasets.results)

إن DatasetList يوفر الفصل مزيدًا من التفاصيل حول سرد مجموعات البيانات وترقيمها.

الحصول على عنوان URL من التخزين

تقوم هذه الدالة بجلب عنوان URL للوصول إلى تخزين مجموعة البيانات، مما يسهل تنزيل ملفات مجموعة البيانات أو القطع الأثرية المخزنة عن بُعد.

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>")  # Replace Dataset ID with the actual dataset ID

# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)

إن get_download_link توفر وثائق الطريقة تفاصيل إضافية.

تحميل مجموعة البيانات

تحميل مجموعة البيانات الخاصة بك مباشرة. قم بتعيين معرف مجموعة البيانات الخاصة بك ومسار الملف، ثم استخدم أداة upload_dataset الوظيفة:

from hub_sdk import HUBClient

credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)

# Select the dataset
dataset = client.dataset("<Dataset ID>")  # Substitute with the real dataset ID

# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>")  # Specify the correct file path
print("Dataset has been uploaded.")

إن upload_dataset توفر الطريقة مزيدًا من التفاصيل حول تحميل مجموعات البيانات. يمكنك أيضًا التعرف على DatasetUpload الفصل.

تذكر أن تتحقق مرة أخرى من معرّفات مجموعة البيانات ومسارات الملفات لضمان سير كل شيء بسلاسة.

إذا واجهت أي مشاكل أو كانت لديك أسئلة، فإن فريق الدعم لدينا هنا لمساعدتك. 🤝

كل عام وأنتم بخير، وعسى أن تكون نماذجكم دقيقة وثاقبة! 🌟

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات