Ultralytics HUB-SDK๋ฅผ ์ฌ์ฉํ ๋ฐ์ดํฐ ์ธํธ ๊ด๋ฆฌ ์์
Ultralytics HUB-SDK ๋ฐ์ดํฐ ์ธํธ ๊ด๋ฆฌ ๋ฌธ์์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค! ๐
๋ฐ์ดํฐ ์งํฉ์ ํจ์จ์ ์ผ๋ก ๊ด๋ฆฌํ๋ ๊ฒ์ ๋จธ์ ๋ฌ๋์ ์ธ๊ณ์์ ๋งค์ฐ ์ค์ํฉ๋๋ค. ์๋ จ๋ ๋ฐ์ดํฐ ๊ณผํ์๋ ์ด ๋ถ์ผ์ ์ด๋ณด์๋ , ๋ฐ์ดํฐ ์งํฉ ์์ ์ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์ ์๋ฉด ์ํฌํ๋ก์ฐ๋ฅผ ๊ฐ์ํํ ์ ์์ต๋๋ค. ์ด ํ์ด์ง์์๋ Python ์ Ultralytics HUB-SDK๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์ธํธ์์ ์์ ์ ์ํํ๋ ๊ธฐ๋ณธ ์ฌํญ์ ๋ค๋ฃน๋๋ค. ์ ๊ณต๋ ์์ ์์๋ ๋ฐ์ดํฐ ์งํฉ ๊ฐ์ ธ์ค๊ธฐ, ๋ง๋ค๊ธฐ, ์ ๋ฐ์ดํธ, ์ญ์ , ๋ฐ์ดํฐ ์งํฉ ๋์ด, ๋ฐ์ดํฐ ์งํฉ ์ก์ธ์ค๋ฅผ ์ํ URL ๊ฐ์ ธ์ค๊ธฐ ๋ฐ ๋ฐ์ดํฐ ์งํฉ ์ ๋ก๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค.
์์ธํ ์์๋ด ์๋ค! ๐
ID๋ก ๋ฐ์ดํฐ ์งํฉ ๊ฐ์ ธ์ค๊ธฐ
ํน์ ๋ฐ์ดํฐ์ธํธ๋ฅผ ์ฐพ๊ณ ๊ณ์ ๊ฐ์? ์๋ ์ฝ๋ ์ค๋ํซ๊ณผ ํจ๊ป ๊ณ ์ ID๋ฅผ ์ฌ์ฉํ์ฌ ๋น ๋ฅด๊ฒ ๊ฐ์ ธ์ฌ ์ ์์ต๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ํด๋น ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ํ์ ์ ๋ณด์ ์ก์ธ์คํ ์ ์์ต๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Fetch a dataset by ID
dataset = client.dataset("<Dataset ID>") # Replace with your actual Dataset ID
print(dataset.data) # This prints the dataset information
๋ฐ์ดํฐ ์งํฉ ๋ง๋ค๊ธฐ
์ ํ๋ก์ ํธ๋ฅผ ์์ํ ์ค๋น๊ฐ ๋์
จ๋์? ์๋ ๋จ๊ณ์ ๋ฐ๋ผ ์ ๋ฐ์ดํฐ ์งํฉ์ ๋ง๋์ธ์. ๋ฐ์ดํฐ ์งํฉ์ ์ด๋ฆ์ ์น์ํ ์ด๋ฆ์ผ๋ก ์ ์ํ๊ณ create_dataset
๋ฉ์๋๋ฅผ ์ฌ์ฉํฉ๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define your dataset properties
data = {"meta": {"name": "My Dataset"}} # Replace 'My Dataset' with your desired dataset name
# Create the dataset
dataset = client.dataset()
dataset.create_dataset(data)
print("Dataset created successfully!")
๋ฐ์ดํฐ ์งํฉ ์ ๋ฐ์ดํธ
ํ๋ก์ ํธ๊ฐ ๋ฐ์ ํจ์ ๋ฐ๋ผ ๋ฐ์ดํฐ ์ธํธ๋ ๋ฐ์ ํด์ผ ํฉ๋๋ค. ๋ฐ์ดํฐ ์งํฉ์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์์ ํด์ผ ํ๋ ๊ฒฝ์ฐ, ์ ์ธ๋ถ ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์ ์ฝ๋๋ฅผ ์คํํ๊ธฐ๋ง ํ๋ฉด ๋ฉ๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Obtain the dataset
dataset = client.dataset("<Dataset ID>") # Insert the correct Dataset ID
# Update the dataset's metadata
dataset.update({"meta": {"name": "Updated Name"}}) # Modify 'Updated Name' as required
print("Dataset updated with new information.")
๋ฐ์ดํฐ ์งํฉ ์ญ์
์์
๊ณต๊ฐ์ ์ ๋ฆฌํ๊ธฐ ์ํด ๋๋ ๋ ์ด์ ํ์ํ์ง ์์์ ๋ฐ์ดํฐ ์งํฉ์ ์ ๊ฑฐํด์ผ ํ๋ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ ์งํฉ์ ์๊ตฌ์ ์ผ๋ก ์ญ์ ํ ์ ์์ต๋๋ค. delete
๋ฉ์๋๋ฅผ ์ฌ์ฉํฉ๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset by its ID
dataset = client.dataset("<Dataset ID>") # Ensure the Dataset ID is specified
# Delete the dataset
dataset.delete()
print("Dataset has been deleted.")
๋ฐ์ดํฐ ์ธํธ ๋์ด
๋ฐ์ดํฐ ์งํฉ์ ํ์ํ๊ฑฐ๋ ํ์ํ ๋ฐ์ดํฐ ์งํฉ์ ์ฐพ์ผ๋ ค๋ฉด ํ์ด์ง ๋งค๊น์ ์ฌ์ฉํ์ฌ ๋ชจ๋ ๋ฐ์ดํฐ ์งํฉ์ ๋์ดํ ์ ์์ต๋๋ค. ๋ง์ ์์ ๋ฐ์ดํฐ ์งํฉ์ ๋ค๋ฃฐ ๋ ์ ์ฉํฉ๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Retrieve the first page of datasets
dataset = client.dataset_list(page_size=10)
print("Current dataset:", dataset.results) # Show the datasets on the current page
# Move to the next page and show results
dataset.next()
print("Next page result:", dataset.results)
# Go back to the previous page
dataset.previous()
print("Previous page result:", dataset.results)
์ ์ฅ์์์ URL ๊ฐ์ ธ์ค๊ธฐ
์ด ํธ๋ฆฌํ ๊ธฐ๋ฅ์ ๋ฐ์ดํฐ ์ธํธ ์ ์ฅ์ ์ก์ธ์ค๋ฅผ ์ํ URL์ ๊ฐ์ ธ์ค๊ธฐ ๋๋ฌธ์ ์๊ฒฉ์ผ๋ก ์ ์ฅ๋ ๋ฐ์ดํฐ ์ธํธ ํ์ผ์ด๋ ์ํฐํฉํธ๋ฅผ ์ฝ๊ฒ ๋ค์ด๋ก๋ํ ์ ์์ต๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Define the dataset ID for which you want a download link
dataset = client.dataset("<Dataset ID>") # Don't forget to replace Dataset ID with the actual dataset ID
# Retrieve the URL for downloading dataset contents
url = dataset.get_download_link()
print("Download URL:", url)
๋ฐ์ดํฐ ์ธํธ ์ ๋ก๋
๋ฐ์ดํฐ ์ธํธ ์
๋ก๋๋ ๊ฐ๋จํ ๊ณผ์ ์
๋๋ค. ๋ฐ์ดํฐ ์ธํธ์ ID์ ์
๋ก๋ํ๋ ค๋ ํ์ผ ๊ฒฝ๋ก๋ฅผ ์ค์ ํ ๋ค์, ์
๋ก๋ํ๋ ค๋ ๋ฐ์ดํฐ ์ธํธ์ upload_dataset
ํจ์๋ ์๋์์ ์์ธํ ์ค๋ช
ํฉ๋๋ค.
from hub_sdk import HUBClient
credentials = {"api_key": "<YOUR-API-KEY>"}
client = HUBClient(credentials)
# Select the dataset
dataset = client.dataset("<Dataset ID>") # Substitute with the real dataset ID
# Upload the dataset file
dataset.upload_dataset(file="<Dataset File>") # Make sure to specify the correct file path
print("Dataset has been uploaded.")
๋ฐ์ดํฐ ์งํฉ์ผ๋ก ์์ ํ ๋๋ ํญ์ ํ๋ก์ธ์ค์ ๊ฐ ๋จ๊ณ๋ฅผ ํ์ธํ๊ณ ํ์ธํ๋ ๊ฒ์ด ์ข์ ์ต๊ด์ด๋ผ๋ ์ ์ ๊ธฐ์ตํ์ธ์. ๋ฐ์ดํฐ ์ธํธ ID์ ํ์ผ ๊ฒฝ๋ก๋ฅผ ๋ค์ ํ ๋ฒ ํ์ธํ์ฌ ๋ชจ๋ ๊ฒ์ด ์ํํ๊ฒ ์คํ๋๋์ง ํ์ธํ์ธ์.
๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฑฐ๋ ๊ถ๊ธํ ์ ์ด ์์ผ๋ฉด ์น์ ํ ์ง์ํ์์ ๋์๋๋ฆฌ๊ฒ ์ต๋๋ค. ๐ค
ํ๋ณตํ ๋ฐ์ดํฐ ๋ญ๊ธ๋ง์ ํตํด ์ ํํ๊ณ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์๋ ๋ชจ๋ธ์ด ๋๊ธธ ๋ฐ๋๋๋ค! ๐