SKU-110k ๋ฐ์ดํฐ ์ธํธ
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ์กฐ๋ฐํ๊ฒ ํฌ์ฅ๋ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง ๋ชจ์์ผ๋ก, ๋ฌผ์ฒด ๊ฐ์ง ์์ ์ ์ฐ๊ตฌ๋ฅผ ์ง์ํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. Eran Goldman ๋ฑ์ด ๊ฐ๋ฐํ ์ด ๋ฐ์ดํฐ ์ธํธ์๋ ์ ์ฌํ๊ฑฐ๋ ์ฌ์ง์ด ๋์ผํด ๋ณด์ด๋ ๋ฌผ์ฒด๊ฐ ๋ฐ์ง๋์ด ์๊ณ ๊ฐ๊น์ด ๊ณณ์ ๋ฐฐ์น๋ 110,000๊ฐ ์ด์์ ๊ณ ์ ํ SKU(์ํ ๋ถ๋ฅ ๋จ์) ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋์ด ์์ต๋๋ค.
Watch: Ultralytics | ๋ฆฌํ
์ผ ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ SKU-110k ๋ฐ์ดํฐ์
์์ YOLOv10์ ํ๋ จํ๋ ๋ฐฉ๋ฒ
์ฃผ์ ๊ธฐ๋ฅ
- SKU-110k์๋ ์ ์ธ๊ณ์ ๋งค์ฅ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ผ๋ฉฐ, ์ต์ฒจ๋จ ๋ฌผ์ฒด ๊ฐ์ง๊ธฐ์ ๋์ ํ ์ ์๋ ๋ฐ์ง๋ ๋ฌผ์ฒด๊ฐ ํน์ง์ ๋๋ค.
- ์ด ๋ฐ์ดํฐ ์ธํธ์๋ 110,000๊ฐ ์ด์์ ๊ณ ์ ํ SKU ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋์ด ์์ด ๋ค์ํ ๊ฐ์ฒด ๋ชจ์์ ์ ๊ณตํฉ๋๋ค.
- ์ฃผ์์๋ ๊ฐ์ฒด์ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ์ด ํฌํจ๋ฉ๋๋ค.
๋ฐ์ดํฐ ์ธํธ ๊ตฌ์กฐ
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํ์ ์งํฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
- ํ๋ จ ์งํฉ: ์ด ํ์ ์งํฉ์๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ด ํฌํจ๋์ด ์์ต๋๋ค.
- ์ ํจ์ฑ ๊ฒ์ฌ ์งํฉ: ์ด ํ์ ์งํฉ์ ํ์ต ์ค ๋ชจ๋ธ ์ ํจ์ฑ ๊ฒ์ฌ์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํ ์คํธ ์ธํธ: ์ด ํ์ ์งํฉ์ ํ์ต๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ์ ์ต์ข ํ๊ฐ๋ฅผ ์ํด ์ค๊ณ๋์์ต๋๋ค.
์ ํ๋ฆฌ์ผ์ด์
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌผ์ฒด ๊ฐ์ง ์์ , ํนํ ์๋งค์ ์ง์ด๋์ ๊ฐ์ด ๋ฐ์ง๋ ์ฅ๋ฉด์์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จํ๊ณ ํ๊ฐํ๋ ๋ฐ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ๋ฐ์ดํฐ ์ธํธ์ ๋ค์ํ SKU ์นดํ ๊ณ ๋ฆฌ์ ๋ฐ์ง๋ ๊ฐ์ฒด ๋ฐฐ์ด์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์ ์ฐ๊ตฌ์์ ์ค๋ฌด์์๊ฒ ์ ์ฉํ ๋ฆฌ์์ค์ ๋๋ค.
๋ฐ์ดํฐ ์ธํธ YAML
๋ฐ์ดํฐ ์ธํธ ๊ตฌ์ฑ์ ์ ์ํ๋ ๋ฐ๋ YAML(๋ ๋ค๋ฅธ ๋งํฌ์
์ธ์ด) ํ์ผ์ด ์ฌ์ฉ๋ฉ๋๋ค. ์ฌ๊ธฐ์๋ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ๋ก, ํด๋์ค ๋ฐ ๊ธฐํ ๊ด๋ จ ์ ๋ณด์ ๋ํ ์ ๋ณด๊ฐ ํฌํจ๋์ด ์์ต๋๋ค. SKU-110K ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ ์ธํธ์ SKU-110K.yaml
ํ์ผ์ ๋ค์ ์์น์์ ์ ์ง๋ฉ๋๋ค. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/SKU-110K.yaml.
ultralytics/cfg/๋ฐ์ดํฐ์ธํธ/SKU-110K.yaml
# Ultralytics YOLO ๐, AGPL-3.0 license
# SKU-110K retail items dataset https://github.com/eg4000/SKU110K_CVPR19 by Trax Retail
# Documentation: https://docs.ultralytics.com/datasets/detect/sku-110k/
# Example usage: yolo train data=SKU-110K.yaml
# parent
# โโโ ultralytics
# โโโ datasets
# โโโ SKU-110K โ downloads here (13.6 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/SKU-110K # dataset root dir
train: train.txt # train images (relative to 'path') 8219 images
val: val.txt # val images (relative to 'path') 588 images
test: test.txt # test images (optional) 2936 images
# Classes
names:
0: object
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
import shutil
from pathlib import Path
import numpy as np
import pandas as pd
from tqdm import tqdm
from ultralytics.utils.downloads import download
from ultralytics.utils.ops import xyxy2xywh
# Download
dir = Path(yaml['path']) # dataset root dir
parent = Path(dir.parent) # download dir
urls = ['http://trax-geometry.s3.amazonaws.com/cvpr_challenge/SKU110K_fixed.tar.gz']
download(urls, dir=parent)
# Rename directories
if dir.exists():
shutil.rmtree(dir)
(parent / 'SKU110K_fixed').rename(dir) # rename dir
(dir / 'labels').mkdir(parents=True, exist_ok=True) # create labels dir
# Convert labels
names = 'image', 'x1', 'y1', 'x2', 'y2', 'class', 'image_width', 'image_height' # column names
for d in 'annotations_train.csv', 'annotations_val.csv', 'annotations_test.csv':
x = pd.read_csv(dir / 'annotations' / d, names=names).values # annotations
images, unique_images = x[:, 0], np.unique(x[:, 0])
with open((dir / d).with_suffix('.txt').__str__().replace('annotations_', ''), 'w') as f:
f.writelines(f'./images/{s}\n' for s in unique_images)
for im in tqdm(unique_images, desc=f'Converting {dir / d}'):
cls = 0 # single-class dataset
with open((dir / 'labels' / im).with_suffix('.txt'), 'a') as f:
for r in x[images == im]:
w, h = r[6], r[7] # image width, height
xywh = xyxy2xywh(np.array([[r[1] / w, r[2] / h, r[3] / w, r[4] / h]]))[0] # instance
f.write(f"{cls} {xywh[0]:.5f} {xywh[1]:.5f} {xywh[2]:.5f} {xywh[3]:.5f}\n") # write label
์ฌ์ฉ๋ฒ
์ด๋ฏธ์ง ํฌ๊ธฐ๊ฐ 640์ธ 100๊ฐ์ ์ํฌํฌ์ ๋ํ SKU-110K ๋ฐ์ดํฐ ์ธํธ์์ YOLO11n ๋ชจ๋ธ์ ํ๋ จํ๋ ค๋ฉด ๋ค์ ์ฝ๋ ์กฐ๊ฐ์ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์์ ์ ์ฒด ๋ชฉ๋ก์ ๋ชจ๋ธ ํ์ต ํ์ด์ง๋ฅผ ์ฐธ์กฐํ์ธ์.
์ด์ฐจ ์์
์ํ ๋ฐ์ดํฐ ๋ฐ ์ฃผ์
SKU-110k ๋ฐ์ดํฐ ์ธํธ์๋ ๊ฐ์ฒด๊ฐ ๋ฐ์ง๋ ๋ค์ํ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ด ๊ฐ์ฒด ๊ฐ์ง ์์ ์ ๋ํ ํ๋ถํ ์ปจํ ์คํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ค์์ ๋ฐ์ดํฐ ์ธํธ์ ๋ฐ์ดํฐ ์์ ๋ช ๊ฐ์ง์ ํด๋น ์ฃผ์์ ๋๋ค:
- ์กฐ๋ฐํ๊ฒ ํฌ์ฅ๋ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง: ์ด ์ด๋ฏธ์ง๋ ์๋งค์ ์ง์ด๋ ํ๊ฒฝ์์ ์กฐ๋ฐํ๊ฒ ํฌ์ฅ๋ ๊ฐ์ฒด์ ์๋ฅผ ๋ณด์ฌ์ค๋๋ค. ๊ฐ์ฒด์๋ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ๋ก ์ฃผ์์ ๋ฌ์์ต๋๋ค.
์ด ์๋ SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ํฌํจ๋ ๋ฐ์ดํฐ์ ๋ค์์ฑ๊ณผ ๋ณต์ก์ฑ์ ๋ณด์ฌ์ฃผ๋ฉฐ ๋ฌผ์ฒด ๊ฐ์ง ์์ ์์ ๊ณ ํ์ง ๋ฐ์ดํฐ์ ์ค์์ฑ์ ๊ฐ์กฐํฉ๋๋ค.
์ธ์ฉ ๋ฐ ๊ฐ์ฌ
์ฐ๊ตฌ ๋๋ ๊ฐ๋ฐ ์์ ์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ค์ ๋ ผ๋ฌธ์ ์ธ์ฉํด ์ฃผ์ธ์:
์ปดํจํฐ ๋น์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๋ฅผ ์ํ ๊ท์คํ ๋ฆฌ์์ค์ธ SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๋ง๋ค๊ณ ์ ์ง ๊ด๋ฆฌํด ์ฃผ์ Eran Goldman ๋ฑ์๊ฒ ๊ฐ์ฌ์ ๋ง์์ ์ ํฉ๋๋ค. SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ ์์์ ๋ํ ์์ธํ ๋ด์ฉ์ SKU-110k ๋ฐ์ดํฐ ์ธํธ GitHub ๋ฆฌํฌ์งํ ๋ฆฌ์์ ํ์ธํ ์ ์์ต๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌด์์ด๋ฉฐ ๋ฌผ์ฒด ๊ฐ์ง์ ์ค์ํ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌผ์ฒด ๊ฐ์ง ์์ ์ ์ฐ๊ตฌ๋ฅผ ๋๊ธฐ ์ํด ๊ณ ๋ฐ๋๋ก ์์ถ๋ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. Eran Goldman ๋ฑ์ด ๊ฐ๋ฐํ ์ด ๋ฐ์ดํฐ ์ธํธ์๋ 110,000๊ฐ ์ด์์ ๊ณ ์ ํ SKU ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋์ด ์์ต๋๋ค. ๋ค์ํ ๋ฌผ์ฒด ๋ชจ์๊ณผ ๊ทผ์ ํ ๊ฑฐ๋ฆฌ์ ์๋ ์ต์ฒจ๋จ ๋ฌผ์ฒด ๊ฐ์ง๊ธฐ์ ๋์ ํ ์ ์๋ค๋ ์ ์์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์ ์ฐ๊ตฌ์์ ์ค๋ฌด์์๊ฒ ๊ท์คํ ๋ฆฌ์์ค๋ก ํ์ฉ๋ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธํธ์ ๊ตฌ์กฐ์ ํ์ฉ์ ๋ํ ์์ธํ ๋ด์ฉ์ SKU-110k ๋ฐ์ดํฐ ์ธํธ ์น์ ์์ ํ์ธํ์ธ์.
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์ฌ์ฉํ์ฌ YOLO11 ๋ชจ๋ธ์ ํ๋ จํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ์์ YOLO11 ๋ชจ๋ธ์ ํ๋ จํ๋ ๊ฒ์ ๊ฐ๋จํฉ๋๋ค. ๋ค์์ ์ด๋ฏธ์ง ํฌ๊ธฐ๊ฐ 640์ธ 100๊ฐ์ ์ํฌํฌ์ ๋ํ YOLO11n ๋ชจ๋ธ์ ํ๋ จํ๋ ์์ ์ ๋๋ค:
์ด์ฐจ ์์
์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์์ ์ ์ฒด ๋ชฉ๋ก์ ๋ชจ๋ธ ๊ต์ก ํ์ด์ง๋ฅผ ์ฐธ์กฐํ์ธ์.
SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ฃผ์ ํ์ ์งํฉ์ ๋ฌด์์ธ๊ฐ์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํ์ ์งํฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
- ํ๋ จ ์ธํธ: ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ ํฌํจํฉ๋๋ค.
- ์ ํจ์ฑ ๊ฒ์ฌ ์ธํธ: ํ์ต ์ค ๋ชจ๋ธ ์ ํจ์ฑ ๊ฒ์ฌ์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํ ์คํธ ์ธํธ: ํ์ต๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ์ ์ต์ข ํ๊ฐ๋ฅผ ์ํด ์ค๊ณ๋์์ต๋๋ค.
์์ธํ ๋ด์ฉ์ ๋ฐ์ดํฐ ์ธํธ ๊ตฌ์กฐ ์น์ ์ ์ฐธ์กฐํ์ธ์.
๊ต์ก์ ์ํด SKU-110k ๋ฐ์ดํฐ์ ์ ๊ตฌ์ฑํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ ๊ตฌ์ฑ์ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ๋ก, ํด๋์ค ๋ฐ ๊ธฐํ ๊ด๋ จ ์ ๋ณด์ ๋ํ ์ธ๋ถ ์ ๋ณด๊ฐ ํฌํจ๋ YAML ํ์ผ์ ์ ์๋์ด ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธํธ์ SKU-110K.yaml
ํ์ผ์ ๋ค์ ์์น์์ ์ ์ง๋ฉ๋๋ค. SKU-110K.yaml. ์๋ฅผ ๋ค์ด, ๋ค์๊ณผ ๊ฐ์ด ์ด ๊ตฌ์ฑ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ๋ จํ ์ ์์ต๋๋ค. ์ฌ์ฉ๋ฒ ์น์
์ผ๋ก ์ด๋ํฉ๋๋ค.
๋ฅ๋ฌ๋์ ๋งฅ๋ฝ์์ SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ฃผ์ ํน์ง์ ๋ฌด์์ธ๊ฐ์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ์๋ ์ ์ธ๊ณ์ ๋งค์ฅ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ผ๋ฉฐ, ๋ฌผ์ฒด ๊ฐ์ง๊ธฐ์ ์๋นํ ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํ๋ ๋ฐ์ง๋ ๋ฌผ์ฒด๋ฅผ ๋ณด์ฌ์ค๋๋ค:
- 110,000๊ฐ ์ด์์ ๊ณ ์ SKU ์นดํ ๊ณ ๋ฆฌ
- ๋ค์ํ ๊ฐ์ฒด ๋ชจ์
- ์ฃผ์์๋ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ์ด ํฌํจ๋ฉ๋๋ค.
์ด๋ฌํ ๊ธฐ๋ฅ ๋๋ถ์ SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌผ์ฒด ๊ฐ์ง ์์ ์์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จํ๊ณ ํ๊ฐํ๋ ๋ฐ ํนํ ์ ์ฉํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ ์ฃผ์ ๊ธฐ๋ฅ ์น์ ์ ์ฐธ์กฐํ์ธ์.
๋ด ์ฐ๊ตฌ์์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ธ์ฉํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
์ฐ๊ตฌ ๋๋ ๊ฐ๋ฐ ์์ ์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ค์ ๋ ผ๋ฌธ์ ์ธ์ฉํด ์ฃผ์ธ์:
๋ฐ์ดํฐ ์งํฉ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์ธ์ฉ ๋ฐ ๊ฐ์ฌ ์น์ ์์ ํ์ธํ ์ ์์ต๋๋ค.