SKU-110k ๋ฐ์ดํฐ ์ธํธ
The SKU-110k dataset is a collection of densely packed retail shelf images, designed to support research in object detection tasks. Developed by Eran Goldman et al., the dataset contains over 110,000 unique store keeping unit (SKU) categories with densely packed objects, often looking similar or even identical, positioned in proximity.
Watch: Ultralytics | ๋ฆฌํ
์ผ ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ SKU-110k ๋ฐ์ดํฐ์
์์ YOLOv10์ ํ๋ จํ๋ ๋ฐฉ๋ฒ
์ฃผ์ ๊ธฐ๋ฅ
- SKU-110k์๋ ์ ์ธ๊ณ์ ๋งค์ฅ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ผ๋ฉฐ, ์ต์ฒจ๋จ ๋ฌผ์ฒด ๊ฐ์ง๊ธฐ์ ๋์ ํ ์ ์๋ ๋ฐ์ง๋ ๋ฌผ์ฒด๊ฐ ํน์ง์ ๋๋ค.
- ์ด ๋ฐ์ดํฐ ์ธํธ์๋ 110,000๊ฐ ์ด์์ ๊ณ ์ ํ SKU ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋์ด ์์ด ๋ค์ํ ๊ฐ์ฒด ๋ชจ์์ ์ ๊ณตํฉ๋๋ค.
- ์ฃผ์์๋ ๊ฐ์ฒด์ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ์ด ํฌํจ๋ฉ๋๋ค.
๋ฐ์ดํฐ ์ธํธ ๊ตฌ์กฐ
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํ์ ์งํฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
- ํ๋ จ ์งํฉ: ์ด ํ์ ์งํฉ์๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ด ํฌํจ๋์ด ์์ต๋๋ค.
- ์ ํจ์ฑ ๊ฒ์ฌ ์งํฉ: ์ด ํ์ ์งํฉ์ ํ์ต ์ค ๋ชจ๋ธ ์ ํจ์ฑ ๊ฒ์ฌ์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํ ์คํธ ์ธํธ: ์ด ํ์ ์งํฉ์ ํ์ต๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ์ ์ต์ข ํ๊ฐ๋ฅผ ์ํด ์ค๊ณ๋์์ต๋๋ค.
์ ํ๋ฆฌ์ผ์ด์
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌผ์ฒด ๊ฐ์ง ์์ , ํนํ ์๋งค์ ์ง์ด๋์ ๊ฐ์ด ๋ฐ์ง๋ ์ฅ๋ฉด์์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จํ๊ณ ํ๊ฐํ๋ ๋ฐ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ๋ฐ์ดํฐ ์ธํธ์ ๋ค์ํ SKU ์นดํ ๊ณ ๋ฆฌ์ ๋ฐ์ง๋ ๊ฐ์ฒด ๋ฐฐ์ด์ ์ปดํจํฐ ๋น์ ๋ถ์ผ์ ์ฐ๊ตฌ์์ ์ค๋ฌด์์๊ฒ ์ ์ฉํ ๋ฆฌ์์ค์ ๋๋ค.
๋ฐ์ดํฐ ์ธํธ YAML
๋ฐ์ดํฐ ์ธํธ ๊ตฌ์ฑ์ ์ ์ํ๋ ๋ฐ๋ YAML(๋ ๋ค๋ฅธ ๋งํฌ์
์ธ์ด) ํ์ผ์ด ์ฌ์ฉ๋ฉ๋๋ค. ์ฌ๊ธฐ์๋ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ๋ก, ํด๋์ค ๋ฐ ๊ธฐํ ๊ด๋ จ ์ ๋ณด์ ๋ํ ์ ๋ณด๊ฐ ํฌํจ๋์ด ์์ต๋๋ค. SKU-110K ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ ์ธํธ์ SKU-110K.yaml
ํ์ผ์ ๋ค์ ์์น์์ ์ ์ง๋ฉ๋๋ค. https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/SKU-110K.yaml.
ultralytics/cfg/๋ฐ์ดํฐ์ธํธ/SKU-110K.yaml
# Ultralytics YOLO ๐, AGPL-3.0 license
# SKU-110K retail items dataset https://github.com/eg4000/SKU110K_CVPR19 by Trax Retail
# Documentation: https://docs.ultralytics.com/datasets/detect/sku-110k/
# Example usage: yolo train data=SKU-110K.yaml
# parent
# โโโ ultralytics
# โโโ datasets
# โโโ SKU-110K โ downloads here (13.6 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/SKU-110K # dataset root dir
train: train.txt # train images (relative to 'path') 8219 images
val: val.txt # val images (relative to 'path') 588 images
test: test.txt # test images (optional) 2936 images
# Classes
names:
0: object
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
import shutil
from pathlib import Path
import numpy as np
import pandas as pd
from tqdm import tqdm
from ultralytics.utils.downloads import download
from ultralytics.utils.ops import xyxy2xywh
# Download
dir = Path(yaml['path']) # dataset root dir
parent = Path(dir.parent) # download dir
urls = ['http://trax-geometry.s3.amazonaws.com/cvpr_challenge/SKU110K_fixed.tar.gz']
download(urls, dir=parent)
# Rename directories
if dir.exists():
shutil.rmtree(dir)
(parent / 'SKU110K_fixed').rename(dir) # rename dir
(dir / 'labels').mkdir(parents=True, exist_ok=True) # create labels dir
# Convert labels
names = 'image', 'x1', 'y1', 'x2', 'y2', 'class', 'image_width', 'image_height' # column names
for d in 'annotations_train.csv', 'annotations_val.csv', 'annotations_test.csv':
x = pd.read_csv(dir / 'annotations' / d, names=names).values # annotations
images, unique_images = x[:, 0], np.unique(x[:, 0])
with open((dir / d).with_suffix('.txt').__str__().replace('annotations_', ''), 'w') as f:
f.writelines(f'./images/{s}\n' for s in unique_images)
for im in tqdm(unique_images, desc=f'Converting {dir / d}'):
cls = 0 # single-class dataset
with open((dir / 'labels' / im).with_suffix('.txt'), 'a') as f:
for r in x[images == im]:
w, h = r[6], r[7] # image width, height
xywh = xyxy2xywh(np.array([[r[1] / w, r[2] / h, r[3] / w, r[4] / h]]))[0] # instance
f.write(f"{cls} {xywh[0]:.5f} {xywh[1]:.5f} {xywh[2]:.5f} {xywh[3]:.5f}\n") # write label
์ฌ์ฉ๋ฒ
์ด๋ฏธ์ง ํฌ๊ธฐ๊ฐ 640์ธ 100๊ฐ์ ์ํฌํฌ์ ๋ํ SKU-110K ๋ฐ์ดํฐ ์ธํธ์์ YOLO11n ๋ชจ๋ธ์ ํ๋ จํ๋ ค๋ฉด ๋ค์ ์ฝ๋ ์กฐ๊ฐ์ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์์ ์ ์ฒด ๋ชฉ๋ก์ ๋ชจ๋ธ ํ์ต ํ์ด์ง๋ฅผ ์ฐธ์กฐํ์ธ์.
์ด์ฐจ ์์
์ํ ๋ฐ์ดํฐ ๋ฐ ์ฃผ์
SKU-110k ๋ฐ์ดํฐ ์ธํธ์๋ ๊ฐ์ฒด๊ฐ ๋ฐ์ง๋ ๋ค์ํ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ด ๊ฐ์ฒด ๊ฐ์ง ์์ ์ ๋ํ ํ๋ถํ ์ปจํ ์คํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ค์์ ๋ฐ์ดํฐ ์ธํธ์ ๋ฐ์ดํฐ ์์ ๋ช ๊ฐ์ง์ ํด๋น ์ฃผ์์ ๋๋ค:
- ์กฐ๋ฐํ๊ฒ ํฌ์ฅ๋ ์๋งค์ ์ง์ด๋ ์ด๋ฏธ์ง: ์ด ์ด๋ฏธ์ง๋ ์๋งค์ ์ง์ด๋ ํ๊ฒฝ์์ ์กฐ๋ฐํ๊ฒ ํฌ์ฅ๋ ๊ฐ์ฒด์ ์๋ฅผ ๋ณด์ฌ์ค๋๋ค. ๊ฐ์ฒด์๋ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ๋ก ์ฃผ์์ ๋ฌ์์ต๋๋ค.
์ด ์๋ SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ํฌํจ๋ ๋ฐ์ดํฐ์ ๋ค์์ฑ๊ณผ ๋ณต์ก์ฑ์ ๋ณด์ฌ์ฃผ๋ฉฐ ๋ฌผ์ฒด ๊ฐ์ง ์์ ์์ ๊ณ ํ์ง ๋ฐ์ดํฐ์ ์ค์์ฑ์ ๊ฐ์กฐํฉ๋๋ค.
์ธ์ฉ ๋ฐ ๊ฐ์ฌ
์ฐ๊ตฌ ๋๋ ๊ฐ๋ฐ ์์ ์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ค์ ๋ ผ๋ฌธ์ ์ธ์ฉํด ์ฃผ์ธ์:
์ปดํจํฐ ๋น์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๋ฅผ ์ํ ๊ท์คํ ๋ฆฌ์์ค์ธ SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๋ง๋ค๊ณ ์ ์ง ๊ด๋ฆฌํด ์ฃผ์ Eran Goldman ๋ฑ์๊ฒ ๊ฐ์ฌ์ ๋ง์์ ์ ํฉ๋๋ค. SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ ์์์ ๋ํ ์์ธํ ๋ด์ฉ์ SKU-110k ๋ฐ์ดํฐ ์ธํธ GitHub ๋ฆฌํฌ์งํ ๋ฆฌ์์ ํ์ธํ ์ ์์ต๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌด์์ด๋ฉฐ ๋ฌผ์ฒด ๊ฐ์ง์ ์ค์ํ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
The SKU-110k dataset consists of densely packed retail shelf images designed to aid research in object detection tasks. Developed by Eran Goldman et al., it includes over 110,000 unique SKU categories. Its importance lies in its ability to challenge state-of-the-art object detectors with diverse object appearances and proximity, making it an invaluable resource for researchers and practitioners in computer vision. Learn more about the dataset's structure and applications in our SKU-110k Dataset section.
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์ฌ์ฉํ์ฌ YOLO11 ๋ชจ๋ธ์ ํ๋ จํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ์์ YOLO11 ๋ชจ๋ธ์ ํ๋ จํ๋ ๊ฒ์ ๊ฐ๋จํฉ๋๋ค. ๋ค์์ ์ด๋ฏธ์ง ํฌ๊ธฐ๊ฐ 640์ธ 100๊ฐ์ ์ํฌํฌ์ ๋ํ YOLO11n ๋ชจ๋ธ์ ํ๋ จํ๋ ์์ ์ ๋๋ค:
์ด์ฐจ ์์
์ฌ์ฉ ๊ฐ๋ฅํ ์ธ์์ ์ ์ฒด ๋ชฉ๋ก์ ๋ชจ๋ธ ๊ต์ก ํ์ด์ง๋ฅผ ์ฐธ์กฐํ์ธ์.
SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ฃผ์ ํ์ ์งํฉ์ ๋ฌด์์ธ๊ฐ์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํ์ ์งํฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
- ํ๋ จ ์ธํธ: ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ ํฌํจํฉ๋๋ค.
- ์ ํจ์ฑ ๊ฒ์ฌ ์ธํธ: ํ์ต ์ค ๋ชจ๋ธ ์ ํจ์ฑ ๊ฒ์ฌ์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง์ ์ฃผ์์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ํ ์คํธ ์ธํธ: ํ์ต๋ ๊ฐ์ฒด ๊ฐ์ง ๋ชจ๋ธ์ ์ต์ข ํ๊ฐ๋ฅผ ์ํด ์ค๊ณ๋์์ต๋๋ค.
์์ธํ ๋ด์ฉ์ ๋ฐ์ดํฐ ์ธํธ ๊ตฌ์กฐ ์น์ ์ ์ฐธ์กฐํ์ธ์.
๊ต์ก์ ์ํด SKU-110k ๋ฐ์ดํฐ์ ์ ๊ตฌ์ฑํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ ๊ตฌ์ฑ์ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ๋ก, ํด๋์ค ๋ฐ ๊ธฐํ ๊ด๋ จ ์ ๋ณด์ ๋ํ ์ธ๋ถ ์ ๋ณด๊ฐ ํฌํจ๋ YAML ํ์ผ์ ์ ์๋์ด ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธํธ์ SKU-110K.yaml
ํ์ผ์ ๋ค์ ์์น์์ ์ ์ง๋ฉ๋๋ค. SKU-110K.yaml. ์๋ฅผ ๋ค์ด, ๋ค์๊ณผ ๊ฐ์ด ์ด ๊ตฌ์ฑ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ๋ จํ ์ ์์ต๋๋ค. ์ฌ์ฉ๋ฒ ์น์
์ผ๋ก ์ด๋ํฉ๋๋ค.
๋ฅ๋ฌ๋์ ๋งฅ๋ฝ์์ SKU-110k ๋ฐ์ดํฐ ์ธํธ์ ์ฃผ์ ํน์ง์ ๋ฌด์์ธ๊ฐ์?
SKU-110k ๋ฐ์ดํฐ ์ธํธ์๋ ์ ์ธ๊ณ์ ๋งค์ฅ ์ง์ด๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋์ด ์์ผ๋ฉฐ, ๋ฌผ์ฒด ๊ฐ์ง๊ธฐ์ ์๋นํ ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํ๋ ๋ฐ์ง๋ ๋ฌผ์ฒด๋ฅผ ๋ณด์ฌ์ค๋๋ค:
- 110,000๊ฐ ์ด์์ ๊ณ ์ SKU ์นดํ ๊ณ ๋ฆฌ
- ๋ค์ํ ๊ฐ์ฒด ๋ชจ์
- ์ฃผ์์๋ ๊ฒฝ๊ณ ์์ ๋ฐ SKU ์นดํ ๊ณ ๋ฆฌ ๋ ์ด๋ธ์ด ํฌํจ๋ฉ๋๋ค.
์ด๋ฌํ ๊ธฐ๋ฅ ๋๋ถ์ SKU-110k ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌผ์ฒด ๊ฐ์ง ์์ ์์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จํ๊ณ ํ๊ฐํ๋ ๋ฐ ํนํ ์ ์ฉํฉ๋๋ค. ์์ธํ ๋ด์ฉ์ ์ฃผ์ ๊ธฐ๋ฅ ์น์ ์ ์ฐธ์กฐํ์ธ์.
๋ด ์ฐ๊ตฌ์์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ธ์ฉํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
์ฐ๊ตฌ ๋๋ ๊ฐ๋ฐ ์์ ์ SKU-110k ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ค์ ๋ ผ๋ฌธ์ ์ธ์ฉํด ์ฃผ์ธ์:
๋ฐ์ดํฐ ์งํฉ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์ธ์ฉ ๋ฐ ๊ฐ์ฌ ์น์ ์์ ํ์ธํ ์ ์์ต๋๋ค.