๋ฐ์ดํฐ ์ธํธ ๊ฐ์
Ultralytics ๋ ๊ฐ์ง, ์ธ์คํด์ค ๋ถํ , ํฌ์ฆ ์ถ์ , ๋ถ๋ฅ ๋ฐ ๋ค์ค ๊ฐ์ฒด ์ถ์ ๊ณผ ๊ฐ์ ์ปดํจํฐ ๋น์ ์์ ์ ์ฉ์ดํ๊ฒ ํ๊ธฐ ์ํด ๋ค์ํ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์ง์ํฉ๋๋ค. ์๋๋ ์ฃผ์ Ultralytics ๋ฐ์ดํฐ ์ธํธ ๋ชฉ๋ก๊ณผ ๊ฐ ์ปดํจํฐ ๋น์ ์์ ๋ฐ ํด๋น ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ์์ฝ์ ๋๋ค.
Watch: Ultralytics ๋ฐ์ดํฐ ์ธํธ ๊ฐ์
์ ๊ท ๐ Ultralytics ํ์๊ธฐ
๋ฐ์ดํฐ ์ธํธ์ ๋ํ ์๋ฒ ๋ฉ์ ๋ง๋ค๊ณ , ์ ์ฌํ ์ด๋ฏธ์ง๋ฅผ ๊ฒ์ํ๊ณ , SQL ์ฟผ๋ฆฌ๋ฅผ ์คํํ๊ณ , ์๋งจํฑ ๊ฒ์์ ์ํํ๊ณ , ์์ฐ์ด๋ฅผ ์ฌ์ฉํด ๊ฒ์ํ ์๋ ์์ต๋๋ค! ์ ํฌ์ GUI ์ฑ์ผ๋ก ์์ํ๊ฑฐ๋ API๋ฅผ ์ฌ์ฉํด ์ง์ ๊ตฌ์ถํ ์ ์์ต๋๋ค. ์ฌ๊ธฐ์์ ์์ธํ ์์๋ณด์ธ์.
- GUI ๋ฐ๋ชจ ์ฒดํํ๊ธฐ
- ํ์๊ธฐ API์ ๋ํด ์์ธํ ์์๋ณด๊ธฐ
๋ฌผ์ฒด ๊ฐ์ง
๊ฒฝ๊ณ ์์ ๊ฐ์ฒด ๊ฐ์ง๋ ๊ฐ ๊ฐ์ฒด ์ฃผ์์ ๊ฒฝ๊ณ ์์๋ฅผ ๊ทธ๋ ค ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๊ณ ์์น๋ฅผ ํ์ ํ๋ ์ปดํจํฐ ๋น์ ๊ธฐ๋ฒ์ ๋๋ค.
- Argoverse: ํ๋ถํ ์ฃผ์์ด ํฌํจ๋ ๋์ ํ๊ฒฝ์ 3D ์ถ์ ๋ฐ ๋ชจ์ ์์ธก ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- COCO: ์ปจํ ์คํธ ๋ด ๊ณตํต ๊ฐ์ฒด(COCO)๋ 80๊ฐ์ ๊ฐ์ฒด ๋ฒ์ฃผ๋ก ๊ตฌ์ฑ๋ ๋๊ท๋ชจ ๊ฐ์ฒด ๊ฐ์ง, ์ธ๋ถํ ๋ฐ ์บก์ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- LVIS: 1203๊ฐ์ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋ ๋๊ท๋ชจ ๊ฐ์ฒด ๊ฐ์ง, ์ธ๋ถํ ๋ฐ ์บก์ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- COCO8: ๋น ๋ฅธ ํ ์คํธ์ ์ ํฉํ COCO train ๋ฐ COCO val์ ์ฒ์ 4๊ฐ ์ด๋ฏธ์ง์ ์์ ํ์ ์งํฉ์ ๋๋ค.
- COCO128: A smaller subset of the first 128 images from COCO train and COCO val, suitable for tests.
- ๊ธ๋ก๋ฒ ๋ฐ 2020: ๊ธ๋ก๋ฒ ๋ฐ ์ฑ๋ฆฐ์ง 2020์ ๋ฐ ๋จธ๋ฆฌ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- Objects365: 365๊ฐ์ ๋ฌผ์ฒด ์นดํ ๊ณ ๋ฆฌ์ 60๋ง ๊ฐ ์ด์์ ์ฃผ์์ด ๋ฌ๋ฆฐ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๊ณ ํ์ง์ ๋๊ท๋ชจ ๋ฌผ์ฒด ๊ฐ์ง ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- OpenImagesV7: 170๋ง ๊ฐ์ ์ด์ฐจ ์ด๋ฏธ์ง์ 4๋ง 2์ฒ ๊ฐ์ ์ ํจ์ฑ ๊ฒ์ฌ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ Google ์ ํฌ๊ด์ ์ธ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- SKU-110K: 11K ๊ฐ ์ด์์ ์ด๋ฏธ์ง์ 170๋ง ๊ฐ์ ๊ฒฝ๊ณ ์์๋ก ๊ตฌ์ฑ๋ ์๋งค ํ๊ฒฝ์์์ ๊ณ ๋ฐ๋ ๋ฌผ์ฒด ๊ฐ์ง ๊ธฐ๋ฅ์ ๊ฐ์ถ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- VisDrone: 10K ์ด์์ ์ด๋ฏธ์ง์ ๋น๋์ค ์ํ์ค๊ฐ ํฌํจ๋ ๋๋ก ์ผ๋ก ์บก์ฒํ ์ด๋ฏธ์ง์ ๊ฐ์ฒด ๊ฐ์ง ๋ฐ ๋ค์ค ๊ฐ์ฒด ์ถ์ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- VOC: 20๊ฐ์ ๊ฐ์ฒด ํด๋์ค์ 11,000๊ฐ ์ด์์ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๊ฐ์ฒด ๊ฐ์ง ๋ฐ ๋ถํ ์ ์ํ ํ์ค์นผ ์๊ฐ ๊ฐ์ฒด ํด๋์ค(VOC) ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- xView: 60๊ฐ์ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ์ 100๋ง ๊ฐ ์ด์์ ์ฃผ์์ด ๋ฌ๋ฆฐ ์ค๋ฒํค๋ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- Roboflow 100: ํฌ๊ด์ ์ธ ๋ชจ๋ธ ํ๊ฐ๋ฅผ ์ํด 7๊ฐ ์ด๋ฏธ์ง ์์ญ์ ๊ฑธ์ณ 100๊ฐ์ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ํฌํจํ๋ ๋ค์ํ ๋ฌผ์ฒด ๊ฐ์ง ๋ฒค์น๋งํฌ์ ๋๋ค.
- ๋์ข ์: ๋์ข ์์ ๊ฐ์งํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ธํธ์๋ ์ข ์์ ์กด์ฌ ์ฌ๋ถ, ์์น ๋ฐ ํน์ฑ์ ๋ํ ์ธ๋ถ ์ ๋ณด๊ฐ ํฌํจ๋ MRI ๋๋ CT ์ค์บ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ฉ๋๋ค.
- ์ํ๋ฆฌ์นด ์ผ์๋๋ฌผ: ๋ฒํ๋ก, ์ฝ๋ผ๋ฆฌ, ์ฝ๋ฟ์, ์ผ๋ฃฉ๋ง ๋ฑ ์ํ๋ฆฌ์นด ์ผ์๋๋ฌผ์ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- ์๋ช : ์๋ช : ์ฃผ์์ด ๋ฌ๋ฆฐ ์๋ช ์ด ์๋ ๋ค์ํ ๋ฌธ์ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ ์ธํธ๋ก, ๋ฌธ์ ๊ฒ์ฆ ๋ฐ ์ฌ๊ธฐ ํ์ง ์ฐ๊ตฌ๋ฅผ ์ง์ํฉ๋๋ค.
์ธ์คํด์ค ์ธ๋ถํ
์ธ์คํด์ค ๋ถํ ์ ํฝ์ ์์ค์์ ์ด๋ฏธ์ง์ ๊ฐ์ฒด๋ฅผ ์๋ณํ๊ณ ์์น๋ฅผ ํ์ ํ๋ ์ปดํจํฐ ๋น์ ๊ธฐ๋ฒ์ ๋๋ค.
- COCO: 200๋ง ๊ฐ ์ด์์ ๋ ์ด๋ธ์ด ์ง์ ๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๊ฐ์ฒด ๊ฐ์ง, ๋ถํ ๋ฐ ์บก์ ์์ ์ ์ํด ์ค๊ณ๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- COCO8-seg: ์ธ๋ถํ ์ฃผ์์ด ์๋ 8๊ฐ์ COCO ์ด๋ฏธ์ง ํ์ ์งํฉ์ ํฌํจํ๋ ์ธ์คํด์ค ์ธ๋ถํ ์์ ์ ์ํ ๋ ์์ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- COCO128-seg: A smaller dataset for instance segmentation tasks, containing a subset of 128 COCO images with segmentation annotations.
- ๊ท ์ด ์ธ๊ทธ๋จผํธ: ๋๋ก์ ๋ฒฝ์ ๊ท ์ด์ ๊ฐ์งํ๊ธฐ ์ํด ํน๋ณํ ์ ์๋ ๋ฐ์ดํฐ ์ธํธ๋ก, ๋ฌผ์ฒด ๊ฐ์ง ๋ฐ ๋ถํ ์์ ์ ๋ชจ๋ ์ฌ์ฉํ ์ ์์ต๋๋ค.
- ํจํค์ง ์ธ๊ทธ๋จผํธ: ์ฐฝ๊ณ ๋๋ ์ฐ์ ํ๊ฒฝ์์ ํจํค์ง๋ฅผ ์๋ณํ๊ธฐ ์ํ ๋ง์ถคํ ๋ฐ์ดํฐ ์ธํธ๋ก, ๋ฌผ์ฒด ๊ฐ์ง ๋ฐ ์ธ๋ถํ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ชจ๋ ์ ํฉํฉ๋๋ค.
- Carparts-seg: ์ฐจ๋ ๋ถํ์ ์๋ณํ๊ธฐ ์ํด ํน๋ณํ ์ ์๋ ๋ฐ์ดํฐ ์ธํธ๋ก, ์ค๊ณ, ์ ์กฐ ๋ฐ ์ฐ๊ตฌ ์๊ตฌ ์ฌํญ์ ์ถฉ์กฑํฉ๋๋ค. ๊ฐ์ฒด ๊ฐ์ง ๋ฐ ์ธ๋ถํ ์์ ์ ๋ชจ๋ ์ฌ์ฉ๋ฉ๋๋ค.
ํฌ์ฆ ์ถ์
ํฌ์ฆ ์ถ์ ์ ์นด๋ฉ๋ผ ๋๋ ์๋ ์ขํ๊ณ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ค๋ธ์ ํธ์ ํฌ์ฆ๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๊ธฐ์ ์ ๋๋ค.
- COCO: ํฌ์ฆ ์ถ์ ์์ ์ ์ํด ์ค๊ณ๋ ์ฌ๋ ํฌ์ฆ ์ฃผ์์ด ํฌํจ๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- COCO8-pose: ํฌ์ฆ ์ถ์ ์์ ์ ์ํ ๋ ์์ ๋ฐ์ดํฐ ์งํฉ์ผ๋ก, ์ฌ๋์ ํฌ์ฆ ์ฃผ์์ด ์๋ 8๊ฐ์ COCO ์ด๋ฏธ์ง ํ์ ์งํฉ์ ํฌํจํฉ๋๋ค.
- ํธ๋์ด ํฌ์ฆ: ํธ๋์ด์ ์ด์ ์ ๋ง์ถ 263๊ฐ์ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋ ์ปดํฉํธํ ๋ฐ์ดํฐ ์ธํธ๋ก, ํฌ์ฆ ์ถ์ ์์ ์ ์ํด ํธ๋์ด๋น 12๊ฐ์ ํคํฌ์ธํธ๊ฐ ์ฃผ์ ์ฒ๋ฆฌ๋์ด ์์ต๋๋ค.
๋ถ๋ฅ
์ด๋ฏธ์ง ๋ถ๋ฅ๋ ์๊ฐ์ ์ฝํ ์ธ ์ ๋ฐ๋ผ ์ด๋ฏธ์ง๋ฅผ ํ๋ ์ด์์ ์ฌ์ ์ ์๋ ํด๋์ค ๋๋ ์นดํ ๊ณ ๋ฆฌ๋ก ๋ถ๋ฅํ๋ ์ปดํจํฐ ๋น์ ์์ ์ ๋๋ค.
- Caltech 101: ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ ์ํ 101๊ฐ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ์ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- Caltech 256: 256๊ฐ์ ๊ฐ์ฒด ๋ฒ์ฃผ์ ๋ ์ด๋ ค์ด ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ Caltech 101์ ํ์ฅ ๋ฒ์ ์ ๋๋ค.
- CIFAR-10: 10๊ฐ์ ํด๋์ค๋ก ๊ตฌ์ฑ๋ 60K 32x32 ์ปฌ๋ฌ ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์ธํธ(ํด๋์ค๋น 6K ์ด๋ฏธ์ง)์ ๋๋ค.
- CIFAR-100: 100๊ฐ์ ๊ฐ์ฒด ์นดํ ๊ณ ๋ฆฌ์ ํด๋์ค๋น 600๊ฐ์ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ CIFAR-10์ ํ์ฅ ๋ฒ์ ์ ๋๋ค.
- Fashion-MNIST: ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ ์ํ 10๊ฐ์ง ํจ์ ์นดํ ๊ณ ๋ฆฌ์ 70,000๊ฐ ํ๋ฐฑ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- ImageNet: 1,400๋ง ๊ฐ ์ด์์ ์ด๋ฏธ์ง์ 20,000๊ฐ ์ด์์ ์นดํ ๊ณ ๋ฆฌ๊ฐ ํฌํจ๋ ๋ฌผ์ฒด ๊ฐ์ง ๋ฐ ์ด๋ฏธ์ง ๋ถ๋ฅ๋ฅผ ์ํ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- ImageNet-10: ๋ ๋น ๋ฅธ ์คํ๊ณผ ํ ์คํธ๋ฅผ ์ํด 10๊ฐ์ ์นดํ ๊ณ ๋ฆฌ๋ก ๊ตฌ์ฑ๋ ImageNet์ ์์ ํ์ ์งํฉ์ ๋๋ค.
- ์ด๋ฏธ์ง๋ท: ๋ ๋น ๋ฅธ ๊ต์ก๊ณผ ํ ์คํธ๋ฅผ ์ํด ์ฝ๊ฒ ๊ตฌ๋ถํ ์ ์๋ 10๊ฐ์ ํด๋์ค๋ฅผ ํฌํจํ๋ ImageNet์ ์์ ํ์ ์งํฉ์ ๋๋ค.
- ์ด๋ฏธ์ง ์ฐํ: ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ ์ํ 10๊ฐ์ง ๊ฒฌ์ข ์นดํ ๊ณ ๋ฆฌ๋ฅผ ํฌํจํ๋ ImageNet์ ๋ ๊น๋ค๋ก์ด ํ์ ์งํฉ์ ๋๋ค.
- MNIST: ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ ์ํ 70,000๊ฐ์ ์์ผ๋ก ์ด ์ซ์๋ก ๊ตฌ์ฑ๋ ํ์์กฐ ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
OBB(์ค๋ฆฌ์ํฐ๋ ๋ฐ์ด๋ฉ ๋ฐ์ค)
์ค๋ฆฌ์ํฐ๋ ๋ฐ์ด๋ฉ ๋ฐ์ค(OBB)๋ ํ์ ๋ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง์์ ๊ฐ์ง ๋ฌผ์ฒด๋ฅผ ๊ฐ์งํ๋ ์ปดํจํฐ ๋น์ ์ ํ ๋ฐฉ๋ฒ์ผ๋ก, ํญ๊ณต ๋ฐ ์์ฑ ์ด๋ฏธ์ง์ ์ฃผ๋ก ์ ์ฉ๋ฉ๋๋ค.
- DOTA-v2: 170๋ง ๊ฐ์ ์ธ์คํด์ค์ 11,268๊ฐ์ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋ ์ธ๊ธฐ ์๋ OBB ํญ๊ณต ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- DOTA8: A smaller subset of the first 8 images from the DOTAv1 split set, 4 for training and 4 for validation, suitable for quick tests.
๋ค์ค ๊ฐ์ฒด ์ถ์
๋ค์ค ๊ฐ์ฒด ์ถ์ ์ ๋น๋์ค ์ํ์ค์์ ์๊ฐ ๊ฒฝ๊ณผ์ ๋ฐ๋ผ ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๊ณ ์ถ์ ํ๋ ์ปดํจํฐ ๋น์ ๊ธฐ์ ์ ๋๋ค.
- Argoverse: ๋ค์ค ๊ฐ์ฒด ์ถ์ ์์ ์ ์ํ ํ๋ถํ ์ฃผ์์ด ํฌํจ๋ ๋์ ํ๊ฒฝ์ 3D ์ถ์ ๋ฐ ๋ชจ์ ์์ธก ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- VisDrone: 10K ์ด์์ ์ด๋ฏธ์ง์ ๋น๋์ค ์ํ์ค๊ฐ ํฌํจ๋ ๋๋ก ์ผ๋ก ์บก์ฒํ ์ด๋ฏธ์ง์ ๊ฐ์ฒด ๊ฐ์ง ๋ฐ ๋ค์ค ๊ฐ์ฒด ์ถ์ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
์ ๋ฐ์ดํฐ ์ธํธ ๊ธฐ์ฌ
์ ๋ฐ์ดํฐ ์งํฉ์ ๊ธฐ์ฌํ๋ ค๋ฉด ๊ธฐ์กด ์ธํ๋ผ์ ์ ๋ง๋๋ก ํ๊ธฐ ์ํด ๋ช ๊ฐ์ง ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ์ผ ํฉ๋๋ค. ๋ค์์ ํ์ํ ๋จ๊ณ์ ๋๋ค:
์ ๋ฐ์ดํฐ ์งํฉ์ ๊ธฐ์ฌํ๋ ๋จ๊ณ
- ์ด๋ฏธ์ง ์์ง: ๋ฐ์ดํฐ ์งํฉ์ ์ํ ์ด๋ฏธ์ง๋ฅผ ์์งํฉ๋๋ค. ๊ณต๊ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์์ฒด ์ปฌ๋ ์ ๋ฑ ๋ค์ํ ์์ค์์ ์ด๋ฏธ์ง๋ฅผ ์์งํ ์ ์์ต๋๋ค.
- ์ด๋ฏธ์ง์ ์ฃผ์์ ๋ฌ๊ธฐ: ์์ ์ ๋ฐ๋ผ ๊ฒฝ๊ณ ์์, ์ธ๊ทธ๋จผํธ ๋๋ ํคํฌ์ธํธ๋ก ์ด๋ฏธ์ง์ ์ฃผ์์ ๋ฌ ์ ์์ต๋๋ค.
- ์ฃผ์ ๋ด๋ณด๋ด๊ธฐ: ์ด๋ฌํ ์ฃผ์์ YOLO
*.txt
ํ์ผ ํ์์ ์ง์ํ๋ Ultralytics . -
๋ฐ์ดํฐ ์งํฉ ๊ตฌ์ฑ: ๋ฐ์ดํฐ ์งํฉ์ ์ฌ๋ฐ๋ฅธ ํด๋ ๊ตฌ์กฐ๋ก ์ ๋ ฌํฉ๋๋ค. ๋ค์์ด ์์ด์ผ ํฉ๋๋ค.
train/
๊ทธ๋ฆฌ๊ณval/
์ต์์ ๋๋ ํฐ๋ฆฌ์ ๊ฐ ๋๋ ํฐ๋ฆฌ ๋ด์images/
๊ทธ๋ฆฌ๊ณlabels/
ํ์ ๋๋ ํฐ๋ฆฌ๋ก ์ด๋ํฉ๋๋ค. -
๋ง๋ค๊ธฐ
data.yaml
ํ์ผ: ๋ฐ์ดํฐ ์งํฉ์ ๋ฃจํธ ๋๋ ํฐ๋ฆฌ์data.yaml
๋ฐ์ดํฐ ์ธํธ, ํด๋์ค ๋ฐ ๊ธฐํ ํ์ํ ์ ๋ณด๋ฅผ ์ค๋ช ํ๋ ํ์ผ์ ๋๋ค. - ์ด๋ฏธ์ง ์ต์ ํ(์ ํ ์ฌํญ): ๋ณด๋ค ํจ์จ์ ์ธ ์ฒ๋ฆฌ๋ฅผ ์ํด ๋ฐ์ดํฐ ์ธํธ์ ํฌ๊ธฐ๋ฅผ ์ค์ด๋ ค๋ฉด ์๋ ์ฝ๋๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์ต์ ํํ ์ ์์ต๋๋ค. ํ์๋ ์๋์ง๋ง ๋ฐ์ดํฐ ์ธํธ ํฌ๊ธฐ๋ฅผ ์ค์ด๊ณ ๋ค์ด๋ก๋ ์๋๋ฅผ ๋์ด๋ ค๋ฉด ๊ถ์ฅ๋ฉ๋๋ค.
- ๋ฐ์ดํฐ ์งํฉ ์์ถ: ์ ์ฒด ๋ฐ์ดํฐ ์งํฉ ํด๋๋ฅผ zip ํ์ผ๋ก ์์ถํฉ๋๋ค.
- ๋ฌธ์ ๋ฐ ํ๋ณด: ๋ฐ์ดํฐ ์ธํธ๊ฐ ๊ธฐ์กด ํ๋ ์์ํฌ์ ์ด๋ป๊ฒ ๋ค์ด๋ง๋์ง ์ค๋ช ํ๋ ๋ฌธ์ ํ์ด์ง๋ฅผ ๋ง๋์ธ์. ๊ทธ๋ฐ ๋ค์ ํ ๋ฆฌํ์คํธ(PR)๋ฅผ ์ ์ถํฉ๋๋ค. PR์ ์ ์ถํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ธํ ๋ด์ฉ์ Ultralytics ๊ธฐ์ฌ ๊ฐ์ด๋๋ผ์ธ์ ์ฐธ์กฐํ์ธ์.
๋ฐ์ดํฐ ์งํฉ์ ์ต์ ํํ๊ณ ์์ถํ๋ ์ฝ๋ ์์
๋ฐ์ดํฐ ์งํฉ ์ต์ ํ ๋ฐ ์์ถ
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
๋ค์ ๋จ๊ณ์ ๋ฐ๋ผ Ultralytics' ๊ธฐ์กด ๊ตฌ์กฐ์ ์ ํตํฉ๋๋ ์ ๋ฐ์ดํฐ ์งํฉ์ ๊ธฐ์ฌํ ์ ์์ต๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
Ultralytics ์์ ๊ฐ์ฒด ๊ฐ์ง๋ฅผ ์ํด ์ง์ํ๋ ๋ฐ์ดํฐ ์ธํธ๋ ๋ฌด์์ธ๊ฐ์?
Ultralytics supports a wide variety of datasets for object detection, including:
- COCO: A large-scale object detection, segmentation, and captioning dataset with 80 object categories.
- LVIS: An extensive dataset with 1203 object categories, designed for more fine-grained object detection and segmentation.
- Argoverse: ํ๋ถํ ์ฃผ์์ด ํฌํจ๋ ๋์ ํ๊ฒฝ์ 3D ์ถ์ ๋ฐ ๋ชจ์ ์์ธก ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
- VisDrone: A dataset with object detection and multi-object tracking data from drone-captured imagery.
- SKU-110K: Featuring dense object detection in retail environments with over 11K images.
์ด๋ฌํ ๋ฐ์ดํฐ ์ธํธ๋ ๋ค์ํ ๋ฌผ์ฒด ๊ฐ์ง ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํ ๊ฐ๋ ฅํ ๋ชจ๋ธ ํ์ต์ ์ฉ์ดํ๊ฒ ํฉ๋๋ค.
Ultralytics ์ ์ ๋ฐ์ดํฐ ์งํฉ์ ๊ธฐ์ฌํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
Contributing a new dataset involves several steps:
- Collect Images: Gather images from public databases or personal collections.
- Annotate Images: Apply bounding boxes, segments, or keypoints, depending on the task.
- ์ฃผ์ ๋ด๋ณด๋ด๊ธฐ: ์ด๋
ธํ
์ด์
์ YOLO
*.txt
ํ์์ ๋๋ค. - ๋ฐ์ดํฐ ์งํฉ ๊ตฌ์ฑ: ๋ค์๊ณผ ๊ฐ์ ํด๋ ๊ตฌ์กฐ ์ฌ์ฉ
train/
๊ทธ๋ฆฌ๊ณval/
๋๋ ํ ๋ฆฌ์ ๊ฐ๊ฐimages/
๊ทธ๋ฆฌ๊ณlabels/
subdirectories. - ๋ง๋ค๊ธฐ
data.yaml
ํ์ผ: Include dataset descriptions, classes, and other relevant information. - Optimize Images (Optional): Reduce dataset size for efficiency.
- Zip Dataset: Compress the dataset into a zip file.
- Document and PR: Describe your dataset and submit a Pull Request following Ultralytics Contribution Guidelines.
์ข ํฉ ๊ฐ์ด๋๋ฅผ ๋ณด๋ ค๋ฉด ์ ๋ฐ์ดํฐ ์ธํธ ๊ธฐ์ฌ๋ฅผ ๋ฐฉ๋ฌธํ์ธ์.
๋ฐ์ดํฐ ์งํฉ์ Ultralytics Explorer๋ฅผ ์ฌ์ฉํด์ผ ํ๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
Ultralytics Explorer offers powerful features for dataset analysis, including:
- Embeddings Generation: Create vector embeddings for images.
- Semantic Search: Search for similar images using embeddings or AI.
- SQL Queries: Run advanced SQL queries for detailed data analysis.
- Natural Language Search: Search using plain language queries for ease of use.
์์ธํ ๋ด์ฉ์ Ultralytics ํ์ ๊ธฐ๋ฅผ ์ดํด๋ณด๊ณ GUI ๋ฐ๋ชจ๋ฅผ ์ฌ์ฉํด ๋ณด์ธ์.
์ปดํจํฐ ๋น์ ์ฉ Ultralytics YOLO ๋ชจ๋ธ์ ๊ณ ์ ํ ๊ธฐ๋ฅ์ ๋ฌด์์ธ๊ฐ์?
Ultralytics YOLO models provide several unique features:
- Real-time Performance: High-speed inference and training.
- Versatility: Suitable for detection, segmentation, classification, and pose estimation tasks.
- Pretrained Models: Access to high-performing, pretrained models for various applications.
- Extensive Community Support: Active community and comprehensive documentation for troubleshooting and development.
YOLO ์ ๋ํด ์์ธํ ์์๋ณด์ธ์. Ultralytics YOLO ํ์ด์ง์์ ํ์ธํ์ธ์.
Ultralytics ๋๊ตฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์งํฉ์ ์ต์ ํํ๊ณ ์์ถํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ๋์?
Ultralytics ๋๊ตฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์งํฉ์ ์ต์ ํํ๊ณ ์์ถํ๋ ค๋ฉด ๋ค์ ์์ ์ฝ๋๋ฅผ ๋ฐ๋ฅด์ธ์:
๋ฐ์ดํฐ ์งํฉ ์ต์ ํ ๋ฐ ์์ถ
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)
๋ฐ์ดํฐ ์งํฉ์ ์ต์ ํํ๊ณ ์์ถํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์ธํ ์์๋ณด์ธ์.