์ฝ˜ํ…์ธ ๋กœ ๊ฑด๋„ˆ๋›ฐ๊ธฐ

MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ

MNIST (๋ฏธ๊ตญ ๊ตญ๋ฆฝํ‘œ์ค€๊ธฐ์ˆ ์—ฐ๊ตฌ์†Œ) ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” ๋‹ค์–‘ํ•œ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ์‹œ์Šคํ…œ๊ณผ ๋จธ์‹  ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ์†์œผ๋กœ ์“ด ์ˆซ์ž๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์ž…๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” NIST์˜ ์›๋ณธ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ์ƒ˜ํ”Œ์„ '์žฌ์กฐํ•ฉ'ํ•˜์—ฌ ๋งŒ๋“ค์–ด์กŒ์œผ๋ฉฐ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ฃผ์š” ๊ธฐ๋Šฅ

  • MNIST์—๋Š” 60,000๊ฐœ์˜ ํ›ˆ๋ จ ์ด๋ฏธ์ง€์™€ 10,000๊ฐœ์˜ ์†์œผ๋กœ ์“ด ์ˆซ์ž ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” 28x28 ํ”ฝ์…€ ํฌ๊ธฐ์˜ ๊ทธ๋ ˆ์ด ์Šค์ผ€์ผ ์ด๋ฏธ์ง€๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.
  • ์ด๋ฏธ์ง€๋Š” 28x28 ํ”ฝ์…€ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์— ๋งž๊ฒŒ ์ •๊ทœํ™”๋˜๊ณ  ์•คํ‹ฐ ์•จ๋ฆฌ์–ด์‹ฑ์ด ์ ์šฉ๋˜์–ด ๊ทธ๋ ˆ์ด์Šค์ผ€์ผ ๋ ˆ๋ฒจ์ด ๋„์ž…๋ฉ๋‹ˆ๋‹ค.
  • MNIST๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ถ„์•ผ, ํŠนํžˆ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์ž‘์—…์˜ ํ›ˆ๋ จ ๋ฐ ํ…Œ์ŠคํŠธ์— ๋„๋ฆฌ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ์„ธํŠธ ๊ตฌ์กฐ

MNIST ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์€ ๋‘ ๊ฐœ์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์œผ๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค:

  1. ํ›ˆ๋ จ ์ง‘ํ•ฉ: ์ด ํ•˜์œ„ ์ง‘ํ•ฉ์—๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ํ•™์Šต์— ์‚ฌ์šฉ๋˜๋Š” 60,000๊ฐœ์˜ ์†๊ธ€์”จ ์ˆซ์ž ์ด๋ฏธ์ง€๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ํ…Œ์ŠคํŠธ ์„ธํŠธ: ์ด ํ•˜์œ„ ์ง‘ํ•ฉ์€ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ํ…Œ์ŠคํŠธํ•˜๊ณ  ๋ฒค์น˜๋งˆํ‚นํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” 10,000๊ฐœ์˜ ์ด๋ฏธ์ง€๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.

ํ™•์žฅ MNIST(EMNIST)

ํ™•์žฅ๋œ MNIST(EMNIST)๋Š” NIST์—์„œ MNIST์˜ ํ›„์†์œผ๋กœ ๊ฐœ๋ฐœ ๋ฐ ๊ณต๊ฐœํ•œ ์ตœ์‹  ๋ฐ์ดํ„ฐ ์„ธํŠธ์ž…๋‹ˆ๋‹ค. MNIST์—๋Š” ์†์œผ๋กœ ์“ด ์ˆซ์ž์˜ ์ด๋ฏธ์ง€๋งŒ ํฌํ•จ๋œ ๋ฐ˜๋ฉด, EMNIST์—๋Š” ์ˆซ์ž๋Š” ๋ฌผ๋ก  ์†์œผ๋กœ ์“ด ๋Œ€๋ฌธ์ž์™€ ์†Œ๋ฌธ์ž๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์ธ NIST Special Database 19์˜ ๋ชจ๋“  ์ด๋ฏธ์ง€๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. EMNIST์˜ ์ด๋ฏธ์ง€๋Š” MNIST ์ด๋ฏธ์ง€์™€ ๋™์ผํ•œ ํ”„๋กœ์„ธ์Šค๋ฅผ ํ†ตํ•ด ๋™์ผํ•œ 28x28ํ”ฝ์…€ ํ˜•์‹์œผ๋กœ ๋ณ€ํ™˜๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ๋” ์˜ค๋ž˜๋˜๊ณ  ๋” ์ž‘์€ MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ์ž‘๋™ํ•˜๋Š” ๋„๊ตฌ๋Š” EMNIST์—์„œ๋„ ์ˆ˜์ •ํ•˜์ง€ ์•Š๊ณ  ์ž‘๋™ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค.

์• ํ”Œ๋ฆฌ์ผ€์ด์…˜

MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” ์ปจ๋ณผ๋ฃจ์…˜ ์‹ ๊ฒฝ๋ง(CNN), ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹ (SVM) ๋ฐ ๊ธฐํƒ€ ๋‹ค์–‘ํ•œ ๋จธ์‹  ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๊ฐ™์€ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ๋„๋ฆฌ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์„ธํŠธ์˜ ๊ฐ„๋‹จํ•˜๊ณ  ์ฒด๊ณ„์ ์ธ ํ˜•์‹์€ ๋จธ์‹  ๋Ÿฌ๋‹ ๋ฐ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ถ„์•ผ์˜ ์—ฐ๊ตฌ์ž์™€ ์‹ค๋ฌด์ž์—๊ฒŒ ํ•„์ˆ˜์ ์ธ ๋ฆฌ์†Œ์Šค์ž…๋‹ˆ๋‹ค.

์‚ฌ์šฉ๋ฒ•

์ด๋ฏธ์ง€ ํฌ๊ธฐ๊ฐ€ 32x32์ธ 100๊ฐœ์˜ ์—ํฌํฌ์— ๋Œ€ํ•ด MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ CNN ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋ ค๋ฉด ๋‹ค์Œ ์ฝ”๋“œ ์กฐ๊ฐ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์ธ์ˆ˜์˜ ์ „์ฒด ๋ชฉ๋ก์€ ๋ชจ๋ธ ํ›ˆ๋ จ ํŽ˜์ด์ง€๋ฅผ ์ฐธ์กฐํ•˜์„ธ์š”.

์—ด์ฐจ ์˜ˆ์‹œ

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='mnist', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

์ƒ˜ํ”Œ ์ด๋ฏธ์ง€ ๋ฐ ์ฃผ์„

MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ์—๋Š” ์†์œผ๋กœ ์“ด ์ˆซ์ž์˜ ํšŒ์ƒ‰์กฐ ์ด๋ฏธ์ง€๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์–ด ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์ž‘์—…์„ ์œ„ํ•œ ์ž˜ ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ๋ฐ์ดํ„ฐ ์„ธํŠธ์˜ ๋ช‡ ๊ฐ€์ง€ ์ด๋ฏธ์ง€ ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค:

๋ฐ์ดํ„ฐ ์„ธํŠธ ์ƒ˜ํ”Œ ์ด๋ฏธ์ง€

์ด ์˜ˆ์‹œ๋Š” MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ํฌํ•จ๋œ ํ•„๊ธฐ ์ˆซ์ž์˜ ๋‹ค์–‘์„ฑ๊ณผ ๋ณต์žก์„ฑ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ๊ฐ•๋ ฅํ•œ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์„ธํŠธ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

์ธ์šฉ ๋ฐ ๊ฐ์‚ฌ

MNIST ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ

์—ฐ๊ตฌ ๋˜๋Š” ๊ฐœ๋ฐœ ์ž‘์—…์˜ ๊ฒฝ์šฐ ๋‹ค์Œ ๋…ผ๋ฌธ์„ ์ธ์šฉํ•ด ์ฃผ์„ธ์š”:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐ ์ปดํ“จํ„ฐ ๋น„์ „ ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์œ„ํ•œ ๊ท€์ค‘ํ•œ ๋ฆฌ์†Œ์Šค์ธ MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ๋ฅผ ๋งŒ๋“ค๊ณ  ์œ ์ง€ ๊ด€๋ฆฌํ•ด ์ฃผ์‹  Yann LeCun, Corinna Cortes, Christopher J.C. Burges์—๊ฒŒ ๊ฐ์‚ฌ์˜ ๋ง์”€์„ ์ „ํ•ฉ๋‹ˆ๋‹ค. MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ์™€ ์ œ์ž‘์ž์— ๋Œ€ํ•œ ์ž์„ธํ•œ ๋‚ด์šฉ์€ MNIST ๋ฐ์ดํ„ฐ ์„ธํŠธ ์›น์‚ฌ์ดํŠธ๋ฅผ ์ฐธ์กฐํ•˜์„ธ์š”.



2023-11-12 ์ƒ์„ฑ, 2023-11-22 ์—…๋ฐ์ดํŠธ๋จ
์ž‘์„ฑ์ž: glenn-jocher (3)

๋Œ“๊ธ€