๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

Machine Learning/๋”ฅ๋Ÿฌ๋‹

Validation, Test ๋ฐ์ดํ„ฐ์„ธํŠธ ๋น„๊ต

๋ฐ˜์‘ํ˜•

Validation ๋ฐ์ดํ„ฐ์„ธํŠธ๋Š” ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜์—ฌ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹์— ์“ฐ์ผ ์ˆ˜ ์žˆ๋‹ค. (์ธต์˜ ์ˆ˜, ์ธต์˜ ์œ ๋‹› ์ˆ˜ ๋“ฑ)

๊ฒ€์ฆ ์„ธํŠธ์˜ ์„ฑ๋Šฅ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์˜ ์„ค์ •์„ ํŠœ๋‹ํ•˜๋ฉด ๊ฒ€์ฆ ์„ธํŠธ๋กœ ๋ชจ๋ธ์„ ์ง์ ‘ ํ›ˆ๋ จํ•˜์ง€ ์•Š๋”๋ผ๋„ ๋น ๋ฅด๊ฒŒ ๊ฒ€์ฆ์„ธํŠธ์— ๊ณผ๋Œ€์ ํ•ฉ ๋  ์ˆ˜ ์žˆ๋‹ค.

-> ํ•œ ๋ฒˆ ํŠœ๋‹ํ•˜๊ณ  ๋‚˜์„œ ๊ฒ€์ฆ์„ธํŠธ์— ํ‰๊ฐ€ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ง€๊ณ  ๋‹ค์‹œ ๋ชจ๋ธ์„ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์„ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ฐ˜๋ณตํ•˜๋ฉด ๊ฒ€์ฆ์„ธํŠธ์— ๊ด€ํ•œ ์ •๋ณด๋ฅผ ๋ชจ๋ธ์— ์•„์ฃผ ๋งŽ์ด ๋…ธ์ถœ์‹œํ‚ค๊ฒŒ ๋˜์–ด ๊ณผ๋Œ€์ ํ•ฉ ๋  ์ˆ˜ ์žˆ๋‹ค.

Test ๋ฐ์ดํ„ฐ์„ธํŠธ๋Š” ์™„์ „ํžˆ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์ด์–ด์•ผ ํ•˜๋ฉฐ ๋ชจ๋ธ์€ ๊ฐ„์ ‘์ ์œผ๋กœ ์–ด๋– ํ•œ ์ •๋ณด๋„ ์ฃผ๋ฉด ์•ˆ๋จ

-> ํ…Œ์ŠคํŠธ ์„ธํŠธ ์„ฑ๋Šฅ์— ๊ธฐ์ดˆํ•˜์—ฌ ํŠœ๋‹ํ•œ ๋ชจ๋ธ์˜ ๋ชจ๋“  ์„ค์ •์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ์™œ๊ณก์‹œํ‚ฌ ๊ฒƒ์ด๋‹ค.

* ๋ฐ์ดํ„ฐ๊ฐ€ ์ ์„ ๊ฒฝ์šฐ ์‚ฌ์šฉํ•˜๋ฉด ์ข‹์€ ๊ณ ๊ธ‰ ๊ธฐ๋ฒ•

- ๋‹จ์ˆœ ํ™€๋“œ์•„์›ƒ ๊ฒ€์ฆ(hold-out validation)

- K-๊ฒน ๊ต์ฐจ ๊ฒ€์ฆ(K-fold cross-validation)

- ์…”ํ”Œ๋ง(shuffling)์„ ์‚ฌ์šฉํ•œ ๋ฐ˜๋ณต K-๊ฒน ๊ต์ฐจ ๊ฒ€์ฆ(iterated K-fold cross-validation)

 

๋ฐ˜์‘ํ˜•