- **Gaussian Process(GP)**๋ ํจ์ ํ๋๊ฐ ์๋๋ผ โ๊ฐ๋ฅํ ํจ์๋ค์ ๋ถํฌโ๋ฅผ ๋ค๋ฃจ๋ ํ๋ฅ ๋ชจํ
- ์ด๋ค ์
๋ ฅ ์ง์ ๋ค์ ๋ฝ์๋ ๊ทธ ํจ์๊ฐ๋ค์ด ํญ์ ๋ค๋ณ๋ ์ ๊ท๋ถํฌ(multivariate normal)๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฐ์
- ์์ธก์ ์ ํ๋๊ฐ ์๋๋ผ โํ๊ท ยฑ ๋ถํ์ค์ฑ(๋ถ์ฐ)โ์ผ๋ก ๋ด๋๋ ๋น๋ชจ์(non-parametric) ํ๊ท ๋๊ตฌ
ํด๋น ๊ฐ๋
์ด ํ์ํ ์ด์
- ๋ฒ ์ด์ง์ ์ต์ ํ์ surrogate model๋ก ์ฐ๋ ค๋ฉด, โ์ด ์ง์ ์ ์์ธก๊ฐโ๋ฟ ์๋๋ผ โ์ฌ๊ธฐ๋ฅผ ์ผ๋ง๋ ๋ชจ๋ฅด๋๊ฐ(๋ถํ์ค์ฑ)โ ๊ฐ ํ์ํ๋ค โ ๊ทธ๋์ผ ๋ค์์ ํ์ํ ๊ณณ์ ์ ํ๋ค
- ๋ฐ์ดํฐ๊ฐ ์ ์ ๋(๋น์ผ ์คํ), ์ ๋ช ๊ฐ๋ง์ผ๋ก ํจ์ ์ ์ฒด ๋ชจ์๊ณผ ์ ๋ขฐ๊ตฌ๊ฐ์ ๋์์ ์ถ์ ํด์ผ ํ๋ค
- ์ผ๋ฐ ํ๊ท(์ ํ/์ ๊ฒฝ๋ง)๋ ๋ณดํต ์ ์ถ์ ํ๋๋ง ์ฃผ์ง๋ง, GP๋ ์์ธก๊ฐ + ๋ถํ์ค์ฑ์ ํ ๋ฒ์ ์ค๋ค
AS-IS โ ์ ์ถ์ ํ๋๋ง ๋ด๋๋ ํ๊ท
# ์ผ๋ฐ ํ๊ท: ์์ธก๊ฐ ํ๋. ์ด ๊ฐ์ด ์ผ๋ง๋ ๋ฏฟ์ ๋งํ์ง๋ ๋ชจ๋ฆ
model.fit(X_train, y_train)
y_pred = model.predict(x_new) # ์: 0.052
TO-BE โ ํ๊ท ๊ณผ ๋ถํ์ค์ฑ์ ํจ๊ป ๋ด๋๋ GP
# Gaussian Process: ํ๊ท (mean) + ๋ถํ์ค์ฑ(std)์ ๊ฐ์ด ๋ฐํ
gp.fit(X_train, y_train)
mean, std = gp.predict(x_new, return_std=True)
# mean = 0.052, std = 0.018 โ "0.052์ฏค์ธ๋ฐ ยฑ0.018 ๋งํผ ๋ถํ์ค"
GP๋ฅผ ์ด๋ฃจ๋ 3๊ฐ์ง ์์
1. ํ๊ท ํจ์ (mean function) m(x)
- ํจ์์ ๊ธฐ๋๊ฐ(์ค์ฌ์ ). ์ค๋ฌด์์ ๋ณดํต 0์ผ๋ก ๋๋ค โ ๋ฐ์ดํฐ๊ฐ ์์์ ๋์ด์ฌ๋ฆฐ๋ค.
2. ์ปค๋ = ๊ณต๋ถ์ฐ ํจ์ k(x, xโ)
- โ๋ ์
๋ ฅ์ด ๊ฐ๊น์ฐ๋ฉด ์ถ๋ ฅ๋ ๋น์ทํ๋คโ ๋ ๋ฎ์(์ ์ฌ๋)์ ์ ์. GP์ ์ฑ๊ฒฉ์ ์ฌ์ค์ ๋ค ๊ฒฐ์ ํ๋ค.
- ๊ฐ์ฅ ํํ ๊ฒ RBF(์ ๊ณฑ์ง์, squared exponential) ์ปค๋:
k(x, x') = exp( โ dยฒ / (2โยฒ) ) # d = |x โ x'|
โ(length-scale): ํจ์๊ฐ ์ผ๋ง๋ ๋นจ๋ฆฌ ๋ณํ๋์ง. ์์์๋ก ๊ตฌ๋ถ๊ตฌ๋ถ, ํด์๋ก ์๋ง.
- ์ปค๋์ ๋ฐ๊พธ๋ฉด ๋งค๋๋ฌ์(Matรฉrn), ์ฃผ๊ธฐ์ฑ(periodic) ๊ฐ์ ์ฑ์ง์ ๋ฃ์ ์ ์๋ค.
3. ์ฌํ๋ถํฌ (posterior) โ ๊ด์ธก ํ ์
๋ฐ์ดํธ
- ์ ์ ๊ด์ธกํ๋ฉด ๋ถํฌ๊ฐ ๊ทธ ์ ์ ์ง๋๋๋ก ์ข์์ง๋ค. ๊ด์ธก์ ๊ทผ์ฒ๋ ๋ถํ์ค์ฑโ, ๋ฉ์ด์ง์๋ก ๋ถํ์ค์ฑโ.
- ์ ์ง์
x*์์์ ์์ธก์ ๋ค์์ผ๋ก ๊ณ์ฐ๋๋ค (๊ด์ธก ์
๋ ฅ X, ๊ด์ธก๊ฐ y):
์ฌํ ํ๊ท ฮผ(x*) = K(x*, X) ยท K(X, X)โปยน ยท y # ๊ด์ธก๊ฐ๋ค์ ๊ฐ์ค ์กฐํฉ
์ฌํ ๋ถ์ฐ ฯยฒ(x*) = K(x*, x*) โ K(x*, X) ยท K(X, X)โปยน ยท K(X, x*)
- ํ๊ท
ฮผ๋ โ๊ด์ธก๊ฐ๋ค์ ๊ฑฐ๋ฆฌ(์ปค๋) ๊ฐ์ค์ผ๋ก ์์ ๊ฐโ, ๋ถ์ฐ ฯยฒ์ โ๊ด์ธก์์ ๋ฉ์๋ก ์ปค์ง๋ ๋ถํ์ค์ฑโ์ด๋ค.
์ง๊ด: โ๊ด์ธก์ ์ ์ง๋๋ ๊ณ ๋ฌด์ค ๋ค๋ฐโ
- prior: ๊ฐ๋ฅํ ํจ์๋ค์ด ์ ๋ฉ๋๋ก ํผ์ ธ ์๋ค (์๋ฌด๊ฒ๋ ๋ชจ๋ฅด๋ ์ํ).
- ๊ด์ธก: ์ ์ ํ๋ ์ฐ์ผ๋ฉด, ๊ทธ ์ ์ ์ง๋๋ ํจ์๋ง ๋จ๋๋ค โ ์ ๊ทผ์ฒ๋ ๋ค๋ฐ์ด ์ข์์ง๊ณ , ๋จผ ๊ณณ์ ์ฌ์ ํ ๋๋ค.
- ์ด โ๋์ด(๋ถ์ฐ)โ๊ฐ ๊ณง ๋ถํ์ค์ฑ์ด๊ณ , ๋ฒ ์ด์ง์ ์ต์ ํ๊ฐ โ์ด๋๋ฅผ ๋ ํ์ํ ๊นโ๋ฅผ ์ ํ๋ ๊ทผ๊ฑฐ๊ฐ ๋๋ค.
ํ๊ณ
- ๋ฐ์ดํฐ N๊ฐ์ผ ๋
K(X, X)โปยน ๊ณ์ฐ์ด O(Nยณ) โ ๋์ฉ๋ ๋ฐ์ดํฐ์ ๋น์ธ๋ค.
- ๊ทธ๋์ GP/BO๋ โํ๊ฐ ํ์๊ฐ ์ ์โ ์ํฉ(๋น์ผ ์คํ, โค20์ฐจ์)์์ ๊ฐ์ฅ ๋น๋๋ค.
์ฐธ๊ณ ๋ฌธ์