Study note
๋ฉ๋ชจ๋ฆฌ๋ ์ ๊ณ , ๋ชจ๋ธ์ ๋ง๊ณ ๋ฐ์ดํฐ๋ ๋ ๋ง๋ค. ํ์ต์ ์ํด์๋ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํ๋ค. ์๊ณ ๋ฆฌ์ฆ์ ์ฌ๋ฌ๋ฒ learning process๋ฅผ ์งํํ๋ฉฐ, ์ ๋ณด๋ฅผ ์ ์ฅํ๊ธฐ ์ํด์ ์ ์ ํ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ฐ์ง๊ณ ์์ด์ผ ํ๋ค. ๋ฐ์ดํฐ์ ๋ชจ๋ธ์ด ๊ธฐํ๊ธ์์ ์ผ๋ก ๋์ด๋ ๊ฒ๊ณผ ๋๋นํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์๋ ๊ต์ฅํ ์ฒ์ฒํ ์ฆ๊ฐํ์๋ค.
ํ์ต๊ณผ ์ต์ ํ ์ ์ฅ์์ ๋ฉ๋ชจ๋ฆฌ์ ์ญํ ์ ๋ฌด์์ธ๊ฐ? ๋ฉ๋ชจ๋ฆฌ์ required information ์ ์์ ํน์ ํ ๊ด๊ณ๊ฐ ์๋๊ฐ? (# gradient queries, # data points)
Memory Dichotomy Hypothesis: It is not possible to significantly improve on the convergence rate of known memory efficient techniques without using significantly more memory.
A canonical optimization problem finding $min F(x)$.
Known for $d$ dimensional vector.
์์ ๊ฒฝ์ฐ query ์์ฒด๋ ์๋ฌ์ ๋ํด์ ์ ๊ณฑ์ผ๋ก ๋์ด๋๊ฒ ๋๋ค. ๋ฐ๋ผ์ ์๋ฌ๋ฅผ ์ถฉ๋ถํ ๋ฎ์ถ๊ธฐ ์ํด์๋ ๋ฌด์ํ ๋ง์ ์ฟผ๋ฆฌ๊ฐ ํ์ํ๋ค.
Other techniques such as binary search
๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ query์ ๋ํด์ ๋ง์ ์ฐ์ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํ์ง๋ง, ์๋ฌ์ ๋ํด์ ๋ ์ ์ ์ฟผ๋ฆฌ๊ฐ ํ์ํ๋ค. ๋ฐ๋ผ์ ์ฟผ๋ฆฌ ์๋ฅผ ์ค์ด๊ธฐ ์ํ ์ ์ ํ ๋ฐฉ๋ฒ์ด๋ค.
์๊ณ ๋ฆฌ์ฆ ์์ฒด๋ ํจ์จ์ ์ผ๋ก ๊ตฌ์ฑ๋ ์ ์์ผ๋ฉฐ, ํน์ ํ ๋ชฉ์ ์ ์ง๋๊ณ ์๋ค. ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ ๋ง์ด ์ฐ๋ฉด์ ๋ ํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ๊ตฌ์ฑํ ์ ์๋ค.
Orthogonal Vector Game
Random Matrix $A \sim Unif({\pm 1}^{\frac{d}{2} \times d})$ To win, find $y_1, y_2, \cdots, y_k$ which are roughly orthogonal to $A$.
$M$-bit ๋ฉ์์ง๋ฅผ ๋ณด๋ด์ oracle ์ row number of largest inner product ๋ฅผ ์ค๋ค. ๋ ๋ฒ์งธ ์ฟผ๋ฆฌ๋ฅผ ๋ณด๋ด๋ฉด์ ๊ณ์ ๊ฐ์ฅ ์์ row ๋ฅผ ๋ฐํํด์ค๋ค. ์ด ์์ ์ $m$๋ฒ ์งํํด์ $y_1, y_2, \cdots, y_k$ ๊ฐ๋ฅผ ๊ตฌํด์ผ ํ๋ค.
Communication Game
Transformer ๋ ์ฟผ๋๋ผํฑ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ค. ๋ฐ๋ผ์ ๋ ์ ์ ์ํ์ด ํ์ํ๋ค. LSTM์ linear ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ค. ๋ ๋ง์ ์ํ์ด ํ์ํ๋ค. (์ฟผ๋ฆฌ ์๊ฐ ๋ง์์ผ ํ๋ค.)
Transmission of center and move and scatter them again. Transmitting information directly and safely.