RMSprop

Root Mean Square Prop

sdw=ฮฒsdw+(1โˆ’ฮฒ)dw2sdb=ฮฒsdb+(1โˆ’ฮฒ)db2w:=wโˆ’ฮฑdwsdwb:=bโˆ’ฮฑdbsdbs_{dw}=\beta s_{dw}+(1-\beta)dw^2\\ s_{db}=\beta s_{db}+(1-\beta)db^2\\ w:=w-\alpha\frac{dw}{\sqrt{s_{dw}}}\\ b:=b-\alpha\frac{db}{\sqrt{s_{db}}}

  • RMSprop ์€ ์ƒ๋Œ€์ ์œผ๋กœ ํฐ bb ๋ฅผ ๋” ์ž‘๊ฒŒ ์—…๋ฐ์ดํŠธ ํ•˜๊ณ , ์ƒ๋Œ€์ ์œผ๋กœ ์ž‘์€ ww ๋ฅผ ํฌ๊ฒŒ ์—…๋ฐ์ดํŠธ ํ•˜๋ฏ€๋กœ์จ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•์ด ์ˆ˜ํ‰ ๋ฐฉํ–ฅ์œผ๋กœ ์ด๋ฃจ์–ด์ง€๋„๋ก ๋•๋Š”๋‹ค.
  • RMSprop ์„ ๋ชจ๋ฉ˜ํ…€๊ณผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•  ๊ฒƒ์ด๋ฏ€๋กœ ์•„๋ž˜์ฒ˜๋Ÿผ ฮฒ2\beta_2๋กœ ํ‘œ๊ธฐํ•œ๋‹ค.
sdw=ฮฒ2sdw+(1โˆ’ฮฒ2)dw2s_{dw}=\beta_2 s_{dw}+(1-\beta_2)dw^2\\
  • ๋˜ํ•œ ์ œ๊ณฑ๊ทผ์ด 0๊ณผ ๊ฐ€๊นŒ์šฐ๋ฉด ๊ฐ’์ด ๋„ˆ๋ฌด ์ปค์ง€๊ธฐ ๋•Œ๋ฌธ์— ๋ถ„๋ชจ์— ์ž‘์€ ฯต\epsilon ์„ ์ถ”๊ฐ€ํ•œ๋‹ค.
w:=wโˆ’ฮฑdwsdw+ฯตw:=w-\alpha\frac{dw}{\sqrt{s_{dw}+\epsilon}}