ResNets
Residual Block
z[l+1]=W[l+1]a[l]+b[l+1]a[l+1]=g(z[l+1])z[l+2]=W[l+2]a[l+1]+b[l+2]a[l+2]=g(z[l+2])
- ์์๊ฐ์ ์ ๊ฒฝ๋ง์ด ์๋ค๊ณ ํ ๋ ์๋์ ๊ฐ์ด ์์ฝํ ์ ์์
- a[l]
- Linear
- ReLU
- a[l+1]
- Linear
- ReLU
- a[l+2]
- ์ด ์ผ๋ จ์ ๊ณผ์ ์ Main Path ๋ผ๊ณ ํ๋ค.
- ์ฌ๊ธฐ์ a[l] ์ 5๋ฒ Linear ์ดํ ๋ํด์ฃผ์ด ์ค๊ฐ ๋ ์ด์ด๋ฅผ ์คํตํ ์ ์๊ณ , ์ด๋ฅผ Short cut ํน์ Skip connecttion ์ด๋ผ๊ณ ํ๋ค.
- โ a[l+2]=g(z[l+2]+a[l])
- ์ด๋ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ค.
- ๋คํธ์ํฌ๊ฐ ๋ ๊น์ด์ง๋๋ผ๋ ํ์ต์ด ์ ์งํ๋๋ค.