[ICLR 2017] Deep Information Propagation

연구/읽을 논문

xeskin 2020. 1. 6. 04:51

- mean field theory를 이용해 randomly initialized된 untrained neural network의 behavior를 연구함

- signal propagation의 maximum depth가 존재함을 보임

- information이 network의 끝까지 전파되면 잘 훈련됨을 practical하게 보임

- 즉, depth scale은 network를 얼마나 깊게 할 수 있는 지에 대한 bound를 보여줌

- 그런데 depth scale이 발산할 수도 있음

- 발산하면 정보가 끝까지 잘 전파되지 않아 학습이 잘 안됨

- dropout을 쓰면 critical point(?)를 파괴해, random network의 maximum trainable depth를 제한함

- backprop에 대한 mean field theory를 개발하여 ordered phase와 chaotic phase가 각각 vanishing gradient와 exploding gradient에 대응되는 걸 보임

[ICML 2016] Expressiveness of Rectifier Networks (0)	2020.04.27
[USENIX 2018] Meltdown (0)	2020.04.17

Blog

pruning #deeplearning #machinelearning #aiacceleration #경량화 #가속화, 중간고사, pocketflow, 로피탈, 몫과 나머지의 변형, neuralnetworkintelligence, modelcompression, 삼각함수의극한, 수학동아리, neuralnetworkdistiller, 고등수학, mlkit, 다항식의나눗셈, 대구, 수학, 달서구, 대곡고등학교, 곱셈공식의 변형의 활용, 고1, 수(상),

Blog