문서

사용자 문서

ADAM Optimizer Second Order Moment의 고찰

2021/08/22 17:31

ADAM Optimizer 에서 Second Order Moment는 $a = \nabla f(w_y)$ 의 형태로 다음의 형태이다.

$$
\text{RMS} (\nabla f^2)
$$

그리고 이것은 Hessian의 형태로 생각하는 데 이는 Fisher Information Matrix의 정의에서 타당하다.
그렇다면.. 이것의 보다 정확한 의미는 무엇인가를 생각해야 한다.

$(I + a a^T), \quad a \in \mathbf{R}^n$ 의 경우 First Order Estimation 으로 생각할 수 있다.
...

클립보드 이미지 추가 (최대 크기: 977.563 MB)