- 우리는 데이터
$X$ 와 비슷한 분포를 가지는$p(x)$ 를 추정하고자 한다.
가능도함수
- 로그 가능도함수
$\log p_{\theta}(x^{(i)})$ 는 다음과 같이 쓸 수 있다.
이제 우리는 가능도함수의 하한(lower bound of the likelihood)를 최대화 하는 것으로 문제를 바꿔 생각할 수 있다.
- 가능도함수의 하한은 다음과 같이 근사한다.
비슷하게,
정규분포 가정 시 KL-divergence term이 계산 가능하고 다음과 같은 추정량을 얻을 수 있다.
- 데이터는 MNIST데이터를 사용하였다.
- 하이퍼파라미터는 논문을 참고하여 결정하였다.
'input_dim' : 28*28,
'hidden_dim' : 500,
'latent_dim' : 2,
'batch_size' : 100,
'epochs' : 100,
'lr' : 0.01,
'best_loss' : 10**9,
'patience_limit' : 3
- 위의 MNIST예시를 Input으로 생성한 결과
- Latent variable(z)에 따른 생성 결과