[Super Resolution] 1-1. SRCNN 논문 리뷰
in Paper-Review
Image Super-Resolution Using Deep Convolutional Networks
모델 구조
그림과 같이 3개의 layer로 이루어져있고, 각각 9*9, 1*1, 5*5사이즈의 커널로 이루어져 있다. 저해상도의 이미지가 3개의 layer를 지나 고해상도의 이미지를 출력하게 된다.
기존의 방법과 비교
위의 그래프를 통해 확인 할 수 있듯이 PSNR값을 비교해 봤을때 기존의 방법인 SC나 Bicubic보다 훨씬 높은 성능을 갖는것을 알 수 있다.
PSNR은 아래와 같은 식으로 구할 수 있으며, 신호가 가질 수 있는 최대 전력에 대한 잡음의 전력이라고 정의되어 있으며 최대값에 대한 노이즈의 값이기 때문에 값이 높을 수록 해상도가 높은 것으로 볼 수 있다.
Loss function
학습과정에서는 MSE(평균오차제곱)을 Loss function으로 사용하였다.
실험
- 데이터 양에 따른 PSNR 비교
- 커널 사이즈에 따른 PSNR 비교
- layer의 깊이에 따른 PSNR 비교
결론적으로 더 많은 데이터, 더 큰 커널사이즈, 더 얕은 layer 깊이 일 수록 좋은 성능을 갖는 것을 알 수 있지만 학습이 오래걸리는 것에 비해 차이가 크지 않다는 것 또한 알 수 있다.