Feature Encoder network : 이미지1 와 이미지2에 둘다 적용, downscale image의 픽셀당 feature map을 출력한다.
Context Encoder Network : 이미지1에만 적용, Feature Encoder와 구조 동일
Correlation layer : 4D $W \times H \times W \times H$ correlation volume 을 각 feature vector의 Inner product로 구성.
Written with StackEdit.