[10분만에 논문 리뷰] Max pooling을 더한 Vision Transformer를 이용한 WSSS

ECCV 2022 (European Conferences on Computer Vision 2022)에서 발표된 Vision Transformer를 이용한 WSSS입니다. 지난번에 다루었던 MCTformer를 넘어서는 성능을 보여 읽어보았습니다. 1. Introduction introduction에서 WSSS 연구의 평가 방법에 대해 설명해주는 것이 좋았습니다. 기본적으로 WSSS 기법을 평가할 때에는, WSSS로 생성한 pseudo-mask를 DeepLab 같은 supervised segmentation network에 학습시킵니다. 이 과정을 "verification task"라고 합니다. pseudo-mask가 얼마나 잘 만들어졌는지 확인하기 위한 작업입니다. 이 논문에서도 역시 CNN + CAM ..

→2022. 12. 16. 14:10