[10분만에 논문 리뷰] Max pooling을 더한 Vision Transformer를 이용한 WSSS

ECCV 2022 (European Conferences on Computer Vision 2022)에서 발표된 Vision Transformer를 이용한 WSSS입니다. 지난번에 다루었던 MCTformer를 넘어서는 성능을 보여 읽어보았습니다. 1. Introduction introduction에서 WSSS 연구의 평가 방법에 대해 설명해주는 것이 좋았습니다. 기본적으로 WSSS 기법을 평가할 때에는, WSSS로 생성한 pseudo-mask를 DeepLab 같은 supervised segmentation network에 학습시킵니다. 이 과정을 "verification task"라고 합니다. pseudo-mask가 얼마나 잘 만들어졌는지 확인하기 위한 작업입니다. 이 논문에서도 역시 CNN + CAM ..

[10분만에 논문 리뷰] Stepwise Feature Fusion: Local Guides Global

Polyp segmentation에서 SOTA를 기록했던 모델입니다. pyramid Transformer Encoder와 Local Emphasis라는 강조 모듈을 사용한 Progressive Locality Decoder를 사용해 성능을 높였다고 합니다. 여기서 속도를 개선해 real-time task에 알맞게 만든 모델이 ESFPNet입니다. Abstract 대장내시경은 대장암을 조기에 찾아내는 데에 필요한 폴립 탐지에 가장 효율적인 기술 사이즈, 형태가 다 다르고 정상 점막과의 경계도 희미해서 정확한 segmentation이 여전히 도전과제임 폴립 이미지가 매우 다양해서 딥러닝 모델조차 현재 데이터셋에 오버 피팅되기 쉬움 pyramid Transformer encoder를 이용한 SSFormer를 ..

[10분만에 논문 리뷰] ESFPNet, real-time lesion segmentation, 실시간 병변 탐지

현재 기준 (2022년 10월 24일) paperswithcode Medical Image Segmentation 분야에서 SOTA를 기록한 알고리즘입니다. 최근에 내시경 영상을 이용한 병변 detection & segmentation을 연구하고 있어 읽어보았습니다. Mix Transformer와 feature-pyramid 모델을 결합해 real-time segmentation이 가능한 모델을 제시했습니다. ABSTRACT - 폐암은 세계적으로 가장 치명적인 질병이기때문에 조기에 발견하는 것이 중요함 - 기관지 내시경(bronchoscopy)으로 이를 탐지하는 게 가장 효율적임 - 전문의들은 white-light bronchoscopy (WLB), autofluorescence bronchoscopy ..