본문 바로가기

CV 논문리뷰

(24)
[RAL 2021] MS-UDA:Multi-Spectral Unsupervised Domain Adaptation for Thermal Image Semantic Segmentation 오늘은 Image Segmentation 관련 논문을 가져 왔습니다. Segmentation 에 대한 논문은 처음 읽어보는데, 추천을 받은 논문이라 Baseline으로 선정 후 읽어보았습니다. 1. Introduction 본 논문은 Thermal Image에서의 Semantic Segmentation을 위한, multi-spectral unsupervised domain adapation 을 수행하는 논문입니다. 열화상 image가 주어졌을 때, pixel 단위로 class를 예측하는 Semantic Segmentation을 진행하게 되는데, 이 과정에서 domain adaptation 이 함께 수행이 됩니다. 갑자기 왜 생뚱맞게 domain adaptation이 등장하는 것일까요? thermal dom..
[ECCV 2020] Content-Aware Unsupervised Deep Homography Estimation 안녕하세요. 저번 리뷰에 이어 이번 리뷰도 Image Registration 관련 논문입니다. 그럼 리뷰 시작하겠습니다. 1. Image Registration Image Registration에 대해 잘 모르시는 분이 계실수도 있다는 생각이 들어서 간단하게 설명 해 드리겠습니다. align이 맞지않는 2장의 Image pair가 있습니다. 한 장을 source, 다른 한 장을 target이라고 할때 source => target으로 align이 맞게 변환을 해주는 그러한 task라고 생각 하시면 될 거 같습니다. Image Registration에는 많은 방법론들이 존재합니다. 각각에 대해 설명하기에 앞서, 두 평면사이의 변환 행렬인 homography를 구할때의 제약 조건에 대해 소개해 드리겠습니다...
[CVPR 2020] Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation 오늘 리뷰하게 될 논문은 multi-modal 에서의 Image Registration한 논문입니다. 그럼 리뷰 시작하도록 하겠습니다. Introduction 본 논문은 multi-modal 에서의 image registration을 수행하는 unsupervised 방법론입니다. 다시말해, domain이 다른 image pairs 에서의 registration을 수행하는 task라고 생각하시면 됩니다. 예를들어, KAIST Dataset같은 경우에 RGB-Thermal image pair 가 두 카메라의 baseline 차이 때문에 align이 맞지 않게 되는데, 이런 경우에 align을 맞출 수 있는 task 입니다. 이전의 Multi-Modal Image Registration task 에서는 sou..
[CVPR 2017] Image-to-Image Translation with Conditional Adversarial Networks 매번 Depth 관련 논문을 리뷰하다가, 이번엔 Image Translation 관련 논문을 가지고 왔습니다. 본 논문은 2017 CVPR에 게재된 논문이고, pix2pix라는 이름으로도 잘 알려져 있는 논문입니다. 그럼 리뷰 시작하겠습니다. 위에 있는 Figure 1 그림을 보시면 Image Translation이 어떤 task인지 직관적으로 이해하실 수 있으실겁니다. Input image로부터 Output image를 translation 하는 것인데, 우리가 흔히 아는 번역기의 image 버전이라고 생각하시면 됩니다. Introduction 전통적인 Image Translation task에서는 pixel by pixel 형식으로 output image를 예측 했었습니다. 그리고 우리가 알다시피 통..
[ICCV2021] Revealing the Reciprocal Relations between Self-Supervised Stereo and Monocular Depth Estimation 오늘 리뷰할 논문은 ICCV 2021년에 게재된 'Revealing the Reciprocal Relations between Self-Supervised Stereo and Monocular Depth Estimation' 이라는 논문입니다. 여태까지와 마찬가지로 Self-supervised monocular depth estimation에 관한 논문인데, 여기에 추가적으로 pseudo label을 사용한 knowledge distillation 방법론이 살짝 추가된 논문이라고 보시면 됩니다. Abstract 현재 존재하는 여러 방법론들은 보통 depth estimation을 진행할 때에 stereo 또는 mono 둘 중 하나에 초점을 두고 연구를 진행하곤 합니다. 본 논문에서는 stereo와 mono..
[ECCV 2020] Feature-metric Loss for Self-supervised Learning of Depth and Egomotion 논문리뷰 오늘 제가 소개해 드릴 논문은 [ECCV 2020] 에서 소개된 'Feature-metric Loss for Self-supervised Learning of Depth and Egomotion' 이라는 논문입니다. 본 논문은 self-supervised monocular depth estimation 방법론입니다. 보통 해당 방법론에서는 한장의 이미지가 input으로 들어가기 때문에 해당 image의 앞 뒤 프레임 사이의 pose변화도 추가적으로 예측을 해 주어야 합니다. 예측한 pose 변화를 통해 image를 target frame으로 warping 시키고, 기존 이미지와 변환된 이미지 사이의 photometric loss를 구하는 방식을 사용합니다. 하지만 흔히 사용되는 photometric lo..
Mono Depth 2 논문 리뷰 저번 Mono Depth1 에 이어서 오늘은 'Digging Into Self-Supervised Monocular Depth Estimation' 라는 논문을 리뷰하고자 합니다. Mono Depth2 라고도 불리는 논문입니다. Abstract & Introduction Mono Depth 1과 2는 모두 1장의 image로 depth를 추정하는 self-supervised monocular depth estimation 방법론입니다. 이 둘의 차이라고 한다면 training 과정에서 존재하게 됩니다. 1의 경우 2장의 left & right image로 학습을 진행하는 반면, 2의 경우엔 시간 frame에서의 image pair를 사용해서 학습을 진행하게 된다는 점입니다. 본 논문에서 제안하는 3가지는..
Mono Depth 1 논문 리뷰 오늘 소개드릴 논문은 CVPR2017의 Unsupervised Monocular Depth Estimation with Left-Right Consistency 라는 논문입니다. 줄여서 Mono Depth 1 이라고도 불리는 논문입니다. Abstract 기존의 Supervised 기반의 Depth Estimation 방식은 성능이 좋기는 하지만, model training을 위해선 방대한 양의 ground truth depth data가 필요하다는 문제점이 존재하게 됩니다.따라서 본 논문에서는 위 문제를 해결하고자 depth 정보가 없는 단일이미지 데이터셋에서 depth 정보를 얻어내는 Unsupervised Monocular Depth Estimation을 수행합니다. 보통 depth 정보가 없는 st..