Pyramid Scene Parsing Network (PSPNet) Review papers : https://arxiv.org/pdf/1612.01105.pdf 0. Abstract Sence parsing의 경우 Open Vocabulary 와 diverse secens 두 가지 어려운 점을 가지고 있습니다. 위의 문제를 해결하기위해서 Pyramid Pooling Modules를 이용한 PSPNet을 제안합니다. Global context information을 탐색하는 능력을 가집니다. 서로 다른 영역을 기반으로 하는 Context를 탐색할 수 있습니다. Secne Parsing에서 좋은 성능을 거두었으며 ImageNet scene parsing challenge 2016, PASCAL VOC 2..
Multi-Scale Context Aggregation by Dilated Convolutions (DilatedNet) Review papers : https://arxiv.org/pdf/1511.07122.pdf 0. Abstract Dense prediction 문제는 일반적으로 Image Classficiation과는 다릅니다. Dense prediction 문제에 적합한 새로운 Convolutional Network Module을 제안합니다. 제안된 모듈인 Dilated Convolution은 해상도를 잃지 않고 다양한 크기의 contextual information을 통합합니다. 특히 Receptive field를 지수적으로 증가시키면서도 해상도를 잃지 않습니다. 위의 방법을 통해서 Sema..
U-Net : Convolutional Networks for Biomedical Image Segmentation Review papers : https://arxiv.org/abs/1807.10165 papers : https://arxiv.org/abs/1912.05074 0. Abstract FCN 및 U-Net의 경우 2가지의 한계점이 존재합니다. 데이터셋에 맞은 모델의 최적 깊이를 알 수가 없습니다. 그래서 비용을 들여서 이를 찾아내거나 여러 깊이의 모델들을 앙상블하는 비효율적인 작업이 필요합니다. Skip Connection이 동일한 깊이를 가지는 인코더와 디코더만 연결되는 제한적인 구조를 가집니다. 이러한 2가지의 한계점을 극복하기 위해서 UNet++에서는 새로운 형태의 아키텍처를 제시합니..
U-Net : Convolutional Networks for Biomedical Image Segmentation Review papers : https://arxiv.org/abs/1505.04597 0. Abstract 딥러닝의 경우 충분히 많은 학습 데이터를 필요로 함 논문에서는 적은 양의 학습 데이터를 가지고도 충분히 좋은 성능을 내는 Augmentation 방법을 사용하여 학습함 네트워크의 경우 "Contracting path" 와 "Expanding path"으로 구성하여 적은 데이터로 End-to-End의 학습을 수행 Contracting path : 이미지의 특징을 추출 Expanding path : localization을 가능하게 함 성능적으로도 높게 나와서 대부분의 대회에서 SOTA..
SegNet : A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation paper : https://arxiv.org/pdf/1511.00561.pdf 0. Abstract VGG16 에서 FC-Layer 3개를 제외한 13개의 Layer으로 구성된 Encoder를 사용 Encoder와 정반대의 Decoder를 이용해서 resolution을 증가시킴 이때, UnMaxpool을 이용해서 non-linear한 Upsampling을 진행함 Unpooling의 경우 학습할 필요가 없어서 파라미터 및 속도의 장점이 있음 UnMaxpool 만 사용할 경우에 Upsampled maps이 Sparse한 단점이 있어서 Conv를 같이 사용해서 D..
Deconvolutional Network (DeconvNet) review '본 포스팅은 모두의연구소(home.modulabs.co.kr) 풀잎스쿨에서 진행된 '과정 제목' 과정 내용을 공유 및 정리한 자료입니다.' Abstract 기존의 Fully Convolutional Network가 가지고 있는 한계점을 극복하기위해 Layer를 더 깊게 쌓음 unpooling layers에서 Maxpooling 과 Transposed Convoltuion을 같이 도입 위의 결과, Detail한 측면과 Multi Scales한 측면에서 기존 대비 많은 효과가 있었음 Fully Convolutional Networks의 한계 기존의 FCN은 아래의 한계점을 보유하고 있음 네트워크는 기존에 정의된 고정된 Recept..
Fully Convolutional Networks (FCN) review paper : https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf Abstract 본 논문인 FCN의 Contribution은 아래와 같습니다. AlexNet을 시작으로 하는 CNN 모델들의 발전을 Image Segmentation이라는 영역에 접목 Fully Convolutional과 Skip Architecture라는 두가지 방법론을 도입 깊은 layer의 semantic information과 얕은 layer의 appearance information을 결합하여 정..