CNN model과 다양한 분야에 딥러닝을 적용한 논문들
https://github.com/sbrugman/deep-learning-papers
CNN 기반 DNN
VGG
구성이 간단해서 응용하기 좋다.
GoogLeNet
가로 방향에 폭이 있는 인셉션 구조.
ResNet
층이 매우 깊어서 gradient vanishing 문제를 해결하기 위해 스킵 연결을 도입한 것이 특징.
https://arxiv.org/abs/1512.03385
지도 학습 ( supervised learning )
사물 검출 ( Object Detection )
cs231n lecture 8
Faster R-CNN ( Regions with Convolutional Neural Network )
후보 영역을 추출하고, CNN으로 각 영역을 분류한다.
https://arxiv.org/abs/1506.01497
요즘은 YOLO나 SSD도 많이 거론된다.
https://telecombcn-dl.github.io/2017-dlcv/slides/D3L4-objects.pdf
Faster R-CNN은 Region Proposal Network가 존재하는 반면, YOLO와 SSD는 없다.
그래서 정확도는 더 낮지만 속도가 real-time에 사용해도 될 정도로 빠르다.
YOLO
https://pjreddie.com/darknet/yolo/
https://arxiv.org/abs/1612.08242
https://github.com/hizhangp/yolo_tensorflow
SDD
https://arxiv.org/abs/1512.02325
이미지 유사성 판별 ( Image Similarity )
Deep Ranking
이건 구식 알고리즘일 가능성이... 다른 알고리즘 한번 찾아봐야 함.
분할 ( Segmentation )
이미지를 픽셀 수준에서 분류(구분) 하는 것을 말한다. supervised learning의 한 종류.
* 이미지를 인식해서 영역별로 나눠주게 된다.
FCN ( Fully Convolutional Network )
FC layer를 없애고 이를 같은 기능을 하는 Conv layer로 처리했다.
따라서 마지막 출력까지 공간적 정보를 유지할 수 있다.
https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf
사진 캡션 생성
NIC ( Neural Image Caption )
NIC는 Deep CNN + RNN(Recurrent Neural Network)으로 구성된다.
이런 식으로 여러 종류의 정보를 조합하고 처리하는 것을 멀티모달(multimodal) 프로세싱이라고 한다.
화풍 변환
https://arxiv.org/abs/1508.06576
'Machine Learning > Theses' 카테고리의 다른 글
A Multi-view Context-aware Approach to Android Malware Detection and Malicious Code Localization 정리 (0) | 2017.06.15 |
---|---|
Best Practices for Applying Deep Learning to Novel Application 정리 (0) | 2017.05.31 |
Deep learning malware detection (0) | 2017.04.30 |
ILSVRC2016 Hikvision팀과 Trimps-Soushen팀의 기법 (0) | 2017.04.25 |
Learning Fine-grained Image Similarity with Deep Ranking 정리 (0) | 2017.04.25 |