mldongseok
2018년 6월 20일
Deep Learning
R-CNN : Rich feature hierarchies for accurate object detection and semantic segmentation
Fast R-CNN
Faster R-CNN
Mask R-CNN
R-CNN
특징 : 느림, 전체 백프로파게이션이 안됨(SVM을 넣어서)
각각 바운딩 박스를 뽑아내고 잘라서 CNN에 적용
ROI들을 뽑아내고(2000개 정도), 동일한 CNN에 적용하여 수행,
결과를 SVM에 적용하여 분류
바운딩 박스 리그리션 : 뉴럴넷
초기 바운딩 박스를 뽑아내는 방법
Selective Search
1. 근접한 픽셀들 간의 상관관계를 정리하여 픽셀 뽑기
2. Merge 작업 : RGB, 영역간의 홀이 생기는지,
Training
이미지넷 기반 알렉스넷 프리 트레이닝
마지막 1000개 레이어를 잘라내서
softmax + log loss 를 추가해서 fine -tune을 진행
마지막 FD 레이어를 추출해서 SVM학습으로 사용
Bounding Box Regression
d or t를 찾아네는 loss function 정의
d는 g = p*d(p) + p로 정의
Fast R-CNN(2.3초)
R-CNN 과 SPP-net이 하지 못한
end-to-end 학습을 수행하였다.
초기 바운딩 박스는 selective search를 사용
FAST R-CNN ROI 풀링이다.
어떤 ROI가 나오더라도 피처맵에서 맥스 플링의 단위를 조절해서 일정한 ROI(예를들어 7x7)로 만들어 버린다
loss 함수 재정의 : smooth 함수 정의
단점 : selective search가 오래 걸린다는 문제점에 도달, 테스트 시간 느림(2.3초)
Faster R-CNN(0.2초(42초))
Selective Search를 Region Proposal Network(RPN)으로 바꾼
CPU에서 돌아가는 것은 GPU로 옴기기
RPN
9개의 anchor boxs 라는 개념 도입
socre : 인식된 박스가 물체다 아니다를 구분함
from https://www.youtube.com/watch?v=kcPAGIgBGRs&t=447s
좋아요