실제 작동 상태를 확인하려면 라이브 사이트로 이동하세요.

Standing on the Shoulder

-Isaac Newton-

신규 게시물

mldongseok
2018년 6월 20일
R-CNN, Fast R-CNN, Faster R-CNN
Deep Learning
R-CNN : Rich feature hierarchies for accurate object detection and semantic segmentation Fast R-CNN Faster R-CNN Mask R-CNN R-CNN 특징 : 느림, 전체 백프로파게이션이 안됨(SVM을 넣어서) 각각 바운딩 박스를 뽑아내고 잘라서 CNN에 적용 ROI들을 뽑아내고(2000개 정도), 동일한 CNN에 적용하여 수행, 결과를 SVM에 적용하여 분류 바운딩 박스 리그리션 : 뉴럴넷 초기 바운딩 박스를 뽑아내는 방법 Selective Search 1. 근접한 픽셀들 간의 상관관계를 정리하여 픽셀 뽑기 2. Merge 작업 : RGB, 영역간의 홀이 생기는지, Training 이미지넷 기반 알렉스넷 프리 트레이닝 마지막 1000개 레이어를 잘라내서 softmax + log loss 를 추가해서 fine -tune을 진행 마지막 FD 레이어를 추출해서 SVM학습으로 사용 Bounding Box Regression d or t를 찾아네는 loss function 정의 d는 g = p*d(p) + p로 정의 Fast R-CNN(2.3초) R-CNN 과 SPP-net이 하지 못한 end-to-end 학습을 수행하였다. 초기 바운딩 박스는 selective search를 사용 FAST R-CNN ROI 풀링이다. 어떤 ROI가 나오더라도 피처맵에서 맥스 플링의 단위를 조절해서 일정한 ROI(예를들어 7x7)로 만들어 버린다 loss 함수 재정의 : smooth 함수 정의 단점 : selective search가 오래 걸린다는 문제점에 도달, 테스트 시간 느림(2.3초) Faster R-CNN(0.2초(42초)) Selective Search를 Region Proposal Network(RPN)으로 바꾼 CPU에서 돌아가는 것은 GPU로 옴기기 RPN 9개의 anchor boxs 라는 개념 도입 socre : 인식된 박스가 물체다 아니다를 구분함 from https://www.youtube.com/watch?v=kcPAGIgBGRs&t=447s
좋아요
0
mldongseok
2018년 5월 05일
Convolution pose machine
Hand Pose Estimation
데이터 베이스 확장 2만개 = > 20만개 입려 사이즈 변환 : 256 => 368 스테이지 변환 5 => 6 데이터 아규먼트 변환 = > 적응형 확대 추가 중간 저장 1000단위 데이터 저장 : 스탭, learning rate, time, s1 lose ~ s6 loss, Total loss
좋아요
0
mldongseok
2018년 5월 01일
[Paper]GANerated Hands for Real-Time 3D Hand Tracking from M
Hand Pose Estimation
Mueller, Franziska, Florian Bernard, Oleksandr Sotnychenko, Dushyant Mehta, Srinath Sridhar, Dan Casas, and Christian Theobalt. "GANerated Hands for Real-time 3D Hand Tracking from Monocular RGB." arXiv preprint arXiv:1712.01057(2017). Abstract 본 논문은 단안의 RGB 시퀀스를 기반으로 실시간 3D 손 추적 문제를 해결합니다. 추적 방법은 CNN와 운동 3D 손 모델을 결합하여 보이지 않는 데이터를 일반화하고, 폐색 및 카메라 시점을 다양하게하며, 해부학적으로 의미를 가지는 손 동작을 유도합니다. 우리는 CNN을 훈련시키기 위해 기하학적으로 일관된 이미지 - 이미지 변환 네트워크를 기반으로하는 훈련 데이터의 합성 생성을 위한 새로운 접근법을 제안합니다. 구체적으로, 합성 이미지를 "실제"이미지로 변환하는 신경망을 사용하여 생성된 이미지가 실제 손 이미지와 동일한 통계 분포를 따르도록 합니다. 변환 네트워크를 학습하기 위해 번역 중 기하학적 속성 (예 : 손 포즈)을 유지하기 위해 기하학적 일관성 손실이 있는 대다수의 손실 및 주기 일관성 손실을 계산합니다. 우리의 손 추적 시스템은 도전적인 RGB 전용 영상 자료에서 현재의 최첨단 기술보다 뛰어나다는 것을 입증합니다
좋아요
0

Dongseok Yang

Computer Science, Rehabilitation

Standing on the Shoulder

CONTACT ME

Standing on the Shoulder

Deep Learning

Programing

Localization and Mapping

Hand Pose Estimation

Rehabilitation

Etc