3D shape reconstruction is an active research topic in computer vision and we propose a reliable and low cost system to acquire a 3D shape using multi-view input videos in this thesis.
In this system, we record clips of a hand-held object or string puppet from two webcams and then estimate camera poses and 3D structure using SFM (Structure from Motion) method. However, as the 3D structure from SFM is too sparse so we use SFS (Shape from Silhouette) method to represent 3D object densely. And we propose keyframe selection algorithm for efficient representation. Keyframe selection algorithm is applied to reduce computational complexity and execution time by removing redundant and unnecessary images among adjacent views. The effectiveness of proposed keyframe selection algorithm will be shown in this thesis. After bundle adjustment procedure using selected keyframes, we finally acquire 3D shape and represent it densely.
After performing on several datasets in the experiments, the proposed system shows the ability to reconstruct 3D object efficiently.
본 논문에서는 3차원 물체의 외형 정보를 적은 비용으로 효율적으로 복원하는 시스템을 제안한다. 제안한 시스템에서는 카메라의 포즈를 쉽고 강인하게 추정하기 위해 두 대의 웹캠을 사용하여 특징점을 추출하고 이를 정합하는 SFM 방법을 이용하여 물체의 3차원 구조와 카메라 파라미터를 추정하고, SFS 방법을 이용하여 3차원 물체를 조밀하게 표현 한다.
특히 본 논문에서는 3차원 물체의 외형 정보를 효율적으로 획득하기 위한 전체적인 시스템을 구축하기 위해서 다음과 같은 여러 가지 방법을 제안한다.
첫째, 두 대의 카메라를 서로 동기화 시키는 방법을 제안한다. 제안한 방법은 두 웹캡과 PC를 이용하여 카메라 네트워크를 구성하고 각 서버 PC의 내부 클럭을 이용하여 별도의 하드웨어 장치 없이 두 카메라를 소프트웨어적으로 동기화 시킨다. 둘째, 정확한 특징점 정합과 텍스처 맵 복원을 위해 영상의 고주파 성분을 분석하여 움직이는 물체를 촬영함으로써 발생하는 초점이 맞지 않거나 흔들림이 있는 영상을 제거하는 방법을 제안한다. 셋째, 물체를 3차원으로 효율적으로 복원하기 위해 키프레임을 선정하는 방법을 제안한다. 키프레임은 텍스처 맵과 지오메트리 복원이 잘 되면서 동시에 인접한 시점 사이에 정보의 중복이 최소화 되는 영상들로 선정 한다. 선정된 키프레임을 이용하여 물체를 복원하면 좋은 복원 결과를 보이면서도 시스템의 전체 수행 시간을 크게 단축시킬 수 있는 장점이 있다. 마지막으로 텍스처 맵을 복원할 때 손에 의해 물체가 가려진 영역이 참조되지 않도록 하기 위해 피부 검출 방법과 SFS 방법의 특성을 함께 이용하여 손에 의해 가려진 부분을 효율적으로 탐지하는 방법을 제안한다.