This thesis addresses a continuous authentication system using document reading behavior. Continuous authentication typically uses behavioral biometrics such as command sequence, keystroke, or mouse movement dynamics. By using behavioral biometrics, it satisfies two conditions for continuous authentication: non-intrusive and transparency. Based on the inherent behavior for individuals, document reading behavior is one of behavioral biometrics newly proposed in this thesis. A logger program, as a form of macro for Microsoft Word, was made to record events related to individual`s document reading behavior.
In pilot experiment, five features were extracted from the attributes which can be gathered via the logger program. Machine learning was conducted with Na\"ive Bayes algorithm. I confirmed the possibility of continuous authentication system using document reading behavior. Then, the features were modified to represent concrete reading behavior. There are three features rearranged in main experiment. Machine learning was conducted with Na\"ive Bayes, Support Vector Machine, Random Forest, and Classification and Regression Trees (CART) classifier. Evaluation result shows that Random Forest achieved comparably better performance in terms of false positive rate and false negative rate.
According to the performance result through machine learning, the continuous authentication method using user`s documeent reading behavior is efficient to verify the identity of user. Also it is confirmed that the continuous authentication method is a proper defense method against masquerade attack.
본 논문에서는 문서 읽기 행위를 이용한 지속적 인증 시스템을 제안한다. 지속적 인증에서는 입력 명령어 순서, 키보드 타이핑, 마우스 움직임 등과 같은 행위기반 생체인증 방식을 이용한다. 행위기반 생체인증 방식을 사용함으로써, 지속적 인증 시스템의 요건인 무간섭과 투명성을 만족한다. 이 연구에서 제안하는 문서 읽기 행위도 행위기반 생체인증 방식 중 하나로써, 개별적으로 고유한 문서 읽기 패턴을 가지고 있다는 것에 기반한다. 문서 읽기 행위를 관찰하기 위하여 많이 사용되는 워드프로세서 중 하나인 마이크로소프트 워드에 매크로 형식의 로거 프로그램을 개발하였다.
파일럿 실험에서는 이 로거 프로그램으로부터 추출할 수 있는 속성들에 기반하여 다섯 가지 특징들을 추출하였고, 나이브 베이지안 분류기를 이용하여 기계학습을 수행한 결과 문서 읽기 행위를 이용한 사용자 인증 시스템의 가능성을 확인하였다. 이후 특징들을 수정하여 본 실험에서는 세 가지 특징들로 재정리하여 기계 학습을 수행하였다. 기계학습에는 나이브 베이지안, 지지도 벡터 기계, 랜덤 포레스트, CART 분류기를 이용하였다. 기계학습 수행 결과 거짓 긍정률과 거짓 부정률에서 랜덤 포레스트에서 비교적 우수한 성능을 보였다.
기계 학습을 통한 성능 평가 결과 사용자의 문서 읽기 행위를 이용한 지속적 인증 방법은 효과적이며, 인증하고자 하는 사람에 대하여 효과적으로 인증하고 위장자 공격에 대하여 적절한 방어 수단이 됨을 확인하였다.