서지주요정보
Social network-based user profile data inference : a systematic method for assessing user profile reliability = 소셜 네트워크 분석을 통한 사용자 프로파일 추론에 대한 연구
서명 / 저자 Social network-based user profile data inference : a systematic method for assessing user profile reliability = 소셜 네트워크 분석을 통한 사용자 프로파일 추론에 대한 연구 / Sung-Hyuk Park.
저자명 Park, Sung-Hyuk ; 박성혁
발행사항 [대전 : 한국과학기술원, 2011].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025765

소장위치/청구기호

학술문화관(문화관) 보존서고

DMT 11001

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

등록번호

9004553

소장위치/청구기호

서울 학위논문 서가

DMT 11001 c. 2

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Correct user profile data are essential for successful implementation of corporate customer relationship management (CRM) and recommender systems. A company often receives incorrect user profiles or collects incomplete user information when users are unwilling to provide personal information. To address this problem, I propose a user profile quality management system. Specifically, I design and implement a cooperative query answering system that provides correct inferences about uncertain user profile information by drawing on the profile information of a user’s social network neighbors. The proposed system is based on a statistical inference model to predict the real age of users. Specifically, the system improves inference accuracy by using a top-k selection mechanism based on an entropy measure. This empirical study uses a large dataset of real user profile information and communication data to construct a social network and a user profile inference model. Through several experiments, I show that the proposed system outperforms competing models in terms of predictive power for user actual age. The experiment results has described with the concept of homophily. In addition, this paper proposes a user profile inference theory based on simulation. The goal of simulation is supporting the known limitation of real data analysis due to the existence of distorted information and checking the robustness of the proposed method. Managerial implications are discussed with respect to how a company’s legacy systems such as CRM and recommender systems can benefit from the system, specifically by maintaining correct and reliable user profile data.

기업의 정보 시스템에서 사용되는 데이터 가운데, 사용자가 스스로 자신의 정보를 입력함으로써 수집되는 자기 보고식 정보(self-reported data)에 대해서는 기업이 주도적으로 품질을 관리하기 어렵다는 문제가 발생한다. 이를 해결하고자, 본 연구에서는 시스템 관점에서 자기 보고식 프로파일 정보의 신뢰성을 평가하는 방법론을 제안한다. 구체적으로, 연구 1에서는 특정 사용자의 연령 값에 대한 진위 여부를 파악하기 위하여, 사회 관계망 상에서 그 사람과 인접한 이웃 사용자들로부터 연령 정보를 수집하여 연령 분포를 만든 다음, 가장 가능성 높은 연령대를 제안하는 모형을 개발하였다. 또한, 모형에 의한 사용자 연령 프로파일 추론 과정을 설명하기 위하여 사회 과학 분야에서 연구된 바 있는 동질성(homophily) 이론을 소개하였다. 국내 이동통신사의 사용자 데이터를 이용하여 실증 분석을 수행하였으며, 실제로 통화 발신자의 연령 프로파일 값에 대한 신뢰성 여부를 판단하였다. 실험 결과를 통하여 본 연구에서 제안하고 있는 관계형 추론 모형이 비교 모형보다 더 높은 정확도를 보이는 것을 확인하였다. 다음으로, 추론에 사용되는 이웃 사용자들로부터 수집된 정보 역시 자기 보고식 정보이므로 허위 정보가 포함되어 있다는 점을 고려하여, 이러한 단점을 극복하기 위한 연구 2에서는 시뮬레이션 기법을 활용한 실험을 통해 허위 정보가 차지하는 비율이 증가할수록 사용자 프로파일 추론 모형의 정확도가 어떻게 달라지는지를 알아보고자 하였다. 분석 결과에서, 수집된 데이터의 오염수준이 높을 경우라도 추론에 사용되는 정보량이 이에 비례하게 증가한다면 추론 정확도를 일정수준 이상으로 유지할 수 있다는 것을 확인하였다. 즉, 허위 정보가 존재하는 경우에도 사용자 프로파일 신뢰성 평가 모형이 적용 가능한 상황을 설명하였다는 측면에서 기존연구에 기여하며, 시뮬레이션 결과에서 도출한 시사점을 바탕으로 일반화된 모형을 소개함으로써, 실제 업무 현장에서 이와 유사한 방식의 모형을 적용할 수 있는 이론적 틀을 제안하였다. 본 논문은 데이터 분석결과에서 얻어진 시사점 도출 및 사용자 프로파일 추론 방법론을 위한 이론 정립을 바탕으로, 학문적으로 기여할 뿐만 아니라, 기업 현장에서 손쉽게 사용될 수 있는 마케팅 솔루션을 개발하였다는 측면에서 실용적으로도 활용 가치가 높다.

서지기타정보

서지기타정보
청구기호 {DMT 11001
형태사항 v, 109 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박성혁
지도교수의 영문표기 : Soon-Young Huh
지도교수의 한글표기 : 허순영
Appendix : 1, COs' Age Distributions by CR's Age. - 2, Simulation Result: Changes of the Number of CRs. - 3, Simulation Result: Changes of the Portion of False Data. - 4, Simulation Result: Low Entropy Effect. - 5, Gender Profile Inference Result.
학위논문 학위논문(석사) - 한국과학기술원 : 경영공학과,
서지주기 References : p. 65-70
주제 Data Quality
User Profile
Social Network
Relational Inference
Homophily
데이터 품질
사용자 프로파일
사회 관계망
관계형 추론
동질성 이론
QR CODE qr code