서지주요정보
On prediction of the answer affordance with the vocabulary power in CQA systems = Q&A 시스템에서 어휘력에 기반한 초기 전문가 예측
서명 / 저자 On prediction of the answer affordance with the vocabulary power in CQA systems = Q&A 시스템에서 어휘력에 기반한 초기 전문가 예측 / Ju-Yup Sung.
저자명 Sung, Ju-Yup ; 성주엽
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025252

소장위치/청구기호

학술문화관(문화관) 보존서고

MKSE 13006

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

리뷰정보

초록정보

Research into routing questions to appropriate answerers has recently attracted a lot of attention. The answerers are required to have expertise in the question area as well as availability to answer the question. However, when choosing proper answerers through a data set, there is a trade-off relationship between those two features. An expert is usually identified by past abundant answer data while the expert is possibly not available at the present moment. Thus, finding experts in an early phase when they are still active is essential to improve the chances of getting answers back. In this thesis, we propose a framework to predict the expertise level and availability of new answerers who only possess a small amount of data, which is a cold start problem. Co-occurrence of vocabulary in a similar category between answerers, irrespective of time, is a key to solving this problem. Experts can disclose their expertise using their vocabulary in a tiny set of content. Their expertise along with their recent behavior is reflected in the Answer Affordance defined in this thesis. Extensive experiments are conducted in two categories with a large data set of Naver Knowledge-In, the top CQA service in Korea. First, we verify the expertise of the answerers ranked at the top by our algorithm. Then, we show how such users will play important roles in the future by evaluating their expertise and availability, with the scores of the Answer Affordance. As a result, the new answerers with high Answer Affordance scores clearly show not only their expertise but also their real activity.

최근 CQA(Community Question and Answering) 시스템에서 질문을 적합한 답변자에게 바로 전달하여 주는 방법에 관한 많은 연구가 있었다. 답변자는 특정 질문에 적합한 답변자로 선택받기 위해서 질문 분야에 대한 전문성(Expertise)뿐만 아니라 질문을 받은 시점에 그 질문을 답변할 수 있는 시간이 필요하다(Availability). 하지만 그런 적합한 답변자를 데이터를 분석함으로써 선택하는 과정에서 Expertise와 Availability는 서로 대립되어 Trade-off 관계가 발생한다. Expertise는 보통 답변자가 기록한 풍부한 답변 데이터를 바탕으로 판가름하지만 오래 전부터 답변해왔던 답변자보다 최근에 막 답변을 달기 시작한 사람이 더 답변을 할 가능성이 높다. 따라서 최근 답변을 했던 답변자 가운데 Expertise을 찾을 수 있어야 하는데 그들의 부족한 데이터로부터 Expertise를 유추해내는 것은 전형적인 Cold Start Problem이라 할 수 있다. 본 논문에서 우리는 충분치 않은 답변 데이터를 가지고 있는 새로운 답변자 가운데 그들의 Expertise와 Availability를 동시에 고려하여 질문을 전달하기에 적합한 사용자를 찾는 Framework를 만들었다. 주요 요소로써 우리는 유사한 분야에서 답변을 한 시간과는 상관없이 중복된 어휘가 발생한다는 점을 고려하였다. 답변자는 적은 답변에서도 여러 어휘들의 조합으로 자신의 Expertise를 드러낸다. 실험을 위해 우리는 한국의 최대 Q\&A 서비스인 네이버 지식인의 두 카테고리에서 광범위한 Q\&A 데이터를 수집하였다. 먼저 전문적인 답변자 순위를 구하는 우리의 알고리즘을 통해 얻어진 결과가 실제 전문성을 잘 유추해내는지 증명하였다. 그리고 Expertise와 Availability 속성을 결합한 Answer Affordance의 결과로 얻어진 상위 답변자들이 실제 네이버 지식인에서 얼마나 중요한 역할을 하는지를 평가하였다. 그 결과 우리는 새로운 답변자 가운데 Answer Affordance를 통해 얻어진 상위 답변자들이 그들의 Expertise와 Availability를 동시에 가지고 있음을 보였다.

서지기타정보

서지기타정보
청구기호 {MKSE 13006
형태사항 vi, 55 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 성주엽
지도교수의 영문표기 : Jae-Gil Lee
지도교수의 한글표기 : 이재길
학위논문 학위논문(석사) - 한국과학기술원 : 지식서비스공학과,
서지주기 References : p. 49-52
주제 Data mining
Q&A
Expert finding
New answerer
Vocabulary
데이터 마이닝
질의응답시스템
전문가 예측
새로운 답변자
어휘
QR CODE qr code