서지주요정보
(An) analysis of the roles of semantic answer types for contemporary machine reading question answering models = 최신 질의응답 독해모델의 의미론적 정답유형 활용에 대한 분석
서명 / 저자 (An) analysis of the roles of semantic answer types for contemporary machine reading question answering models = 최신 질의응답 독해모델의 의미론적 정답유형 활용에 대한 분석 / Do-Yeon Lim.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8035299

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 20001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Recently, the performance of Machine Reading Question Answering (MRQA) models has surpassed humans on datasets like SQuAD. For further advances in MRQA techniques, new datasets are being introduced. However, they are rarely based on a deep understanding of the QA capabilities of the existing models tested on the previous datasets. In this study, we analyze the SQuAD and triviaQA dataset quantitatively and qualitatively to show how the MRQA models answer the questions. It turns out that the current MRQA models rely heavily on the use of wh-words and Lexical Answer Types (LAT) in the questions instead of attempting to make use of the meanings of the entire questions and the evidence documents. Based on this analysis, we present the directions for new datasets so that they can help advancing the current QA techniques centered around the MRQA models.

최근, 질의응답 독해모델의 성능이 SQuAD등의 데이터셋에 대하여 사람의 성능을 넘어섰다. 질의응답 독해모델의 향상을 위해서 새로운 데이터 셋들이 제안되고 있다. 하지만, 대부분 기존 질의 응답 모델이 기존 데이터 셋에서 파악되는 역량에 대한 깊은 이해없이 제안된다. 이 연구에서는, SQuAD와 triviaQA 데이터셋을 대상으로 질의응답 독해모델이 정성적, 정량적으로 어떻게 정답을 내는지에 대해 분석한다. 현재 질의응답 독해모델은 질문의 전체 의미보다는 정답유형이라고 말할 수 있는 wh-단어와 어휘적 정답 유형에 의존을 하고 있는 것이 밝혀졌다. 이러한 분석을 바탕으로 우리는 새로운 질의응답 데이터셋의 방향과 질의응답 모델의 향상을 위한 기술들을 제안한다.

서지기타정보

서지기타정보
청구기호 {MCS 20001
형태사항 iii, 19 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 임도연
지도교수의 영문표기 : Sung-Hyon Myaeng
지도교수의 한글표기 : 맹성현
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 Icluding reference.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서