Time-aware representation learning for time-sensitive question answering = 시간에 민감한 질문에 대한 답변을 위한 질의응답 언어모델의 시간 인식 및 표현 학습
서명 / 저자 Time-aware representation learning for time-sensitive question answering = 시간에 민감한 질문에 대한 답변을 위한 질의응답 언어모델의 시간 인식 및 표현 학습 / Jungbin Son.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄





학술문화관(도서관)2층 학위논문

MCS 23042

휴대폰 전송







Time is one of the crucial factors in real-world question answering (QA) problems. However, language models have difficulty understanding the relationships between time specifiers, such as `after' and `before', and numbers, since existing QA datasets do not include sufficient time expressions. To address this issue, we propose a Time-Context aware Question Answering (TCQA) framework. We suggest a Time-Context dependent Span Extraction (TCSE) task, and build a time-context dependent data generation framework for model training. Moreover, we present a metric to evaluate the time awareness of the QA model using TCSE. The TCSE task consists of a question and four sentence candidates classified as correct or incorrect based on time and context. The model is trained to extract the answer span from the sentence that is both correct in time and context. The model trained with TCQA outperforms baseline models up to 8.5 of the F1-score in the TimeQA dataset.

시간은 실생활의 질의 응답 문제에서 가장 중요한 요소 중 하나이다. 그러나 기존 질의응답 데이터셋에는 다양한 시간 표현과 숫자 간의 관계를 학습하기 위한 충분한 정보가 주어지지 않기 때문에, 언어 모델은 질문 답변 시 시간 제약 조건을 고려하거나, "after"과 "before"과 같은 시간 표현과 숫자와의 관계를 잘 이해하지 못한다. 이 문제를 해결하기 위해 시간-맥락 인식 질의 응답 프레임워크 (TCQA) 를 제안한다. 시간-맥락에 종속적인 정답 단어 추출 태스크 (TCSE) 를 정의하고, 모델 훈련을 위한 시간-맥락 종속적인 데이터 생성 프레임워크를 구축한다. 또한 TCSE를 사용하여 질의응답 모델의 시간 인식을 평가하기 위한 새로운 평가 지표를 제시한다. TCSE 데이터는 질문과, 질문에 대해 시간과 맥락의 관점에서 각각 일치하는지 아닌 지에 따라 네 가지 유형으로 분류된 문장으로 구성된다. 모델은 질의응답 작업에서 시간과 문맥이 모두 맞는 문장에서 정답을 추출하도록 학습 된다. TCSE 태스크로 학습된 모델은 TimeQA 데이터셋의 F1-score에서 베이스라인 모델보다 최대 8.5점까지 더 높은 성능을 보인다.


청구기호 {MCS 23042
형태사항 iv, 20 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 손정빈
지도교수의 영문표기 : Alice Oh
지도교수의 한글표기 : 오혜연
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 18-19
주제 Language model
Question answering model
Time embedding
Contrastive learning
Multi-task learning
Natural Language Processing
언어 모델
질의 응답 모델
시간 임베딩
대조 학습
멀티 태스크 학습
자연어 처리





이 주제의 인기대출도서