서지주요정보
교차 언어 전이를 이용한 한국어 프레임 의미 분석 = Korean frame-semantic parsing with cross-lingual transfer
서명 / 저자 교차 언어 전이를 이용한 한국어 프레임 의미 분석 = Korean frame-semantic parsing with cross-lingual transfer / 함영균.
발행사항 [대전 : 한국과학기술원, 2021].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8037506

소장위치/청구기호

학술문화관(문화관) 보존서고

DWST 21001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Frame-semantic parsing is an advanced NLP task to understand the meaning of text using FrameNet. Interest in multilingual frame-semantic parsing has been increasing; however, building non-English FrameNets and frame-semantic parsers remains challenging due to the expense and complexity of building FrameNet annotated corpora and models for the target languages. In this dissertation, we argue that cross-lingual transfer methods leverage knowledge from a rich-resource language (e.g., English) to a target language on the frame-semantic parsing task. We explore the impact of the cross-lingual transfer methods and show experimental results that support this hypothesis. We describe three approaches for cross-lingual transfer for Korean frame-semantic parsing in order to build an initial model and improve the performance, including domain adaptation. The first is transferring annotations approach to build an initial version of Korean FrameNet from existing FrameNets as an explicit cross-lingual transfer method. Second, we propose a language-independent frame-semantic parsing model for implicit cross-lingual transfer learning from existing English FrameNet. Finally, we analyze several domain adaptation methods to improve the performance of the model for new domains that cannot be acquired in cross-lingual transfer learning. We conclude by illustrating benefits of cross-lingual transfer methods for building resources and models for Korean frame-semantic parsing.

본 논문에서는 한국어 의미 분석을 위한 교차 언어 전이 방법론을 다루었다. 프레임 의미 분석이란 프레임넷의 프레임 의미론에 기반하여 텍스트의 의미를 이해하는 자연언어처리 태스크중 하나이다. 최근 다국어 프레임 의미 분석에 대한 관심이 높아지고 있으나, 비 영어권 프레임넷 구축이나 의미 분석기 개발은 대상언어 데이터 및 모델 구축의 비용과 복잡함에 의해 도전과제로 여겨지고 있다. 본 논문에서는 교차 언어 전이 방법이 기존의 풍부한 언어자원을 가진 언어(예: 영어)의 지식이 효과적으로 대상 언어의 프레임 의미 분석에 적용될 수 있음을 주장한다. 본 논문은 한국어 프레임 의미 분석기을 위해 다음의 세 가지 방법을 적용했다. 첫 째로 주석 전이 방법을 통해 기존에 존재하는 프레임넷 주석으로부터 한국어 프레임넷의 초기 주석을 전이하였다. 두 번째는 교차 언어 전이 학습 방법이다. 언어 독립적 아키텍쳐를 통해 영어 프레임넷의 활용으로 한국어 모델의 성능을 향상시켰다. 세 번째는 도메인 적응이다. 한국어의 다양한 도메인에 적용될 수 있는 모델을 위하여 비지도학습방법을 통해 도메인 적응력을 보완하였다. 상기의 방법들에 대한 정량적 평가와 정성적 평가를 통하여, 본 논문은 교차 언어 전이 방법을 통한 한국어 프레임넷과 프레임 의미 분석기 구축이 효과적인 방법임을 보였다.

서지기타정보

서지기타정보
청구기호 {DWST 21001
형태사항 iii, 103 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Younggyun Hahm
지도교수의 한글표기 : 최기선
지도교수의 영문표기 : Key-Sun Choi
부록 수록
학위논문 학위논문(박사) - 한국과학기술원 : 웹사이언스대학원,
서지주기 참고문헌 : p. 93-99
QR CODE qr code

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서