서지주요정보
Towards formality-aware neural machine translation by leveraging context information = 문맥 정보를 활용한 문체 인식 신경망 기계 번역
서명 / 저자 Towards formality-aware neural machine translation by leveraging context information = 문맥 정보를 활용한 문체 인식 신경망 기계 번역 / Do Hee Kim.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8041705

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 23065

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Formality is one of the most important linguistic properties to determine the naturalness of translation. Although a target-side context contains formality-related tokens, the sparsity within the context makes it difficult for context-aware neural machine translation (NMT) models to properly discern them. In this paper, we introduce a novel training method to explicitly inform the NMT model by pinpointing key informative tokens using a formality classifier. Given a target context, the formality classifier guides the model to concentrate on the formality-related tokens within the context. Additionally, we modify the standard cross-entropy loss, especially toward the formality-related tokens obtained from the classifier. Experimental results show that our approaches not only improve overall translation quality but also reflect the appropriate formality from the target context.

문체는 번역의 자연스러움을 결정하는 가장 중요한 언어적 요소 중 하나다. 타깃 언어의 문맥에 문체와 관련된 토큰이 포함되어 있지만, 문맥 내의 희소성으로 인해 문맥 인식 신경망 기계 번역 모델은 이를 분별하기 어렵다. 따라서, 본 논문에서는 문체 분류기를 사용하여 핵심 정보가 내포된 토큰을 정확하게 파악하여 신경망 기계 번역 모델에 명시적으로 알려주는 새로운 훈련 방법을 제안한다. 타깃 언어의 문맥이 주어지면, 문체 분류기는 모델이 문맥 내 문체와 관련된 토큰에 집중할 수 있도록 안내한다. 또한, 특히 분류기로부터 얻은 문체와 관련된 토큰을 대상으로 변형된 크로스 엔트로피 손실 함수를 적용한다. 실험 결과, 본 논문의 방법론이 전반적인 번역 품질을 향상 시킬 뿐만 아니라, 타깃 언어의 문맥으로부터 적절한 문체를 반영한다는 것을 보여준다.

서지기타정보

서지기타정보
청구기호 {MAI 23065
형태사항 iii, 15 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김도희
지도교수의 영문표기 : Jaegul Choo
지도교수의 한글표기 : 주재걸
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 11-13
주제 Neural machine translation
Context-aware translation
Formality control
Single encoder approach
신경망 기계 번역
문맥 인식 번역
문체 생성 제어
단일 인코더 방법론
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서