서지주요정보
Syntactic analysis of coordinate noun phrase = 병렬 명사구의 구문 해석
서명 / 저자 Syntactic analysis of coordinate noun phrase = 병렬 명사구의 구문 해석 / Cheol-Ho Kim.
발행사항 [대전 : 한국과학기술원, 1991].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8002343

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 9107

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

One of the major application of machine system is translation of scientific and technological writings. Compared with other kinds of texts, coordinate structures are frequently used in these texts. Coordination has received a great deal of attention in the linguistic literature. Every language has various aspects of coordinate structures which are dependent on its modifying structure. Korean is a flexible SOV language with rich postposition particles, and a lengthy object which is composed of prenominal modifiers between a subject and a verb. A coordination element used in the long object causes ambiguities in determining the scope of coordination. To obtain more natural translation result, proper determination of the scope of coordinate structure and elimination of ambiguities are important. This thesis describes an attempt to analyze Korean sentences into conceptual representation in machine translation, especially focusing on the coordinate noun phrases. We investigate the types of coordination in order to determine the scope of coordinate noun phrases, and propose a scheme to eliminate the ambiguities in syntactic analysis phase using heuristic information in surface sentences and distinctive features of the Korean coordinate noun phrases.

기계번역의 주요 대상 분야는 과학 기술문의 번역이며 다른 분야의 문장과 비교하여 병렬구조가 자주 사용된다. 병렬구조는 언어학 뿐만 아니라 전산 언어학에서도 많은 관심의 대상이었다. 특히 기계번역에서 이러한 병렬구조의 해석에서 발생하는 애매함을 제거하는 것은 매우 중요하다. 본 논문은 병렬 명사구의 범위 결정에서 발생하는 애매함을 해소하는 모형에 대한 것이다. 특히 문장에서 나타나는 표층 정보와 구문 정보를 이용한 휴리스틱이 애매함을 제거하는 데 깊은 레벨의 의미 해석이 없이도 효과적으로 작용하는 것을 보였다. 국어는 영어와 비교해 보면 접속 조사, 접속 부사 및 문장 부호와 같이 훨씬 복잡한 접속어를 사용하여 병렬구조를 구성한다. 본 논문에서 국어 명사구에 대한 병렬 기능과 특성을 나타내기 위하여 병렬 스키마를 제시하였으며 영어와 비교하였다. 또한, 국어 병렬구조를 구성하는 병렬 접속어를 조사하였으며, 이러한 접속어에 의해 구성되는 병렬 명사구의 형태를 조사한 결과 17 종류의 형태를 찾았다. 이들 대부분은 '와' 또는 '및'으로 구성되어 있으므로 이들에 의해 구성되는 형태를 중심으로 병렬 명사구 범위 결정에 사용할 수 있는 휴리스틱을 개발하였다. 한 문장 중에 여러개의 병렬 접속어가 있는 경우 각각의 접속어가 구성하는 병렬의 레벨을 결정하기 위하여 병렬 접속어를 3 레벨로 분류하여 구문해석에서 이용할 수 있도록 하였다. 본 논문에서 개발한 휴리스틱은 표층 문장 뿐만 아니라 국어 병렬 접속어와 병렬 명사구의 고유한 자질을 이용하였으며 이들 중에는 항상 성공하는 것과 가끔 실패하는 것도 있다. 성공률이 높은 휴리스틱 부터 차례대로 적용하고 모든 것을 다 적용하더라도 병렬 명사구의 범위가 결정되지 않을 때는 의미 자질을 이용하여 구문해석 프로그램에서 강제적으로 범위를 결정한다. 이와 같이 표층과 구문 레벨의 휴리스틱 정보를 통합하여 적용함으로써 병렬 명사구의 범위 결정에서 발생하는 애매함을 줄일 수 있어서 상당히 자연스러운 해석 결과를 얻을 수 있었다. 마지막으로 중간언어 방식을 따른 기계번역의 구문해석 단계에서 병렬 명사구 범위 결정시에 발생하는 애매함을 표층과 구문 레벨의 휴리스틱을 이용하여 제거하는 방안을 제안하였다.

서지기타정보

서지기타정보
청구기호 {DCS 9107
형태사항 [vi], 83 p. : 삽화 ; 26 cm
언어 영어
일반주기 Appendix : Yale romanization system for korean
저자명의 한글표기 : 김철호
지도교수의 영문표기 : Gil-Chang Kim
지도교수의 한글표기 : 김길창
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 Reference : p. 69-80
주제 Parsing (Computer grammar)
구문 분석 --과학기술용어시소러스
Natural language processing
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서