한국어 병렬구문과 결합범주문법에서의 구문분석 = Coordinate constructions in Korean and parsing issues in combinatory categorial grammar
서명 / 저자 한국어 병렬구문과 결합범주문법에서의 구문분석 = Coordinate constructions in Korean and parsing issues in combinatory categorial grammar / 조형준.
발행사항 [대전 : 한국과학기술원, 2000].
Online Access 원문보기 원문인쇄





Coordinate constructions are widely used in natural language and constitute important sentence patterns. But they pose a number of difficulties to natural language processing, due to the increased complexity of syntactic analysis, the syntactic ambiguity of the involved lexical items, and the apparent deletion of predicates in various places. Since most grammars consider only standard constituents, they face serious problems in processing nonstandard constituents that are induced by coordination. In this thesis, we address the syntactic characteristics of coordinate constructions in Korean from the viewpoint of constructing a competence grammar, and analyze these constructions with a combinatory categorial grammar. The analysis allows us to suggest reduction rules, that are specific to Korean. We also describe information structure for Korean with a particle `un/nun',pitch accents and other surface structures. The discourse roles of coordinate constructions are identified by information structure. And we show how to utilize a unified lexicon in the proposed grammar formalism in deriving the sentential semantics and associated information structures as well, in order to capture the discourse functions of coordinate constructions in Korean. We then present some parsing problems that are due to spurious ambiguity and structural ambiguity in Korean noun phrase conjuncts. The problems of spurious ambiguity can be better addressed with semantic structures that are computed during parsing. In order to resolve the structural ambiguity of Korean noun phrase conjunction, we use the co-occurrence similarity information of nouns. Finally, we improve the precision of co-occurrence similarity with a hand-crafted thesaurus.

사람이 사용하는 자연언어는 정해진 구문 형식과 의미가 있는 인공 언어와 달리 매우 다양하게 표현되며, 사용하는 어휘도 제한되어 있지 않고, 비정형화된 문장도 사용된다. 특히 병렬구문은 자주 사용되는 문형임에도 불구하고 분석의 복잡성, 단어의 중의성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 대부분의 한국어처리를 위한 문법들이 정규문장성분만을 고려해서 고안되었기 때문에 서술어의 생략으로 인해 병렬문의 접속항에 나타나는 비정규문장성분을 표현하고 의미를 분석하는데 한계를 보이고 있다. 본 논문에서는 한국어에서 발생하는 다양한 형태의 병렬문을 능력문법 (competence grammar)의 입장에서 논의하고 논의된 다양한 형태의 병렬문을 결합범주문법을 이용해 설명한다. 서술어의 생략으로 인해 발생하는 비정규문장성분을 결합범주문법의 type raising과 composition 축약규칙을 이용해 문법적, 의미적으로 해결 한다. 병렬구문을 처리하는 과정에서 적용된 축약규칙을 바탕으로 한국어 병렬문처리를 위한 축약규칙을 제안한다. 제안된 결합범주문법의 축약규칙은 한국어에서 나타나는 다양한 형태의 접속항을 문법적, 의미적으로 처리할 수 있으므로 병렬문 이외의 다양한 한국어 문형을 처리하는 데에도 적용 가능하다고 볼 수 있다. 한국어 조사 `은/는'과 문장에서 나타나는 고저 악센트 (pitch accent)를 바탕으로 한국어에 대한 정보구조 (information structure)를 제안하고 이를 통해 한국어 병렬문에서 나타나는 나열과 대조의 문맥적 기능를 구별한다. 제안된 축약규칙과 정보구조를 이용해 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 문법적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다.한국어 명사구 병렬의 구조적 애매성으로 인한 구문분석상의 문제점에 대해 논의한다. 결합범주문법이 통사적 처리와 의미적 처리를 점진적으로 동시에 할 수 있다는 특징을 이용하여 spurious ambiguity로 인한 문제점에 대한 개선책을 제시하고 말뭉치에서 쓰인 용례를 기반으로 한 명사들간의 공기 유사도을 이용하여 명사구 병렬의구조적 애매성을 해소한다. 말뭉치에 나타나는 용례의 부족에 기인한 공기 유사도 정보의 오류를 수동으로 구축한 시소러스를 이용하여 개선한다.


청구기호 {MCS 00048
형태사항 iv, 49 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Hyung-Joon Cho
지도교수의 한글표기 : 박종철
지도교수의 영문표기 : Jong-Cheol Park
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 47-49





