Causal knowledge is pervasive in various aspects of life. It allows us to plan actions to achieve goals. Many researchers have studied the tasks of automatic identification and extraction of causal relations between nouns from natural language text. However, the noun-noun causal relations may not reveal specific circumstances in which they are plausible. We notice that in causal relations between nouns, contextual information of causes can change the possibility of bringing about effects. Two nouns, earthquake and tsunami, for example, can be extracted as showing a causal relation, but it holds true only under a certain condition such as massive undersea earthquake that increases the chance of creating a tsunami. We refer the words like massive and undersea the causal context. Assuming that a causal relation between nouns needs a causal context for enhanced understanding, we focus on extracting causal contexts for the enrichment of a given causal relation. Our research is based on the premise that it would be possible and useful to extract the causal context words from sentences encoding causality between a cause noun and an effect noun. Based on the premise, we propose an automatic method for extracting context words of a cause noun. After extracting the context words, we build a classifier for determining whether the extracted words are actually the causal context. For learning our classifier, we propose two new features: a linguistic feature and a statistical feature. The experimental result shows that these proposed features improve the performance of the classifier.
인과에 대한 지식은 가장 유용한 지식 중 하나로 우리의 일상에 만연해 있다. 이러한 인과지식으로 사람은 나쁜 일을 피하거나 원하는 일을 얻기 위해 사용하며, 목표를 설정하고 행동을 계획하는데 이용된다. 인과지식은 자연어 텍스트에서도 빈번하게 등장하여 다양한 연구들이 추출된 인과지식을 여러 응용에 활용하였다. 예를 들어, 질의 응답에서 왜로 시작하는 물음에 답하거나, 미래의 사건을 예측, 의사 결정에 도움 등에 인과지식이 활용되었다. 인과 지식을 추출하는 과거의 연구들은 대부분 명사간 인과 관계를 가지는 문장들을 검출하고 문장 안에서 나타난 원인과 결과 쌍을 인과 지식으로 추출하였다. 우리는 명사간의 인과 관계 지식만으론 원인이 결과를 발생시키는 상황 설명이 부족하다는 것을 파악하였다. 원인에 어떠한 제약 조건이 원인의 의미를 제한 하느냐에 따라서, 결과에 대한 인과 추론이 매우 달라 질 수 있다. 인과 관계 중 하나인 지진과 쓰나미를 예를 들어, 강하고 해안에서의 지진은 쓰나미를 발생할 가능성이 있으나, 약한 지진과 내륙에서의 지진 발생은 쓰나미를 발생시킬 확률이 매우 적다. 지진의 문맥으로서 강도를 나타내는 강함과 위치인 해안에 대한 정보는 쓰나미를 발생시키는 매우 중요한 요인임을 알 수 있다. 이러한 정보들은 인과 추론 등 인과 지식을 활용하는 응용 시스템에 있어 매우 가치 있는 정보가 될 수 있다. 해당 연구에서는 원인이 결과를 발생시키는 확률을 높여주는 조건들을 인과적 문맥 정보 라고 명명하고, 이 정보를 찾는 연구를 제안한다. 이 논문에서는 인과 정보가 될 수 있는 단어 후보들을 추출하는 과정을 만들고 인과 문맥으로 분류 할 수 있는 확률적 자질과 내용적 자질을 제안하여 분류기를 학습하였다. 실험 결과 제안한 자질들은 분류기의 성능을 높이는 효과적인 자질임을 보였다.