Case role assignment(CA), assigning proper thematic case roles to sentence constituents, is an important aspect of the natural language processing. Conventional approaches based on some ad-hoc scheme provide no schema learning procedure and degree of goodness of the CA decision. In this dissertation, a probabilistic model of case assignment is proposed, which is based on an incremental probabilistic learning of schema. The schema is a set of generalized case frames and captures probabilistic rules of alternative CA decisions with degrees of goodness of fit from training data. McClleland and Kawamoto's, and Miikkulainen and Dyer's PDP model also learn schema by the back-propagation learning procedure on a feedforward network and they applied the learned schema to the CA task. However the back-propagation learning requires time-consuming cyclic presentation of a complete set of examplars until the network weights converge to a common solution. Furthermore, it is non-incremental. In other words, if new examplars are to be adapted in the net, then all the prior examplars also should be presented cyclically. The output activation patterns of the models are sometimes unclear, so the interpretation of them demands quite a good deal of efforts. To overcome the weakness of the back-propagation learning procedure in CA task, a new model is proposed, which is based on the structure of a probabilistic network. In the model, nodes and links are dynamically created for each new feature-pattern in the schema. Then the probabilistic weights and thresholds of nodes are directly estimated by the new incremental probabilistic learning procedure that uses the observed frequency of training data. To prevent the explosion of nodes for featurepatterns, generalizations of the feature-patterns are carried out whenever a new full pattern is created so that nodes and links of subsumed patterns are dynamically destroyed. Application of the learned schema to the case assignment for input sentences is based on the goodness of fit of a set of possible interpretations (case role assignments). The goodness of fit is acquired from the weights and thresholds. The interpretation that has the maximum goodness of fit will be selected as the best case assignment decision for an input sentence. Experimental results reveal that the model performs at the same level of performance as the other two models on the same test data used in the McClleland's model, while it overcomes the weakness of the back-propagation learning approach to the CA task, at the expense of reasonably increased spaces for feature-pattern nodes. The model also suggests a new way to the natural language processing.
문장의 구성 성분에 옳바른 격역할을 배정하는 문제는 자연어처리의 의미 해석과정 중의 중요한 측면 중의 하나이다. 기존의 전통적인 접근방법들은 스키마의 학습절차(learning procedure)나 격역할 배정에 대한 결정들의 양호도(degree of goodness)를 제공하지 않는다. 본 논문에서는 점진 확률적 스키마 학습절차에 의한 확률적 격역할 배정 모델을 제시한다. 스키마는 일반화된 cose frsme들의 집합으로 볼 수 있으며, 이것은 여 러가지 가능한 격역할 배정의 결정들에 대한 양호도를 갖는 확률적 규칙들을 학습 데이타 (training data)로터 획득한 것으로 볼 수 있다. McClleland Kawamoto, 그리고 Miikulainen과 Dyer의 두 PDP 모델도 Feedforward 네트워크에서의 역전파(back-propagation) 학습절차를 이용하여 스키마를 학습하고, 학습된 스키마를 격역할 배정문제에 적용한다. 그러나, 역전파 학습절차는 네트워크의 가중치(weight)들이 어떤 공통적인 해결점에 도달할 때까지 전 데이타를 계속해서 반복적이고 시간소모적으로 학습시켜야 한다. 게다가, 이 학습절차는 비점진적이다. 즉, 어떤 새로운 학습데이타를 네트워크에 수용할려면 기존에 네트워크에 학습된 dh뼁逾湧? 모두 무시하고, 기존의 데이타와 함께 새로운 데이타를 전과같이 반복적으로 다시 학습시켜야 한다. 그리고, 이 모델들의 출력의 내용은 가끔씩 불명확해서 이들의 해석에 많은 노력이 필요하다. 이 역전파학습절차의 격역할배정문제에 대한 적용상의 약점을 극복하기 위해서, 확률적 신경망(neural net)의 구조에 기반한 새로운 모델을 제안한다. 이 모델에서는 새로운 자질-패턴(feature-pattern)에 대한 노드와 링크들이 스키마에 동적으로 생성된다. 그리고, 링크의 가중치와 노드의 임계치(threshold)는 학습데이타의 관찰된 출현 빈도로부터 새로 고안된 점진 확률적 학습절차에 의해 직접적으로 추정된다. 자질-패턴에 대한 노드들의 폭발적 증가를 막기 위해, 새로운 온전한 패턴(full pattern)이 생성될 때마다 자질-패턴들의 일반화를 행하여 포괄되는 (subsumed) 패턴들의 노드와 링크들을 동적으로 제거한다. 이렇게 학습된 스키마를 입력문장에 대한 격역할 배정에 적용하는 것은 가능한 해석(격역할 배정)들에 대한 적합도 (goodness of fit)에 바탕을 두고 있다. 적합도는 가중치와 임계치로부터 계산된다. 그리고, 가장 적합도가 높은 해석이 입력문장에 대한 가장 적합한 격역할 배정으로 선택된다. 실험결과는 McClleland의 모델이 사용한 테스트 데이타에 대해서 다른 두 모델들의 성능과 비슷한 수준을 보였고, 자질-패턴들에 대한 노드들의 증가가 어느정도 있었지만, 앞에서 열거한 역전파 모델의 약점들을 극복했다. 이 모델은 또한 자연어 처리의 새로운 접근방법을 제시하는 것이다.