In this thesis, the system targets on extracting meeting location and geocoding from meeting announcements. The thesis focuses only on extracting ‘Best-Fit Location’ to all complexity of problems, and the primitive rule set which can cover 100% of meeting locations, is constructed as a result of the system. The complexity of problems came up from the corpus, and the solved complexity of problem and the others are clearly specified. The rule-based meeting location extraction system is implemented. To construct rules, the method ‘Generation and Test’ is used which selects possible targets and reject others inductively. The basic unit of the system, ‘Rule Atom’ which is a primitive rule and orthogonal to the other rule in the set, is introduced and the primitive rule set is constructed. Further, to the extracted meeting location, the conflict resolution by Geocoding is tried. And to construct and manage rules effectively, the debugging toolkit is implemented and used.
본 논문에서 제안하는 시스템은 회의공지문서로부터 회의장소를 추출하고 지오코딩하는 문제를 해결하는 것을 목적으로 한다. 본 논문은 회의공지문서에 포함된 모든 복잡도의 문제를 대상으로 하여, Best-Fit Location을 추출하는 문제를 다루었다. 또한 100%의 정확도로 회의장소를 추출하는 Primitive Rule Set을 구축하였다. 회의장소 추출 문제의 복잡도는 회의공지 코퍼스의 귀납적인 분석으로부터 도출된 결과이다. 본 연구에서는 정확한 문제의 해결 범위를 정하여, 해결이 가능한 문제의 범위와 해결되지 못한 문제의 범위를 명시하였다. 본 논문에서는 규칙을 기반으로 한 회의장소 추출 시스템을 설계 및 구현하였다. 규칙을 구축하기 위하여 가능한 대상을 선택하고 해당하지 않는 것을 귀납적으로 제거해나가는 방법인 Generation and Test 방법론이 사용되었다. 시스템의 기본 단위는 Rule Atom으로, 이는 다른 Rule에 대하여 직교성을 가지는 Primitive Rule에 해당한다. 또한, 추출된 회의장소에 대하여 지오코딩을 이용한 conflict resolution 작업이 시도되었다. 그리고, 규칙을 효과적으로 관리하기 위하여, 직접 구현한 디버깅 툴킷을 사용하였다.