Concordances are widely used for the text analysis by giving all the contexts of a selected word from large corpus. However, most existing concordancing programs just sort concordances in a simple way such as the alphabetical order or the frequency order. Therefore, they don’t satisfy the users who easily try to get the meaning and usage of a word in a concordance. In this paper, we propose an approach to return in order the concordances most likely to be useful to the user’s needs. Useful concordances are tagged with the same sense as what users are looking for, typically used, easily understandable, or give the significant nuances of meaning. The extracted concordances are judged against existing dictionaries and by users.
용례는 특정 용어의 의미를 잘 보여주는 전형적인 예로서, 사전 편찬이나 의미 구분과 같은 자연언어처리 연구에 중요한 지식원으로 사용된다. 현재 대부분의 자동 용례 추출기는 해당 용어 주변에 나타나는 제한된 범위의 문맥과 용어의 빈도수와 같은 기본적 통계 정보를 제공한다. 이는 대량의 용례 집합을 쉽게 구축해 주는 장점이 있는 반면, 사용자가 원하는 의도에 적합한 용례만을 보도록 도와주지 못한다. 본 논문은 사용자가 원하는 의도를 의미 구분, 전형성, 가독성, 차별성으로 분류하고, 그 분류 기준의 적합성 정도에 따라 용례를 순위화한다. 정확률과 재현율을 이용하여 의미 구분의 성능을 평가하고, 전문가에 의한 사용자 평가와 사전에 있는 용례들과의 비교를 통해 전형성, 가독성, 차별성 성능을 측정한다.