서지주요정보
Novelty detection in patent documents based on semantic annotation = 의미 정보를 이용한 특허 신규성 탐지
서명 / 저자 Novelty detection in patent documents based on semantic annotation = 의미 정보를 이용한 특허 신규성 탐지 / Ying-Shi Tian.
저자명 Tian, Ying-Shi ; 전영실
발행사항 [대전 : 한국과학기술원, 2009].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8020876

소장위치/청구기호

학술문화관(문화관) 보존서고

MICE 09032

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Novelty detection for a set of documents like patents or news articles plays a key role in many applications. While past research has mostly focused on detecting new stories from news a stream of news, this thesis deals with novelty detection in patent documents, which would help patent examiners determine novelty of a newly filed patent. Unlike past research in patent invalidation search, which relies on term-based comparisons, we propose a new method for novelty detection for patent invalidation using semantic information. This is based on our communication with a group of patent examiners who stated that in examining patents, some semantic categories such as components or methods would be used to distinguish among them. To annotate key phrases in patent claims with semantic information, we identified five categories: Main Component, Sub Component, Attribute, Function, and Method. For each category, a binary classifier was built based on features and patterns. Novelty is detected by comparing the semantically annotated phrases in the incoming patent document against those in the existing patent documents. We show in an experiment that the proposed approach outperforms a term-base approach in patent invalidation search.

특허, 뉴스 등 문서들에서 신규성을 가지는 내용을 탐지하는 것은 여러 분야에 적용함으로써 사용자들이 쉽게 요구하는 정보를 얻는데 큰 도움을 줄 수 있다. 과거 연구들은 대부분이 뉴스 문서에서 처음으로 발생하는 단어에 기반하여 신규성을 가진 문장이나 문서를 추출하는데 초점을 두었다. 특허 유효성 검사 관련 연구는 특허 문서를 비교함으로써 유사성이 적은 문서를 유효하다고 보고 있다. 하지만 이와 같은 방법들로 특허 문서에서 신규성을 탐지한다고 하면 결과적으로 새로 나온 단어들로만 신규성이 표현되기에 사용자들한테 정확한 정보를 주기 어렵다. 특히 특허 심사관들은 구성요소, 방법 등을 구분하여 신규성을 판단함으로써 특허의 유효성을 판단하는데 위에서 제시한 단어 기반의 방법으로는 이상적인 결과를 얻는데 어려운 점들이 존재한다. 이러한 문제를 해결하고자 본 논문에서는 의미 정보를 이용하여 특허 신규성을 탐지하는 방법론을 제안한다. 의미 정보는 MC, SC, A, F, M 5가지 의미 종류로 나뉜다. 이런 의미 종류에 속한 요소들은 기계적 학습 방법과 패턴을 이용한 방법으로 추출 하였고 그 결과는 신규성을 탐지하는데 사용되었다. 신규성을 탐지함에 있어서 우선 추출된 의미적 요소들의 관계를 찾고 그에 기반하여 입력되는 특허와 그 특허 이전에 출원된 특허들의 의미적 요소를 비교함으로써 신규성을 탐지하였다. 추가적으로 제안한 신규성 판단방법론은 특허 유효성 검색 관련된 기존 연구와의 비교를 통해 평가를 진행하였으며, 그 결과, 본 연구에서 제안한 방법이 기존 연구보다 특허 유효성 검색에서 더 좋은 결과를 보였다.

서지기타정보

서지기타정보
청구기호 {MICE 09032
형태사항 58 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 전영실
지도교수의 영문표기 : Sung-Hyon Myaeng
지도교수의 한글표기 : 맹성현
학위논문 학위논문(석사) - 한국과학기술원 : 정보통신공학과,
서지주기 References : p. 52-55
주제 novelty detection;semantic annotation;patent invalidity;patent claims;
신규성 탐지;의미 정보 추출;특허 유효성;특허 청구항;
QR CODE qr code