The equipment maintenance document contains information on the parts constituting the equipment, the type of defect, and the solution. However, in order to utilize this information, it is necessary to search for the target equipment using a keyword search method and then find the defects and corrective methods that the target equipment may experience sequentially. In addition, when recorded and managed by several workers, expressions or sentence structures may vary, making it difficult to grasp the meaning. Therefore, in order to solve this problem, it is important to effectively extract and manage equipment maintenance knowledge. In previous studies, there was a limitation in that there was no sufficient amount of facility maintenance data to generalize, so first, a dataset was built and entity name recognition was presented only to extract information. Therefore, in this paper, we propose a method for effective maintenance knowledge extraction by extracting entities for equipment, defects, and modification methods from equipment maintenance documents through named entity recognition, and further building a set of relationships between individual entities using dependency parsing.
설비유지보수문서에는 설비를 구성하는 부품, 결함 상태, 수정 방법 등에 대한 정보가 담겨있다. 하지만 이 정보를 활용하기 위해서는, 키워드 검색 방식으로 대상 설비에 대해 검색한 후 대상 설비가 겪을 수 있는 결함 상태와 수정 방법을 순차적으로 찾아보아야 한다. 또한, 여러 작업자에 의해 기록 및 관리되는 경우 표현이나 문장 구조가 각각 달라질 수 있어 의미 파악에 어려움을 겪을 수 있다. 그러므로 이를 해결하기 위해서는 설비유지보수 지식을 효과적으로 추출하고 관리하는 것이 중요하다. 기존 연구에서는 설비유지보수 데이터가 일반화가 가능할 정도로 충분한 양이 존재하지 않아 우선 데이터셋을 구축하고, 정보 추출을 위해 개체명 인식을 수행하는 단계까지만 제시한다는 한계점이 있었다. 따라서 본 논문에서는 개체명 인식(Named Entity Recognition)을 통해 설비유지보수문서에서 설비와 결함 상태, 수정 방법에 대한 개체를 추출하고, 더 나아가 의존 구문분석(Dependency Parsing)을 이용하여 각 개체 간 관계 세트를 구축함으로써, 효과적인 유지보수 지식 추출을 위한 방법을 제안한다.