All nuclear power plants around the world issue and share an operating experience reports, a kind of incident and/or accident reports, to prevent the recurrence of the similar type of incident. In this thesis, we have studied the automatic category classification method for reducing the work load on the categorization of operating experience reports and for using these reports effectively. In this paper, we propose a hybrid model that integrates the Latent Dirichlet Allocation(LDA) with term weighting scheme and Skip-Gram to reflect characteristics those are derived from operating experience report data analysis. We also compared the category classification performance of the proposed hybrid models with the models used in the previous studies, verified the performance of the proposed hybrid models is better than that of the term weighted scheme models used in the previous studies.
전 세계 원자력발전소는 동일한 유형의 사건이 재발하는 것을 방지하기 위해 사건·사고 보고서의 일종인 운전경험보고서를 작성하고 공유한다. 본 학위 논문에서는 운전경험보고서 카테고리 분류 관련 업무 부하를 줄이고, 효율적인 보고서 활용을 위한 카테고리 자동 분류방법을 연구하였다. 운전경험보고서를 분석하여 두 가지 특성을 도출하였으며, 이러한 특성을 반영하여 단어가중치가 적용된 잠재적디리클레할당(LDA)기법과 스킵그램(SkipGram)기법을 조합한 두 가지 하이브리드 모델을 제안하였다. 이 모델과 기존의 연구에서 사용되었던 단어가중치 기법 적용 모델들의 카테고리 분류성능을 비교하여 본 논문에서 제안된 모델의 성능이 우수함을 입증하였다.