서지주요정보
Text categorization of nuclear system documents using semi-automatic approach = 반자동화된 방법을 이용한 원자력 계통 문서의 분류
서명 / 저자 Text categorization of nuclear system documents using semi-automatic approach = 반자동화된 방법을 이용한 원자력 계통 문서의 분류 / Ui-Hyun Kim.
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8026581

소장위치/청구기호

학술문화관(문화관) 보존서고

MKSE 14006

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The current practice of nuclear material export decision is neither time-efficient nor cost-effective. It is becoming more and more difficult for the current system, in which human experts manually evaluate the submitted documents and export details described therein for the purpose of export permission decision, to deal with the explosion of export review requests. Toward the improvement of the situation, this research pro-poses a new text categorization technique of nuclear system documents. The knowledge acquisition bottleneck arises from a small number of experts working on a large set of information and there have been a continuous stream of studies to address this issue through automatic or machine approaches. However, the automated machine approach had to compensate for its speed with the quality of work. In this research, we suggest and demonstrate a new evaluation system for nuclear export control with the categorization of the documents us-ing keyterms and preexistent information of the categories. In particular, for the extraction of keyterms, three alternative approaches were compared: (1) automatic keyword extraction approach using TF-IDF, (2) semi-automatic approach, in which the automatic keyword extraction results were reviewed and adjusted by student experts who majored in nuclear engineering, and (3) totally manual approach in which a very experienced senior field expert extracted keywords without any machine support. The study results show that the semi-automatic approach is the most efficient in categorizing keywords, even though it relies on the work of the student experts, suggesting that when it is utilized involving field experts, the text categorization results will be even further better. The combination of machine and human seems a promising solution that can success-fully reduce the knowledge acquisition bottle-neck with reduced time/cost and improved accuracy.

우리나라의 원자력 기술의 수출이 급증하고 있는 가운데, 현재 전략물자 수출 통제를 위한 수출 심사는 전문가가 직접 문서들을 읽어가며 심사를 하기 때문에 급증하는 수출에 대하여 효과적으로 대처하기 어렵다. 이러한 문제를 해결하기 위하여, 본 연구에서는 원자력 관련 전략물자 심사에서 우선시 보는 계통을 문서로부터 보다 신속하고 정확하게 알아내 분류하는 방법을 제시한다. 일반적으로 수 많은 작업을 전문가가 직접 하는 경우, 전문지식이 필요한 노동 집약적이고 비용 또한 많이 드는 문제가 발생하며, 이를 지식획득장애라고 한다. 그 동안 이러한 지식획득장애를 해결하기 위한 방법으로 기계가 대신하여 작업을 하는 경우가 있지만, 수행 결과가 전문가의 작업 수준을 따라오지는 못했다. 본 연구에서는 문서가 가지고 있는 정보를 통해 계통 분류를 효과적으로 하기 위한 방법으로, 새로운 심사 문서에 대해 계통을 대표하는 핵심어들 기반의 규칙을 만들어 문서가 계통에 따라 분류되도록 하는 문서 분류 시스템을 제안하며, 이에 대한 수행 결과를 평가하였다. 계통을 대표할 수 있는 핵심어들은 전문가, 그리고 지식획득장애를 감소시키기 위한 방법으로 핵심어 추출 알고리즘을 통해 기계가 하는 자동화된 방법과 기계와 사람이 같이 하는 반자동화된 방법으로 추출하였다. 또한 반자동화된 방법은 전문가가 아닌 관련 전공 학생들을 데려와 핵심어 추출 알고리즘을 통해 기계적으로 뽑은 결과를 참조하여, 그들이 최종적으로 핵심어들을 뽑는 실험을 하였다. 결과적으로, 반자동화된 방법이 계통을 분류하는데 가장 높은 수행 결과를 보였으며, 전문가가 아닌 관련 전공 학생들만으로도 기계뿐만 아니라, 전문가가 직접 뽑은 결과보다도 높은 수행 결과와 보다 더 신속하게 이를 수행함으로써 지식획득장애를 감소시키는 결과를 보였다.

서지기타정보

서지기타정보
청구기호 {MKSE 14006
형태사항 vi, 44 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김의현
지도교수의 영문표기 : Mun-Yong Yi
지도교수의 한글표기 : 이문용
Including Appendix : 1, List of 134 nuclear systems.
학위논문 학위논문(석사) - 한국과학기술원 : 지식서비스공학과,
서지주기 References : p. 31-36
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서