According to the Statistics Korea, the average life expectancy of Koreans is rising steadily at 81.8 years in 2014 and 82.06 in 2016. To manage their health, people visit hospitals and conduct comprehensive blood test periodically. Compared to the increasing demand for blood tests, the number of human resources and output of medical domain experts is limited. So, it is becoming difficult to observe various test results and to diagnose the disease for all patients in detail. Therefore, this thesis describes how to build a knowledge base that can support the derivation process of the blood test results. Because the comprehensive blood test is a multiple classification problem, we construct the knowledge base based on multiple classification ripple-down rules. At this time, the induction of ripple-down rules is used to automatically construct the knowledge base from a large amount of data generated by medical domain experts. Because the induction of ripple-down rules, however, is a method for single classification problems, we propose several methods to transform the comprehensive blood test which is multiple classification problem into single classification problem. These methods consist of duplicating test results, dividing tests by their functionality, factorizing compound comments, and firing rules conditionally. As a result, when all methods were applied, the $F_1$ score was improved by 20.76% compared to the results of applying only duplicating test results and dividing tests by their functionality.
통계청에 따르면 한국인의 평균 수명은 2014년 81.8세, 2016년 82.06세로 지속적으로 상승하고 있다. 이에 따라 사람들은 건강을 관리하기 위해 병원에 방문해 주기적으로 혈액종합검사를 실시한다. 이처럼 증가하는 혈액종합검사의 종류와 수요에 비해, 의료 도메인 전문가의 인력과 산출량은 정해져 있다. 결과적으로 모든 환자에 대해 다양한 검사 결과를 꼼꼼하고 종합적으로 관찰하며 질병을 진단하는 것이 어려워지고 있다. 따라서, 본 연구에서는 혈액종합검사의 소견 도출을 지원할 수 있는 지식베이스를 구축하는 방법에 대해 기술한다. 혈액종합검사는 복수분류 문제에 해당하기 때문에 본 연구에서는 복수분류 리플다운 규칙 기반의 지식베이스를 구축한다. 이 때, 의료 도메인 전문가가 생성해온 수 많은 데이터로부터 지식베이스를 자동으로 구축하기 위해 리플다운 규칙의 유도를 사용한다. 하지만 리플다운 규칙의 유도는 단일분류 문제를 위한 방법이기 때문에, 본 연구에서는 복수분류 문제인 혈액종합검사를 단일분류 문제로 변환하기 위한 검사 결과 복제, 기능별 검사 항목 분리, 복합 소견 분해, 조건부 규칙 점화 방법을 제시한다. 그 결과 검사 결과 복제, 기능별 검사 항목 분리, 복합 소견 분해, 조건부 규칙 점화를 모두 적용한 결과와 검사 결과 복제, 기능별 검사 항목 분리를 적용한 결과를 비교했을 때, $F_1$ 점수에서 20.76%의 향상을 확인할 수 있었다.