Making the most use of abundant information in electronic health records (EHR) is rapidly becoming an important topic in medical domain.A recent work presented a promising framework that embeds entire features in a raw EHR regardless of its form and medical code standards.Despite its merit, the resulting embedded data is extremely large compared to the amount of EHR information it contains.In this paper, we explore for the optimal encoder not only reducing the large data into a manageable size, but also well preserving the core information of patients to perform clinical tasks. We found that CNN structured in a hierarchical manner outperforms the state-of-the-art model on widely accepted tasks in the field, even with fewer parameters and less training time. Moreover, it turns out that making use of the inherent hierarchy of EHR system can boost the performance for any kind of backbone models and clinical tasks performed.By conducting extensive experiments, we present concrete evidence for generalizing our research findings into real-world practice.We give a clear guideline on building the encoder based on summary of research findings captured while exploring numerous settings
전자의무기록(Electronic Health Records)에 풍부하게 담긴 정보를 활용하는 것이 의료 분야에서 중요한 주제로 자리매김하고 있다.최근 한 연구에서, 그 스키마나 의료 코드 체계에 관계없이 전자의무기록을 임베드하는 통합 프레임워크를 제시하였는데, 이는 의료 분야에 새로운 시류를 일으키고 있다.하지만 통합 프레임워크로 임베딩된 데이터는 담고 있는 전자의무기록 정보량에 비해 지나치게 크다는 한계가 있다.본 연구는 그러한 큰 데이터를 다루기 쉬운 크기로 압축하면서도, 임상 시 쓰일 환자 정보를 잘 보존하는 최적 인코더 탐색을 목적으로 수행되었다.그 결과, 의료 영역에서 폭넓게 받아들여지는 임상 작업들을 수행할 때, 전자의무기록 특유의 계층 구조를 반영한 합성곱 신경망이 최첨단 모델을 능가한다는 결론을 도출하였으며, 이는 더 적은 변수와 학습 시간으로도 가능하였다.뿐만 아니라, 모델이 어떤 백본(backbone)을 사용하든 그리고 어떤 임상 작업을 수행하든 앞서 언급한 계층 구조를 활용했을 때 더 높은 성능을 보였다.이러한 결론을 일반화하기 위해 광범위한 환경 설정에 걸쳐 실험을 진행함으로써, 의료 현장에서 본 연구를 활용할 수 있는 근거를 구체적으로 제시하였다.또한 실험을 진행하며 도출한 다양한 연구 결과를 체계적으로 종합하여, 최적 인코더를 구성하기 위한 지침을 명확하게 정리하였다.