서지주요정보
Uncertainty-aware text-to-program for question answering on structured electronic health records = 구조화된 전자의무기록에서 불확실성을 활용한 질의 응답 프로그램 생성
서명 / 저자 Uncertainty-aware text-to-program for question answering on structured electronic health records = 구조화된 전자의무기록에서 불확실성을 활용한 질의 응답 프로그램 생성 / Daeyoung Kim.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040529

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 23004

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Question Answering on Electronic Health Records (EHR-QA) has a significant impact on the healthcare domain, and it is being actively studied. Previous research on structured EHR-QA focuses on converting natural language queries into query language such as SQL or SPARQL (NLQ2Query), so the problem scope is limited to pre-defined data types by the specific query language. In order to expand the EHR-QA task beyond this limitation to handle multi-modal medical data and solve complex inference in the future, more primitive systemic language is needed. In this paper, we design the program-based model (NLQ2Program) for EHR-QA as the first step towards the future direction. We tackle MIMICSPARQL*, the graph-based EHR-QA dataset, via a program-based approach in a semi-supervised manner in order to overcome the absence of gold programs. Without the gold program, our proposed model shows comparable performance to the previous state-of-the-art model, which is an NLQ2Query model (0.9% gain). In addition, for a reliable EHR-QA model, we apply the uncertainty decomposition method to measure the ambiguity in the input question. We empirically confirmed data uncertainty is most indicative of the ambiguity in the input question.

전자의무기록을 활용하는 질의응답 연구는 헬스케어 분야에서 상당히 큰 가치를 가지며, 활발하게 연구되고 있다. 정형 데이터 형태의 전자의무기록을 활용하는 기존의 질의응답 연구는 자연어 질문을 SQL이나 SPARQL 같은 질의어로 번역하는 데 초점을 맞추고 있기 때문에 질의어가 다룰 수 있는 데이터의 자료형에 해결할 수 있는 문제의 범위가 제한된다. 전자의무기록에 존재하는 다양한 자료형의 데이터를 다루고 더 복잡한 연산을 수행하기 위해서는 기존 질의어보다 더 원시적인 수준의 프로그램 언어가 필요하다. 본 논문에서는 전자의무기록 기반 질의응답 연구의 확장을 위한 첫 번째 시도로 ``자연어 질문 - 프로그램`` 방법론을 제안한다. 이때 그래프 기반 전자의무기록 질의응답 데이터셋인 MIMICSPARQL*에 정답 프로그램이 없다는 문제를 준지도 학습 형태의 프로그램 기반 방법론을 통해 해결한다. 제안한 방법을 통해 정답 프로그램 없이도 기존의 지도학습 기반의 최신 방법론과 비교할만한 성능을 보였다 (0.9% 성능 향상). 더불어 신뢰할 수 있는 전자의무기록 질의응답 모델을 위해 정보가 부족한 자연어 질문을 탐지하는 데이터 불확실성 기반 방법론 또한 제안한다.

서지기타정보

서지기타정보
청구기호 {MAI 23004
형태사항 iv, 20 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김대영
지도교수의 영문표기 : Edward Choi
지도교수의 한글표기 : 최윤재
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 18-20
주제 Question answering
Uncertainty
Electronic health records
질의응답
불확실성
전자의무기록
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서