서지주요정보
EHR-SeqSQL : A sequential Text-to-SQL dataset for interactively exploring electronic health records = EHR-SeqSQL : 전자건강기록의 상호 작용적 탐색을 위한 순차 Text-to-SQL 데이터셋
서명 / 저자 EHR-SeqSQL : A sequential Text-to-SQL dataset for interactively exploring electronic health records = EHR-SeqSQL : 전자건강기록의 상호 작용적 탐색을 위한 순차 Text-to-SQL 데이터셋 / Jaehee Ryu.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8041912

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 24023

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Text-to-SQL parsing is a task that translates natural language into SQL, enabling users who are not database experts to retrieve information from databases using only natural language. There are several important yet under-explored objectives in this field: interactivity, compositionality, and efficiency. In this paper, we present EHR-SeqSQL, a sequential Text-to-SQL dataset for interactively exploring Electronic Health Record (EHR) databases. We demonstrate the benefits of multi-turn setting over single-turn setting with respect to compositionality, and provide a new data split and an additional test set to evaluate compositional generalization. Furthermore, we introduce unique special tokens in SQL queries to enhance execution efficiency. This study represents the first attempt in the Text-to-SQL parsing field to simultaneously consider interactivity, compositionality, and efficiency, aiming to narrow the gap between industrial demands and academic research.

Text-to-SQL 파싱은 자연어를 SQL로 번역하는 태스크로 데이터베이스 비전문가인 사용자들이 자연어만을 사용하여 데이터베이스에서 정보를 얻을 수 있게 해준다. 이를 실제 상황에 적용하기 위해 중요하게 고려해야 하지만, 기존 연구들에서는 아직 충분히 논의되지 않은 연구 주제들로 상호 작용성, 구성성, 그리고 효율성이 있다. 본 논문에서는 전자건강기록(EHR) 데이터베이스를 상호 작용적으로 탐색하는 순차 Text-to-SQL 데이터셋인 EHR-SeqSQL을 소개한다. 먼저, 구성성과 관련하여 단일 턴 대비 다중 턴 설정에서의 이점을 보여주고, 구성적 일반화를 평가하기 위한 새로운 데이터 분할과 추가 테스트 셋을 제공한다. 또한, SQL 쿼리에 특수 토큰을 도입하여 실행 효율성을 높인다. 본 연구는 Text-to-SQL 파싱 분야에서 상호 작용성, 구성성 및 효율성을 동시에 고려한 첫 시도이며, 이를 통해 산업적 요구와 학계 연구 간의 격차를 완화하고자 한다.

서지기타정보

서지기타정보
청구기호 {MAI 24023
형태사항 iii, 28 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 류재희
지도교수의 영문표기 : Edward Choi
지도교수의 한글표기 : 최윤재
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 25-26
주제 Electronic Health Record(EHR)
Multi-turn Text-to-SQL
Semantic parsing in context
Question answering
Compositionality
전자건강기록
다중 턴 Text-to-SQL
문맥적 시맨틱 파싱
질의응답
구성성
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서