서지주요정보
Entity resolution for integrating biomedical data: a hybrid machine-expert approach = 생체 의학 데이터 통합을 위한 엔티티 레졸루션: 기계-전문가 하이브리드 접근
서명 / 저자 Entity resolution for integrating biomedical data: a hybrid machine-expert approach = 생체 의학 데이터 통합을 위한 엔티티 레졸루션: 기계-전문가 하이브리드 접근 / Heesung Jin.
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8027757

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 15052

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In advent of biomedical databases, analysis on biomedical data have been very important research areas with opportunities to utilize computational approaches. Also, integration of biomedical data is essential to get more rich and extensive analysis. One of the most important issues for integrating biomedical data is reliability because data analyzed from biomedical data would be directly related to human health and life. In order to meet requirements for reliable integration, duplicate records that refer to the same entity should be resolved. It is also referred to as Entity Resolution. In this paper, we propose an entity resolution system for integrating biomedical data focusing on Natural Product databases as data sources. To meet high reliability, we make machine generate proper candidate groups efficiently while reducing false positives and negatives, and experts with domain knowledge decide duplicate entities in each candidate group. In addition, we design machine to be evolved continuously interacting with experts by utilizing decision results of experts. We evaluate our entity resolution system with case studies showing reasonable examples of experiment results.

최근 생체 의학 데이터베이스의 출현으로 인해, 컴퓨터를 사용한 접근법이 가능해 지면서 생체 의학 데이터에 대한 분석은 매우 중요한 연구 분야로 각광받아 오고 있다. 또한, 이러한 생체 의학 데이터의 통합은 좀 더 풍요롭고 확장적인 분석을 하는 데 있어 필수적이다. 생체 의학 데이터를 통해 분석된 데이터는 인간의 건강과 삶에 직접적으로 연관되기 때문에, 통합을 위해 가장 중요한 이슈 중 하나는 신뢰성이다. 신뢰성 있는 통합을 위한 요구사항을 만족시키기 위해서는 같은 엔티티를 가르키는 중복 레코드를 해결해야 한다. 이것을 엔티티 레졸루션이라고도 한다. 본 논문에서는, 생체 의학 데이터 통합을 위한 엔티티 레졸루션 시스템을 제안하며, 데이터 소스로서 생체 의학 데이터베이스 중 하나인 천연물 데이터베이스에 초점을 맞춘다. 높은 신뢰성을 만족하기 위해, 기계가 거짓 양성과 거짓 음성을 줄이면서도 효율적으로 후보군을 생성하고 분야 해당 전문가가 각 후보군에서 직접 중복 엔티티를 결정하도록 한다. 게다가, 전문가의 결정 결과를 가지고 전문가와 기계가 상호작용하면서 기계가 지속적으로 발전되도록 설계한다. 실험 결과의 합리적인 예를 보여주는 사례 연구를 통해 본 엔티티 레졸루션 시스템을 평가한다.

서지기타정보

서지기타정보
청구기호 {MCS 15052
형태사항 v, 24 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 진희성
지도교수의 영문표기 : Myoung Ho Kim
지도교수의 한글표기 : 김명호
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 References : p.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서