서지주요정보
Dynamic-web search system for bio-information = 바이오정보통합을 위한 동적 웹검색 시스템
서명 / 저자 Dynamic-web search system for bio-information = 바이오정보통합을 위한 동적 웹검색 시스템 / Sean-Seowoo Lee.
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8016186

소장위치/청구기호

학술문화관(문화관) 보존서고

MBiS 05006

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Biological databases and tools sources provide us with essential information and have become indispensable parts of researches. However, as biological researches of reasonable scope involve information that spans multiple biological domains, numerous visits to manifold tools and disparate databases are preordained. Moreover, unprecedented rate at which experimental data are accumulating with the advent of high-throughput technologies is making it even harder for biologists to sift through multiple information sources. In order to address such an issue, couple different approaches to biological information integration have been proposed namely structured data approach, linked data approach and text-based data approach. Each of the approaches has inherent advantages and disadvantages. For instance, text data based approach boasts the highest scalability yet suffers in the functionality criterion. Similarly, structured data approach features the highest functionality at the cost of scalability. In this paper, we present Unified Concentrated Retrieve and Navigation (UNICORN) that can take advantage of merits of three approaches by applying a novel dynamic web indexing technique on the domain of biological information integration. Dynamic web resource comprises of more than 99% of all resources available on the Web, yet indexing the resource has been largely neglected until recently in both biological and general information retrieval communities. Conventional dynamic web resource access method relied on a simple on HTML form exploitation. We propose a feasible methodology to automatically integrate biological resources based on a novel dynamic web access technique that does not rely on the HTML form exploitation in biological domain using UNICORN. UNICORN is capable of locating biological resources on the Internet and automatically identifying structural information of data source to address both scalability and functionality issues of biological information integration system.

대규모 실험 기술의 발달로 인하여 각 데이터베이스에 저장되는 바이오 데이터의 양은 기하급수적으로 증가하고 있으며 바이오 데이터베이스의 수는 이미 500여 개가 넘는다. 이러한 바이오 데이터베이스의 정보는 생물학 지식의 특성상 서로 밀접하게 연관되어 있기 때문에 특정 목적을 위한 데이터베이스라 하더라도 생물학 연구에 있어서 서로 연계되어 이용되어야 한다. 따라서 연구자들은 의미 있는 바이오 정보를 얻기 위하여, 여러 데이터베이스를 검색하여 결과를 통합하며, 이러한 결과들을 다양한 도구를 이용하여 분석해야 한다. 그러나 현재와 같이 다양한 목적 및 수준, 형식의 수많은 바이오 데이터베이스가 존재할 경우, 이러한 통합적인 정보 검색과, 새로운 지식 추출은 어려움을 갖게 되기 때문에 이런 과정을 보다 쉽고 빠르게 실행하기 위한 도구는 게놈시대의 생물학자들에겐 필수적이다. 바이오정보통합 시스템은 structured data 접근방법, linked data 접근방법 그리고 text-based data를 이용한 접근방법의 세 가지의 분류로 정리 될 수 있으며 각기 다른 장점과 단점을 가지고 있다. 여기서 우리는 세 가지의 장점을 모두 수반하면서 뛰어난 확장성을 유지할 수 있는 방법론을 UNICORN이라는 시스템을 이용해서 제시 한다. UNICORN은 새로운 동적 웹검색 기술을 바이오정보통합의 범위에 적용하여 생물학적 동적 웹 정보(데이터베이스)를 자동적으로 찾아 색인화 할 수 있는 기능을 가진다. 동적 웹 정보는 웹 정보의 99% 이상을 차지하는 부분으로 최근 동적 웹 정보의 검색기술은 많은 각광을 받아 왔으나, 아직 HTML-form 조작을 통해서 일부의 정보를 얻어 내는 기초적인 방법에 의존해 왔다. UNICORN에서는 바이오정보를 이런 HTML-form 조작이 아닌 새로운 기술로 얻어 내여 색인화하여 여러 바이오정보 데이터베이스를 자동 통합 할 수 있는 방법론을 검증했다.

서지기타정보

서지기타정보
청구기호 {MBiS 05006
형태사항 viii, 51 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이서우
지도교수의 영문표기 : Do-Heon Lee
지도교수의 한글표기 : 이도헌
학위논문 학위논문(석사) - 한국과학기술원 : 바이오시스템학과,
서지주기 Reference : p. 45-51
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서