서지주요정보
Performance evaluation of signature based multikey access methods = 요약 화일을 이용한 다중키 접근기법들의 성능 평가
서명 / 저자 Performance evaluation of signature based multikey access methods = 요약 화일을 이용한 다중키 접근기법들의 성능 평가 / Jae-Soo Yoo.
발행사항 [대전 : 한국과학기술원, 1991].
Online Access 제한공개(로그인 후 원문보기 가능)원문

소장정보

등록번호

8002177

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 9130

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this thesis, we evaluate the performance of signature based multikey access methods and thus provide guidelines for selecting the most effective one to a given operational environment. We first establish a taxonomy of signature base access methods; One-Path Single-Level(OPSL), Two-Path Single-Level(TPSL), One-Path Two-Level(OPTL), Two-Path Two-Level(TPTL). Then we implement them and perform experiments on various environments. We show form the experimental results that two-path methods(TPSL and TPTL) outperform one-path methods(OPSL and OPTL) on retrieval performance with the expense of a modest 3-15% storage overheads. But the retrieval performance of single-level methods and two-level methods is subject to the size of data file. When a data file contains 10,000 records, single-level methods show better retrieval performance than two-level methods, while when a data file is composed of 100,000 records, two-level methods outperform single-level methods. Therefore, we recommend TPSL for application systems requiring fast data record retrieval when the data file size is 10,000 records. We also recommend TPTL for most of the interactive systems to achieve fast text retrieval, and OPTL for systems requiring small storage overhead, when the data file size is 100,000 records.

본 논문은 요약 화일을 이용한 접근 기법들의 성능을 평가, 비교하고 이를 통하여 비정형화된 텍스트를 처리하기 위한 가장 효율적인 접근 기법을 선택할 수 있는 선택 지침을 제시한다. 이를 위하여 접근 기법들을 1경로 1단계 (OPSL), 2경로 1단계 (TPSL), 1경로 2단계 (OPTL), 2경로 2단계 ( TPTL)로 분류하고 이들을 검색성능, 부가저장공간, 삽입시간 및 false match 측면에서 비교한다. 실험으로부터 2경로 기법들이 1경로 기법들에 비하여 약20-75%의 검색 성능을 향상시켰으며 3-15%의 더 많은 부가저장공간을 사용함을 알 수 있었다. 그러나 1단계 기법들과 2단계 기법들간의 검색성능은 데이타 화일의 크기에 영향을 받는다. 데이타 화일의 크기가 작을때 1단계 기법들이 2단계 기법들에 비해 더 좋은 검색성능을 보였으며 그렇지 않은 경우 2단계 기법들의 성능이 1단계 방법에 비해 우수했다. 한편 2경로 기법들 중에 2경로 2단계는 질의를 만족하는 레코드 갯수가 비교적 작을 때 (약100이하) 좋은 성능을 보였으며 2경로 1단계는 반대의 경우에 우수한 성능을 보였다. 따라서 데이타 화일의 크기가 작을 때 빠른 데이타 검색을 요구하는 시스템을 위한 접근 기법으로 TPSL을 추천하며 반대의 경우 TPTL을 추천한다. 또한, 데이타 화일의 크기가 매우 클때 적은 부가저장공간을 요구하는 검색기법으로는 OPTL을 사용함이 타당하다.

서지기타정보

서지기타정보
청구기호 {MCS 9130
형태사항 [ii], 49 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 유재수
지도교수의 영문표기 : Song-Chun Moon
공동교수의 영문표기 : Yoon-Joon Lee
지도교수의 한글표기 : 문송천
공동교수의 한글표기 : 이윤준
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 Reference : p. 47-49
주제 Information retrieval.
Abstracting.
데이터베이스. --과학기술용어시소러스
정보 검색. --과학기술용어시소러스
검색 (탐색) --과학기술용어시소러스
Database searching.
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서