서지주요정보
오디세우스/Parallel-OOSQL에 기반한 대규모 병렬 정보검색 서비스 시스템 아키텍처 및 성능 평가 = A service system architecture and performance evaluation of a large parallel information retrieval system based on ODYSSEUS/Parallel-OOSQL
서명 / 저자 오디세우스/Parallel-OOSQL에 기반한 대규모 병렬 정보검색 서비스 시스템 아키텍처 및 성능 평가 = A service system architecture and performance evaluation of a large parallel information retrieval system based on ODYSSEUS/Parallel-OOSQL / 성경복.
발행사항 [대전 : 한국과학기술원, 2004].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8015266

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 04020

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

As the amount of data on the internet increases rapidly, parallel information retrieval systems have been developed to support an efficient search against voluminous data. Although many commercial search engines use parallel information retrieval, detailed service architectures and experimental analyses for parallel information retrieval have not been discussed in the literature. In this thesis, we propose a service architecture for a large parallel information retrieval system and evaluate the performance of the system under the proposed architecture. For this objective, we 1) design a physical machine organization, 2) devise a technique to append or update data with only a small overhead, and 3) devise a technique to reorganize the database without stopping the service. Then, using the proposed architecture, we build a service system storing ten million web pages and analyze effects on the performance while varying four parameters: the number of database partitions, the top-n value requested by the query, the query keyword frequency, and the number of keywords per query.

인터넷에 존재하는 데이타의 양이 기하급수적으로 증가함에 따라 많은 양의 데이타에 대한 정보 검색을 효율적으로 지원하기 위해 병렬 정보검색 시스템이 개발되었다. 많은 상용 검색 시스템이 병렬 정보검색을 사용함에도 불구하고, 병렬 정보검색에 대한 세부적인 서비스 아키텍처와 성능 평가에 대해서는 충분한 연구가 수행되지 않았다. 본 논문에서는 대규모 병렬 정보검색 서비스 시스템의 아키텍처를 제안하고, 제안한 아키텍처를 이용하여 성능 평가를 수행한다. 서비스 아키텍처를 제시하기 위해, 1) 물리적인 기기 구성을 설계하고, 2) 적은 비용으로 데이타 추가 및 업데이트가 가능한 방법을 제안하며, 3) 서비스의 중단 없이도 데이타베이스 재구축이 가능한 방법을 제안한다. 그리고, 제안한 아키텍처 하에서 1,000만 건의 웹 페이지를 이용하여 실제로 서비스 시스템을 구축하고, 데이타베이스 분할수, top-n value, 질의에 사용한 키워드 종류, 질의당 키워드 수의 4가지 파라미터가 성능에 미치는 영향을 분석한다.

서지기타정보

서지기타정보
청구기호 {MCS 04020
형태사항 vi, 36 p. : 삽화 ; 26 cm
언어 한국어
일반주기 저자명의 영문표기 : Kyung-Bok Sung
지도교수의 영문표기 : 황규영
지도교수의 한글표기 : Kyu-Young Whang
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 참고문헌 : p. 33-36
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서