서지주요정보
ODYS 병렬 DBMS/검색엔진을 위한 \linebreak Fault Tolerance와 Load Balancing 모듈의 설계 및 구현 = Design and implementation of a fault tolerance and load balancing module for the ODYS parallel DBMS/search engine
서명 / 저자 ODYS 병렬 DBMS/검색엔진을 위한 \linebreak Fault Tolerance와 Load Balancing 모듈의 설계 및 구현 = Design and implementation of a fault tolerance and load balancing module for the ODYS parallel DBMS/search engine / 김덕회.
발행사항 [대전 : 한국과학기술원, 2013].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8025702

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 13050

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

As the amount of data increases explosively on Internet, the role of parallel search engines becomes more important. The web search engine is a representative large-scale parallel search engine, which consists of a large number of machines. Thus, there is a high possibility of failure and skewed load over the machines. Therefore, fault tolerance and load balancing features are essential for parallel web search engines to provide a reliable service and an optimized performance. Commercial web search engines such as Google and Yahoo! provide fault tolerance and load balancing features for parallel query processing. However, their details have not been discussed in the literature. Meanwhile, parallel processing framework MapReduce supports fault tolerance and load balancing features over a large number of machines during parallel query processing. Therefore, its method is applicable to the parallel search engine. In this thesis, we design and implement a MapReduce-style fault tolerance and load balancing module for ODYS, which is a parallel search engine that has been under development at KAIST. In particular, for the environment of running a lot of concurrent short-running queries, we propose a low-overhead process and communication architecture of the fault tolerance and load balancing module. We also propose an index structure for effectively managing the status and the load of slave machines and the status of slave processes. Finally, we conduct experiments to show that the proposed fault tolerance and load balancing module works in an effective way. The result of the experiments shows that ODYS with the fault tolerance and load balancing module provides fault tolerance significant enhancement in performance while incurring 0.4\% of additional query processing time when one out of 400 slave processes is at fault, 86.13\% of additional query processing time when one out of 4 slave machines is at fault where the query load is 5million queries/day. It also provides load balancing while outperforming the na\"{i}ve configuration of ODYS without load balancing by up to 16.89\% in the average query processing time when the query load is 9million queries/day and two nodes are duplicated in the configuration.

최근 인터넷 상의 데이터의 양이 폭발적으로 증가함에 따라 분산 저장된 대규모의 데이터에 대한검색을 병렬적으로 수행하는 병렬 검색 엔진의 역할이 중요해 지고 있다. 웹 검색 엔진은 대표적인 대형 병렬 검색 엔진이므로 이를 구성하는 머신의 수가 많다. 따라서 일부 머신이 고장 날 가능성이 높고, 각 머신들의 부하에 불균형이 발생하기 쉽다. 그러므로 병렬 웹 검색 엔진은 안정적인 정보 검색 서비스를 제공할 수 있도록 하는 fault tolerance 기능과 시스템의 부하를 균형화 하여 전체 시스템의 성능을 최적화하는 load balancing 기능이 필요하다. Google, Yahoo!와 같은 상용 검색 엔진은 질의를 병렬로 처리하는 과정에서 fault tolerance와 load balancing 기능을 지원한다. 그러나 이에 대한 구체적인 방법은 공개되어 있지 않다. 한편, 병렬 처리 프레임워크인 MapReduce는 질의를 병렬로 처리하는 과정에서 많은 수의 머신에 대해 fault tolerance와 load balancing 기능을 지원한다. 따라서 병렬 검색 엔진에 MapReduce 방식의 fault tolerance와 load balancing 기능을 적용할 수 있다. 본 논문에서는 한국과학기술원 전산학과 데이터베이스 및 멀티미디어 연구실에서 개발한 병렬 검색 엔진인 ODYS를 위한 fault tolerance 및 load balancing 모듈을 병렬 처리 프레임워크인 MapReduce에서 제공하는 fault tolerance와 load balancing 방법에 기반하여 설계하고 구현한다. 특히, 처리 시간이 짧은 수 많은 질의를 동시에 처리해야 하는 병렬 검색 엔진의 요구조건을 만족시키기 위해 적은 오버헤드로 fault tolerance 및 load balancing 기능을 수행할 수 있는 프로세스 및 통신 구조를 제안한다. 그리고 질의를 처리하는 다수의 slave 머신의 상태 및 부하와 slave 프로세스의 상태를 효과적으로 관리할 수 있는 색인 자료구조를 제안한다. 마지막으로 실험을 통해 본 논문에서 설계하고 구현한 모듈이 효율적으로 fault tolerance 기능을 수행하고, 효과적으로 load balancing 기능을 수행함을 보인다. 실험 결과, fault tolerance와 load balancing 모듈을 적용한 ODYS가 5million queries/day의 질의 부하에서 fault가 발생하지 않은 경우에 비해 slave 프로세스(400개의 slave 프로세스 중 1개를 fault 시킴)에 대해 약 0.4\%, slave 머신(4대의 slave 머신 중 1대를 fault 시킴)에 대해 약 86.13\%의 추가적인 질의 수행 시간으로 fault tolerance 기능을 수행할 수 있으며, load balancing 기능으로 인해 9million queries/day의 질의 부하와 2개의 node가 복제된 환경에서 load balancing을 하지 않는 na\"{i}ve한 구성의 ODYS에 비해 평균 질의 수행 시간이 약 16.89\% 향상되었음을 보인다.

서지기타정보

서지기타정보
청구기호 {MCS 13050
형태사항 iv, 43 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Deok-Hoe Kim
지도교수의 한글표기 : 황규영
지도교수의 영문표기 : Kyu-Young Whang
학위논문 학위논문(석사) - 한국과학기술원 : 전산학과,
서지주기 참고문헌 : p. 37-40
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서