서지주요정보
Performance enhancement of fault-tolerant software DSM with message logging = 고장 허용 분산 공유 메모리에서 로그를 활용한 성능 향상 기법
서명 / 저자 Performance enhancement of fault-tolerant software DSM with message logging = 고장 허용 분산 공유 메모리에서 로그를 활용한 성능 향상 기법 / Young-Jae Kim.
발행사항 [대전 : 한국과학기술원, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8014624

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 03052

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The probability of multiple failures in Software Distributed Shared Memory (SDSM) increases as the system size grows. Recently, the most popular technique of Fault-Tolerant Software Distributed Shared Memory (FT-SDSM) is to store the messages exchanged between communicating nodes in the proper storages with independent checkpointing, called message logging. With its popularity, however, the logging overheads are non-negligible during the failure-free execution, and hence in a few years, an impressive amount of researches have been focused on reducing such a non-negligible overhead. We have implemented a lightweight logging scheme on home-based SDSM. That is called remote logging where the remote memories are used for the logged data. With its lightweight advantage, however, the logged data in home nodes and back-up nodes are useless during the failure-free execution. We propose new log usable schemes that enable FT-SDSM with remote logging to be enhanced. All logged data in home nodes and back-up nodes are used to reduce the times stalled for updates of the invalid pages and to minimize the normal execution time. On a page fault, the invalid page can be updated by using the logged data instead of fetching a whole page from its home node. We have performed the experiments on eight PC clusters. We actually implemented our proposed schemes on FT-SDSM with remote logging. The experimental results show that our proposed log usable schemes outperform our based FT-SDSM which does not make use of any logs in some applications. When we apply our proposed log usable schemes in all, we reduce the number of messages by about 5 - 12 % and minimize the message amounts by about 11 - 78 %, and consequently total execution time becomes less about 13 % than our based model at the best case.

최근에 클러스터 시스템 규모가 점차 커짐에 따라서 시스템에 고장이 발생할 확률은 상대적으로 커지고 있다. 하지만 시스템 고장은 작업집중적이고 오랜 수행 시간을 요구하는 응용프로그램에게 치명적인 문제이다. 그래서 고장을 허용하는 소프트웨어 분산공유메모리 시스템은 반드시 필요하다. 고장 허용 기능을 지원하기 위해 주로 사용되는 기법은 메시지 로깅이다. 각 노드는 독립적으로 체크포인팅을 수행하며 다른 노드와 주고 받았던 메시지를 적절한 저장소에 로깅한다. 그런데 정상 수행시간 동안 이러한 로깅의 비용이 적지 않다. 따라서 본 논문에서는 이미 구현한 홈 기반 분산 공유메모리 시스템에서 빠른 네트워크를 이용하여 원격 메모리를 로그 저장소로 사용하는 효율적인 원격 로깅 기법을 활용한다. 각각의 홈 노드는 백업 노드를 할당 받는다. 로그는 홈노드와 백업 노드에 모두 저장된다. 그런데 이러한 로그는 정상 수행시간 동안 전체 시스템 향상을 위해 전혀 활용되지 못하고 있다. 그래서 본 논문에서는 고장을 허용하는 분산공유메모리 시스템에서 정상 수행 동안 로그를 활용하여 전체 성능을 높이는 기법을 새롭게 제안한다. 페이지 폴트가 발생한 노드는 자신의 무효화 복사본 페이지를 홈 노드로부터 최신의 페이지를 가져와서 갱신하는 것이 아니라 홈 노드 또는 백업 노드의 로그를 활용하여 빠르게 갱신함으로써 페이지 폴트 시간을 줄이며 전체 성능 향상을 높인다. 클러스터 8노드에서 성능 평가를 해본 결과 로그를 활용하는 기법을 모두 적용했을 때 정상 수행 동안 네트웍 상의 메시지의 수를 5 - 12% 줄이고 데이터의 양을 11 - 78 % 줄였다. 그리고 원격 로깅 기법을사용하는 고장 허용 분산공유메모리 시스템의 전체 수행 시간을 최대 13 % 까지 줄였다.

서지기타정보

서지기타정보
청구기호 {MCS 03052
형태사항 vii, 43 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김영재
지도교수의 영문표기 : Seng-Ryoul Maeng
지도교수의 한글표기 : 맹승렬
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 42-43
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서