서지주요정보
Fault-based distributed recovery block (FDRB) for switching systems = 교환시스템을 위한 결함 기반의 분산 복구 블록
서명 / 저자 Fault-based distributed recovery block (FDRB) for switching systems = 교환시스템을 위한 결함 기반의 분산 복구 블록 / Byung-Sun Lee.
저자명 Lee, Byung-Sun ; 이병선
발행사항 [대전 : 한국과학기술원, 2003].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8014421

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 03002

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Distributed Recovery Block (DRB) is a widely used fault-tolerant technique for real-time systems, which provides a forward recovery scheme by treating hardware and software faults uniformly. However, DRB has certain limitations to be used for the practical use. When a fault is encountered during the program execution, DRB immediately switches to another version of the program without attempting to recover from the fault with a recovery scheme selected by taking the types and effects of the fault into accounts. Moreover, since DRB treats all the application functions on a computing station as a single program unit, it is not applicable to large real-time systems. We propose, therefore, a new fault tolerant technique specially designed for large real-time systems, especially switching systems. Our technique is tuned to the types and effects of faults observed while running the switching systems and based on the testing experience accumulated during software development of switching systems. We have added a self-checking and a selective recovery mechanism to the ordinary DRB in designing a fault-based DRB (FDRB). We have then extended FDRB to a hierarchical scheme for large real-time systems. Hierarchical FDRB (H-FDRB) includes multiple FDRB modules and a monitor for synchronizing the operation of duplicate nodes. We have compared the performance of our approach with that of the ordinary DRB using model analysis and simulation. We have evaluated the probability of the failure-free operation and the fault recovery time of ordinary DRB, FDRB, and H-FDRB. We have also conducted an empirical evaluation by implementing three versions of different algorithms and executing them with injected faults. The reliability achieved with FDRB is comparable to or better than that with DRB thanks to the fault recovery of the recovery-handling programs, and the fault recovery time is reduced without sacrificing the software reliability of a system. We have also found that FDRB and H-FDRB in general require more time to execute without faults than the ordinary DRB and H-FDRB takes less time to recover from a fault than FDRB, resulting in a higher reliability.

분산복구블록(DRB)은 실시간 시스템을 위한 결함 포용 방법으로 많이 사용하는 방법으로서 하드웨어와 소프트웨어 결함들을 동일한 형태로 처리하는 전향적 복구 방식을 취하고 있다. 그러나, 분산복구블록은 실제로 사용하는 데 문제점들을 지니고 있다. 결함이 프로그램 수행 도중에 나타나면 분산복구블록에서는 그 결함의 종류나 영향들을 고려하여 복구를 시도하지 않고 다른 버전의 프로그램으로 수행을 즉시 전환한다. 또한 하나의 컴퓨팅 노드에서 그 안에 있는 모든 응용 기능들을 오직 한 개의 프로그램 단위로만 다루고 있어 대형 실시간 시스템에는 적용하기가 곤란한 단점이 있다. 따라서 본 논문에서는 대형 실시간 시스템, 특히 교환시스템에 적합하도록 설계된 새로운 결함 포용 방법을 제안한다. 이 방법은 교환시스템의 소프트웨어 개발 경험을 기반으로 하여 교환시스템 동작 중에 관찰된 다양한 결함의 종류와 영향을 반영하였다. 이러한 결함 기반의 분산복구블록(FDRB)은 기존 분산복구블록에 자기검사 기법과 선택적 복구 기법이 추가되어 설계되었다. 그리고 이 결함 기반의 분산복구블록을 대형 실시간 시스템에 맞도록 계층적 구조로 확장하였으며, 이 계층적 결함기반의 분산복구블록(H-FDRB)에는 결함기반 분산복구블록 구조를 갖는 여러 개의 모듈들과 이중화된 노드의 동작 동기화를 위한 모니터가 포함이 되어있다. 제안된 방법들은 모델 분석과 모의실험을 사용하여 기존 분산복구블록과 성능을 비교하였다. 기존의 분산복구블록, 결함기반의 분산복구블록, 그리고 계층적 결함기반 분산복구블록 등의 세가지 방법에 대하여 고장이 없을 확률과 결함 복구시간을 비교하였다. 또한 세가지 방법에 대한 각각 프로그램 버전들을 만들어서 실제의 결함들을 이들 프로그램에 삽입하여 실행시킴으로써 실제의 경험을 통한 평가도 수행하였다. 결함 기반의 분산복구블록의 신뢰도는 복구처리 프로그램에 의한 복구의 도움으로 일반 분산복구블록의 신뢰도보다 좋아지며, 결함 복구시간은 시스템의 소프트웨어 신뢰도를 저하시키지 않는 범위 내에서 감소된다는 것을 알 수 있다. 결함 기반의 분산복구블록은 결함이 없을 경우 프로그램 수행시간이 일반 분산복구블록보다 길어지지만 문제시할 만한 수준이 아니며 계층적 결함기반 분산복구블록은 비계층적 결함기반 분산복구블록보다 결함의 복구시간이 단축되어 보다 높은 신뢰도를 이룰 수 있다.

서지기타정보

서지기타정보
청구기호 {DCS 03002
형태사항 vii, 88 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이병선
지도교수의 영문표기 : Yong-Rae Kwon
지도교수의 한글표기 : 권용래
수록잡지명 : "Fault-based distributed recovery block (FDRB) for switching systems". International journal of computer & information science, v.4 no.4, (2003)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 82-85
주제 Software Fault Tolerance
Distributed Recovery Block
Self-Checking Program
Recovery-Handling Program
소프트웨어 결함 포용
분산 복구 블록
자기 검사 프로그램
복구 처리 프로그램
QR CODE qr code