An analytical software reliability model that predicts future software failures based on software failures during the test phase has been studied for decades. However, the analytical software reliability model has limitations such as unrealistic assumptions and model selection problems, and a data-driven software reliability model has been proposed to overcome them.
The data-driven software reliability model generally has a Multiple Delayed Input Single Output structure in which the cumulative failures from t-1 to t-d are input in order to predict the cumulative failures at time t, where d is the size of the input domain. Previous studies have shown that the data-driven software reliability models with different input domains have gap of predictive performance, but the research assumed that there is a method to select the input domain with the best predictive performance. However, in practice, we cannot use data driven software reliability model with an optimal input domain selection method, and just use data driven software reliability model with a heuristic input domain selection method.
In this paper, we propose an input domain selection method based on multi-criteria in data-driven software reliability model. Using the failure datasets collected from 36 projects, we show that data-driven software reliability model using proposed selection method has better predictive performance than the existing model.
테스트 단계 동안 발생 한 소프트웨어 실패를 기반으로 추후 발생 할 소프트웨어 실패를 예측하는 분석적 소프트웨어 신뢰성 모델이 수 십년 간 연구 되어 왔다. 하지만 분석적 소프트웨어 신뢰성 모델은 비 현실적인 가정 및 모델 선택 문제 등의 제한 점이 있어 그를 극복 하기 위해 데이터 기반 신뢰성 모델이 제안 되었다.
데이터 기반 신뢰성 모델들은 일반적으로 t 시점의 누적 실패 수를 예측하기 위해 t-1의 누적 실패 수부터 t-d의 누적 실패 수 각각을 입력으로 넣는 지연 된 다중 입력 단일 출력 구조를 가지는데, 이때 d의 크기를 입력 도메인이라고 한다. 기존의 연구들에서는 서로 다른 입력 도메인을 가지는 데이터 기반 신뢰성 모델 간의 예측 성능 차이를 보였으나, 가장 예측 성능이 좋은 입력 도메인을 선택 할 방법이 있다고 가정하고 연구를 진행하였다. 하지만 실무에서는 가장 좋은 예측 성능을 보일 입력 도메인을 알 수 없기 때문에 쓸 수 없는 방법으로, 경험적으로 입력 도메인을 선택 하여 모델을 사용 할 수 밖에 없다.
본 논문에서는 다양한 적합도 척도들 간의 영향 관계를 고려한 입력 도메인 선정 방법을 제안한다. 36개의 프로젝트로부터 수집 한 실패 데이터를 사용하여 본 논문에서 제안 하는 방법을 사용한 데이터 기반 신뢰성 모델이 기존의 기법에 비해 좋은 예측 성능을 보임을 확인하였다.