Reliable and accurate software effort estimation is critical for successful software project management. Analogy-Based effort Estimation (ABE) is one of the most widely used models. It predicts the effort of a new project by using the effort of its similar historical projects. In order to improve the accuracy of ABE, many previous works proposed methods to determine the suitable weighted similarity measure, which is called feature weighting technique. However, an optimal feature weight is optimized for the entire software project dataset in previous feature weighting techniques. It leads all new projects to use the same feature weight to estimate their effort, although their characteristics are different from each other. In other words, new projects use feature weight that is not optimized for their own. Thus in this paper, we propose the locally optimized feature weighting technique that the different feature weight, which is optimized for each new project, is assigned to new projects respectively. The proposed our method is validated that is compared with conventional ABE and other feature weighting models on the Desharnais dataset, Albrecht dataset, and Bank dataset. The first two datasets are public and widely used in effort estimation and last one is not public but it is project data conducted in Korean company. The experimental results show that our approach significantly improves the estimation accuracy over the conventional ABE and other feature weighting models as well.
유추기반 공수 예측 기법은 소프트웨어 공수 예측 분야에서 많이 연구되고 있는 기법으로 새로운 프로젝트의 공수를 기존에 수행된 프로젝트들 중 유사한 속성을 가지는 프로젝트들을 이용해 유추하는 기법이다. 새로운 프로젝트와 유사한 과거의 프로젝트를 보다 정확히 선택하기 위해 기존의 많은 연구들에서는 각 속성들의 서로 다른 영향력을 고려하여 각 속성별로 가중치를 두는 기법들을 제안하였다. 그러나, 이 같은 기법들은 각 속성별 가중치를 과거의 프로젝트 데이터 세트 전체에 최적화된 하나의 값으로만 제시하기 때문에 공수를 예측하고자 하는 새로운 프로젝트와 유사한 프로젝트들을 선택할 시 항상 동일한 속성 가중치를 사용한다. 이는 각각의 프로젝트들이 가지는 속성의 영향력을 무시하기 때문에 유추기반 공수 예측 기법의 성능을 떨어뜨리는 주요한 요인이 될 수 있다. 따라서 본 논문에서는 새로운 프로젝트들을 예측할 때 각각의 프로젝트마다 적합한 최적의 속성 가중치 부여 기법을 제안한다. 제안된 기법은 세가지 소프트웨어 프로젝트 데이터 세트 (국외 및 국내의 조직으로부터 수집된 데이터 세트)에 대해 서로 다른 특성을 가지는 네 가지 유추기반 공수 예측 기법을 적용해 그 결과를 비교 및 분석하였다.