For software maintenance, bug reports provide useful information to developers as they can be used for the various tasks of developers such as debugging and understanding previous changes. However, as they are typically written in the form of conversation among developers, bug reports tend to be unnecessarily long and verbose, with the consequence that developers often have difficulties at reading or understanding bug reports. In order to mitigate this problem, techniques that automatically generate a summary of bug report were proposed, and various related studies were conducted. However, existing bug report summarization techniques did not fully exploit the inherent characteristics of bug reports. In this paper, we propose a bug report summarization technique that uses the weighted-PageRank algorithm and exploits the 'duplicates', 'blocks', and 'depends-on' relationships between bug reports. Experiment results show that our approach outperforms the state-of-art technique in terms of both quality of summary and number of applicable bug reports.
소프트웨어의 유지보수 단계에서 소프트웨어의 버그 리포트는 개발자에게 유용한 정보를 제공한다. 개발자는 버그 수정이나 변경 소프트웨어 유지보수 단계에서 소프트웨어의 버그 리포트는 개발자에게 유용한 정보를 제공한다. 개발자들은 버그 수정이나 변경 내역 열람 등 다양한 작업을 위해 버그 리포트를 열람한다. 하지만, 개발자들의 대화 형식으로 작성된 버그 리포트의 특징 때문에 버그 리포트는 종종 매우 길거나 장황하여 이를 읽고 이해하기 어려운 경우가 많다. 이러한 문제점을 해결하기 위한 방법으로 버그 리포트의 요약문을 자동으로 생성하는 기법이 제안되었고, 다양한 관련 연구가 진행되었다. 하지만, 기존에 제안된 버그 리포트 요약 기법들은 버그 리포트만의 고유한 특성들을 활용하지 않는 경우가 많다. 본 연구에서는 버그 리포트들 사이의 duplicates, blocks, depends-on 연관 관계들을 이용한 weighted-PageRank 알고리즘 기반 버그 리포트 요약 기법을 제안한다. 실험 결과 제안 기법이 기존 버그 리포트 요약 기법보다 요약 품질과 적용 범위 측면에서 뛰어남을 확인하였다.