서지주요정보
Graph-based supplementary patch recommendation and software reliability prediction by mining software repositories = 소프트웨어 저장소 마이닝을 통한 그래프 기반 부가적인 수정 추천 및 소프트웨어 신뢰성 예측
서명 / 저자 Graph-based supplementary patch recommendation and software reliability prediction by mining software repositories = 소프트웨어 저장소 마이닝을 통한 그래프 기반 부가적인 수정 추천 및 소프트웨어 신뢰성 예측 / Jihun Park.
저자명 Park, Jihun ; 박지훈
발행사항 [대전 : 한국과학기술원, 2016].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8029883

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 16032

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

As developers have used version control systems and bug tracking systems, the software development process has become more visible and traceable. Since the 2000s, the relevant information has been studied by researchers in the mining software repository area. The studies have suggested various prediction models to improve the quality of software and to reduce the development cost. In this dissertation, two principal problems in the mining software repository are studied, using graph-based approaches. First, we examine the change recommendation approach. Change recommendation approaches have been suggested to prevent omission errors by predicting additional change locations for a given change set. We study a group of bug reports that are fixed more than once to investigate real-world omission errors. We empirically study the characteristics of the multi-fix bugs and how the supplementary patch locations can be predicted based on the initial change locations. Additionally, we suggest a novel graph representation - the change relationship graph - and comprehensively investigate the relationships between initial and supplementary change locations on the change relationship graph. Second, we examine the reliability prediction approach. We suggest a reliability measure to take into account the severity of each released fault, specifically the weighted number of faults. Regression models are used to build prediction models based on existing object-oriented, change, and graph metrics. We investigate the effects of metric sets, feature selection methods, regression models, and the size of the training set on the prediction accuracy. Furthermore, we use structure, clone, and co-change graphs to investigate how these graphs evolve along the release history, as well as how they can be used to predict release-level reliability and fault-prone classes.

개발자들이 버전 관리 시스템과 버그 추적 시스템들을 사용함에 따라 소프트웨어 개발 프로세스를 좀 더 명확하게 볼 수 있고, 더 쉽게 추적할 수 있게 되었다. 2000년대 이후로 이러한 정보들이 마이닝 소프트웨어 리포지토리 분야의 연구자들에 의해 연구되었다. 이러한 연구들은 소프트웨어 품질을 높이고 개발 비용을 줄이기 위해 다양한 예측 모델을 활용하였다. 본 학위논문에서는, 마이닝 소프트웨어 리포지토리 분야의 두 가지 중요한 문제에 대해 그래프 기반의 방법론을 제시한다. 첫째로, 우리는 변경 추천 방법론에 대해 연구하였다. 그 동안 특정한 변경 집합에 대해 추가적인 변경 위치를 추천하여 생략 오류를 줄이기 위해 많은 변경 추천 방법론이 제시되었다. 우리는 경험적인 연구를 통해 여러 번 고쳐지는 버그들의 특성과 어떻게 부가적인 수정 위치가 초기 수정 위치로부터 예측될 수 있는지에 대해 연구하였다. 추가적으로, 우리는 변경 관계 그래프라는 새로운 그래프 표현방법을 제시하여 초기 수정 위치와 부가적인 수정 위치 사이의 관계를 복합적으로 연구하였다. 둘째로, 우리는 신뢰성 예측 방법론에 대해 연구하였다. 우리는 출시된 소프트웨어에 포함되어있는 결함들의 위험도를 고려하여 신뢰성을 측정하기 위해 가중 결합 수 라는 새로운 척도를 제시하였다. 기존의 객체지향, 변경, 그래프 측도를 이용하여 회귀 모델을 적용한 예측 모델이 사용되었다. 우리는 사용된 측도의 종류, 특징 선택 기법, 회귀 모델의 종류, 학습 데이터의 수 등이 예측 모델의 정확도에 어떻게 영향을 미치는지에 대해 연구했다. 추가적으로, 출시 주기에 따라 구조적, 클론, 함께 고쳐지는 관계를 이용한 그래프들이 어떻게 진화하는지에 대해 살펴보았다. 또한, 이러한 그래프들이 출시된 소프트웨어의 신뢰성 예측 문제와 결함이 있는 클래스의 위치를 예측하는 문제에 사용되어 정확도를 높일 수 있는지에 대해 연구하였다.

서지기타정보

서지기타정보
청구기호 {DCS 16032
형태사항 viii, 97 p : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박지훈
지도교수의 영문표기 : Doo-Hwan Bae
지도교수의 한글표기 : 배두환
학위논문 학위논문(박사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 84-93
주제 Software repository mining
Software faults
Change recommendation
Graph-based prediction
Prediction models
소프트웨어 리포지토리 마이닝
소프트웨어 결함
변경 위치 추천
그래프 기반 예측
예측 모델
QR CODE qr code