서지주요정보
(An) effective software defect prediction via source code to image conversion with semantic information = 의미 정보를 포함한 변환된 이미지를 이용한 효과적인 소프트웨어 결함 예측 기법
서명 / 저자 (An) effective software defect prediction via source code to image conversion with semantic information = 의미 정보를 포함한 변환된 이미지를 이용한 효과적인 소프트웨어 결함 예측 기법 / Sungu Lee.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039909

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MCS 22053

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Primary goals of Software Defect Prediction (SDP) are to predict potential defect-prone source codes in a software and help developers to easily find defects, effectively allocate valuable resources for software quality assurance. The two major steps of SDP are feature extraction and training the model, and many SDP studies have focused on the feature extraction phase. Traditional SDP studies have used manually designed features, which include Halstead metric, McCabe metric, and the change history metric. However, these features depend on how the code is written and changed, thus they do not consider the semantic information of the code. Since semantic information contains how the code works, this information is essential to analyze the defectiveness of the source code. Recent SDP studies proposed the technique that extracts the feature with semantic information. Some studies used Abstract Syntax Tree (AST) to convert whole source code into one vector representing the feature, and trained the defect prediction model using various methods, such as Deep Belief Network and Convolutional Neural Network. Other study used AST to convert each AST node into vector, analyzing the defectiveness of the source code with finer granularity. Finally, a technique which leveraged powerful image classification network and converted the source code into image to classify the defect pattern in the image showed the higher accuracy of the prediction. However, these studies did not fully utilize the semantic information of the source code, which can degrade the prediction performance. In this thesis, we are motivated by the SDP study that uses a powerful image classification network, and we suggest the technique that preserves the semantic information when converting to an image. In order to preserve the semantic information, we extract each phrase (keywords, variables, operators) in the source code, and map to a unique color. We conducted experiments on 8 projects for comparing the accuracy with existing SDP techniques. The results show that our approach is more accurate than the existing techniques.

소프트웨어 결함 예측의 주요 목표는 소프트웨어 내의 결함이 있을 만한 코드를 예측하여 소프트웨어 퀄리티 보증 활동에 사용되는 자원을 효과적으로 처리하여 개발자들이 쉽게 결함을 찾는 것이다. 소프트웨어 결함 예측 과정의 주요한 두 과정은 특징 추출과 모델 훈련이고, 많은 소프트웨어 결함 예측 연구는 특징 추출에 집중하고 있다. 과거의 소프트웨어 결함 예측 연구는 Halstead 메트릭, McCabe 메트릭, 변화 메트릭과 같이 특징을 수동으로 디자인하였다. 하지만, 이러한 특징은 소스코드가 어떻게 작성되고 변화되었는지에 집중하기 때문에, 코드의 시맨틱 정보를 포함하지 않는다. 시맨틱 정보는 코드가 어떻게 작동하는지를 담고 있으므로, 소스코드의 결함 유무를 분석할 때 필수적이다. 최근 소프트웨어 결함 예측 연구들은 시맨틱 정보를 포함한 특징을 추출하는 기법들을 제시하였다. 몇몇 연구는 추상 구문 트리를 이용하여 전체 소스코드를 그 특징을 가진 하나의 벡터로 전환하였고, 이를 심층 신뢰 신경망이나 컨볼루션 신경망을 이용하여 결함 예측 모델을 훈련하였다. 다른 연구는 추상 구문 트리의 각 노드를 벡터로 변환하여, 소스코드를 상세한 수준에서 결함의 여부를 분석하였다. 마지막으로, 소스코드를 이미지로 변환하여 강력한 이미지 분류 네트워크를 사용하여 변환된 이미지 내의 결함 패턴을 파악해 예측 성능을 향상한 기법이 제안되었다. 하지만, 이러한 연구들은 소스코드의 시맨틱 정보를 모두 사용하지 않았기 때문에 결함 예측 성능을 하락시킬 수 있다. 이 논문에서는, 강력한 이미지 분류 네트워크를 사용한 소프트웨어 결함 예측 연구를 기반으로 하여, 소스코드의 시맨틱 정보를 보존한 이미지 변환법을 제안한다. 시맨틱 정보를 보존하기 위해서, 소스코드 내의 각 구문 (키워드, 변수, 연산자)을 추출하여 한 색깔에 대응시킨다. 기존의 소프트웨어 결함 예측 기법과 8개의 프로젝트에 결함 예측 정확성을 비교하는 실험을 수행하였다. 실험 결과 제안한 기법이 기존의 기법보다 더 정확한 예측 성능을 가진다는 것을 보였다.

서지기타정보

서지기타정보
청구기호 {MCS 22053
형태사항 iv, 31 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 이선구
지도교수의 영문표기 : Jongmoon Baik
지도교수의 한글표기 : 백종문
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p. 28-29
주제 Software Defect Prediction
Semantic Information
Abstract Syntax Tree
Image Conversion
소프트웨어 결함 예측
시맨틱 정보
추상 구문 트리
이미지 변환
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서