서지주요정보
가변적 데이터 생성법 적용한 딥러닝 시계열 알고리즘 기반 기업부도 예측 모형의 효과성에 관한 연구 = (A) study on the effectiveness of the corporate default prediction model based on the deep learning time series algorithm using the variable data generation method
서명 / 저자 가변적 데이터 생성법 적용한 딥러닝 시계열 알고리즘 기반 기업부도 예측 모형의 효과성에 관한 연구 = (A) study on the effectiveness of the corporate default prediction model based on the deep learning time series algorithm using the variable data generation method / 차성재.
저자명 차성재 ; Cha, Sung-Jae
발행사항 [대전 : 한국과학기술원, 2019].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8034034

소장위치/청구기호

학술문화관(도서관)2층 패컬티라운지(학위논문)

MFE 19008

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

등록번호

9001183

소장위치/청구기호

서울 학위논문 서가

MFE 19008 c. 2

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Based on the global financial crisis, which has had a significant impact on Korea, this study is conducted using 10 years of annual corporate data from 2000 to 2009. Data are divided into training data, validation data, and test data(7, 2, and 1 years) respectively. In order to construct a consistent bankruptcy model in the flow of time change, we first trained a time series deep learning algorithm model using the data before the financial crisis (2000~2006). The parameter tuning of the the deep learning time series algorithm and the other models is conducted with validation data including the financial crisis period (2007~2008). As a result, a model that showed similar pattern to the results of the learning data and showed excellent prediction power is constructed. After that, each bankruptcy prediction model is restructured by integrating the learning data and validation data again (2000 ~ 2008), applying the optimal parameters as in the previous validation. Finally, each corporate default prediction model is evaluated and compared using test data (2009) based on the trained models over nine years. Then, the usefulness of the corporate default prediction model based on the deep learning time series algorithm is proved. In addition, by adding the Lasso regression analysis to the existing methods (multiple discriminant analysis, logit model) which select the variables, it is proved that the deep learning time series algorithm model based on the three bundles of variables is useful for robust corporate default prediction. The definition of bankruptcy used is the same as that of Lee (2015). Independent variables include financial information such as financial ratios used in previous studies. Multivariate discriminant analysis, Logit model, and Lasso regression model are used to select the optimal variable group. The influence of the Multi discriminant analysis model proposed by Altman (1968), the Logit model proposed by Ohlson (1980), the KMV model proposed by Merton (1974), the non-time series machine learning algorithms, and the deep learning time series algorithms are compared. In the case of corporate data, there are limitations of 'nonlinear variables', 'multi-collinearity' of variables, and 'lack of data'. The logit model is nonlinear, the Lasso regression model solves the multi-collinearity problem, and the deep learning time series algorithm using the variable data generation method is complemented by the lack of data. Big Data Technology, a leading technology in the future, is moving from simple human analysis, to automated AI analysis, and finally towards future intertwined AI applications. Although the study of the corporate default prediction model using the time series algorithm is still in its early stages, deep learning algorithm is much faster than regression analysis at corporate default prediction modeling. Also, it is more effective on prediction power. Through the Fourth Industrial Revolution, the current government and other overseas governments are working hard to integrate the system in everyday life of their nation and society. Yet the field of deep learning time series research for the financial industry is still insufficient. This is an initial study on deep learning time series algorithm analysis of corporate defaults. Therefore it is hoped that it will be used as a comparative analysis data for non-specialists who start a study combining financial data and deep learning time series algorithm.

본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이를 바탕으로 금융위기 기간을 포함(2007~2008년)한 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 매개변수를 튜닝한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 튜닝된 매개변수를 적용하여 모형을 재구축한다. 이를 통해 최종 학습된 모형으로 시험 데이터(2009년)를 예측하고 다양한 알고리즘과 결과를 비교함으로서 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 이인로(2015) 저자의 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 최종적으로 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓 모형, Merton(1974)의 KMV 모형 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, ‘비선형적인 변수들’, 변수들의 ‘다중 공선성 문제’, 그리고 ‘데이터 수 부족’이란 한계점이 존재한다. 이에 로짓 모형은 ‘비선형성’을, Lasso 회귀분석 모형은 ‘다중 공선성 문제’를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 기존의 연구와 비교되는 효과성을 보이고자 한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

서지기타정보

서지기타정보
청구기호 {MFE 19008
형태사항 iii, 29 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Sung-Jae Cha
지도교수의 한글표기 : 강장구
지도교수의 영문표기 : Jangkoo Kang
수록잡지명 : "딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증". 지능정보연구논문지, v.24.no.4, pp.1-32(2018)
학위논문 학위논문(석사) - 한국과학기술원 : 금융공학프로그램,
서지주기 참고문헌 : p. 26-27
주제 최적 변수 선별
Lasso 회귀분석
딥러닝 시계열 알고리즘
가변적 데이터 생성법
기업 부도
Optimal feature selection
lasso regression
deep learning time series algorithm
variable data generation method
corporate default
QR CODE qr code