This paper predicted the realized volatility of KOSPI200 with machine learning algorithms and financial time series models, then compared the prediction results. The results showed better forecasting performance when Factor Analysis, Ridge, Random Forest and XGBoost methods are used with data from various foreign stock markets, exchange rates, interest rates, and commodity futures than the GARCH(1,1) and NGARCH(1,1) methods, which are financial time series models used to predict volatility conventionally. In the data used for prediction of the realized volatility, the results showed that the data cannot be explained only by a linear relationship, so we mainly analyzed that there is a non-linear relationship. Through this, the prediction method using a machine learning algorithms were able to show better prediction accuracy.
본 논문은 코스피200 주가지수의 실현변동성을 금융시계열 모형과 함께 기계학습 알고리즘으로 예측하고 그 결과를 비교했다. 전통적으로 변동성을 예측하는데 사용되던 금융시계열 모형인 GARCH(1,1)모형과 NGARCH(1,1)모형보다 여러 해외 주식시장, 환율, 금리, 상품선물 등의 데이터를 활용해서 인자분석, 릿지(Ridge), 랜덤포레스트(Random Forest), XGBoost 알고리즘을 사용한 예측 결과가 더 우수했다. 또한, 본 논문에서 실현 변동성 예측에 활용한 데이터 내에서 선형적 관계만으로 설명할 수 없는 비선형적인 관계가 있는 것을 파악했고, 이를 통해 기계학습 알고리즘을 활용한 예측 기법이 더 향상된 예측 정확도를 보일 수 있었다.