This thesis investigates investment strategies using the machine learning methodology in the Korean market. The sample period spans 20 years (2001-2020) and the investment universe contains all stocks in the KOSPI and KOSDAQ markets. I use a total of 77 firm characteristic factors, 4 time-series macro factors, and 17 industry dummy variables. The machine learning methodology produces outstanding performance to predict individual stock and portfolio returns in general. Among all machine learning models considered in this thesis, random forest and neural network models show the best performance in terms of predicting individual stock and portfolio returns. My empirical finding also reveals that the variables significantly affecting the investment performance, which are price trend, liquidity, and risk, are similar across the models considered.
본 연구에서는 머신러닝 방법론을 이용하여 한국 시장 주식수익률에 대한 실증 분석을 실시한다. 2001년부터 2020년까지 20년간 유가증권시장 및 코스닥시장에 상장되었던 모든 주식에 대하여 77개의 기업특성변수, 4개의 시계열 매크로변수, 17개의 산업코드 더미변수를 사용하여 연구를 진행한다. 머신러닝 방법론이 주식수익률과 포트폴리오 단위 수익률 대한 강한 예측력을 가짐을 확인하였다. 머신러닝 모델 중에서 신경망 모델과 랜덤포레스트가 가장 안정적이고 뛰어난 예측력을 보였다. 가격 추세 요인, 유동성 요인, 위험 측정 요인이 전체 모델에서 수익률 예측에 가장 중요한 변수임을 확인하였다.