This paper proposes a numerical method based on reinforcement learning that can value of option. In the celebrated option pricing model, Black Scholes, it assumes continuous hedging and zero transaction costs during hedging. This paper modifies these assumption as follows to make these assumptions as real as possible. 1) Non-zero transaction costs, 2) Discretized interval of re-hedging of an option replicating portfolio. With new methodology, this paper executed numerical experiments and examine the effects of the modified assumptions. Also, this research compares the results of the experiment with original researches of option pricing, such as Black Scholes Model and Leland Model.
이 논문에서는 강화학습을 이용하여 거래비용이 옵션 가격에 주는 영향을 측정할 수 있는 수치적인 모델을 다루었다. 옵션 가치 평가에서 가장 유명한 블랙 숄즈 모델에서는 연속적인 헤징, 그리고 거래비용이 존재하지 않음을 가정한다. 이 가정들을 현실에 맞게 보완하여 강화학습 모델을 만들었고, 그를 수치적으로 계산해서 새로운 가정들이 옵션 가격에 영향을 얼마나 미치는지를 측정할 수 있게끔 풀어내었다. 이 논문에서는 첫 번째로 거래비용이 없을 때 옵션 딜러의 위험 회피도가 옵션 가치에 미치는 영향을 다루었고, 두 번째로는 거래비용이 존재하는 경우로 모델을 수정하여 거래비용과 헷지 횟수가 옵션 가치에 어떤 영향을 미치는 지를 확인하였다. 그리고, 강화학습 모델의 결과들과 기존의 Black Scholes, Leland의 모형들과 그 이론 가격을 비교해보았다.