Air pollutants are the known cause of many respiratory and cardiovascular diseases, thus being detrimental influence on human health worldwide. On top of inflicting public health, air pollutants are known to impact the economy and the policy-making process. Therefore, making accurate forecasts of air pollutants is an important matter for all sectors. We conduct probabilistic forecasts instead of point forecasts, as probabilistic forecasts allow us to prepare for events with low probability. We test probabilistic forecasting models based on traditional time series models, namely ARIMA-GARCH against the deep neural network-based time series model DeepAR. As previous research has investigated the correlation between air pollutants and other variables such as weather or traffic volume, we incorporate such covariates to our DeepAR model expecting the covariates to raise model performance. Are results show that DeepAR consistently outputs better performance for probabilistic forecasts in air pollutants compared to ARIMA-GARCH models in most cases, while incorporating covariates to DeepAR further enhances model performance for the accordingly relevant air pollutants.
미세먼지를 포함한 공기오염원은 호흡기 질환 등을 유발하여 그 영향범위 내에 있는 시민들에게 해로운 영향을 끼친다. 이러한 영향은 공중보건, 의료 뿐만 아니라 경제 그리고 정책에도 영향을 끼친다. 따라서, 공기오염원의 수치를 정확하게 예측할 필요가 있다. 확률본포적 예측은 기존의 예측 방법론으로는 대처할 수 없는, 낮은 확률의 사건에 대처할 수 있게 해주기에, 시계열로 나타낼 수 있는 공기오염원 수치를 확률분포적으로 예측하고자 한다. 본 연구는 기존 시계열 모델과 딥러닝 기반 시계열 모델의 성능을 비교한다. 또한, 선행연구를 통해서 미세먼지 예측에 기상, 교통 관련 시계열 데이터가 상관성 있다고 밝혀져 있기에, 관련성 있는 변수를 딥러닝기반 시계열 모델을 학습하여 성능을 비교한다. 본 연구는 기존 시계열 모델에 비해 딥러닝 기반 시계열 모델이 대체로 더 좋은 결과를 나타냈고, 관련성 있는 변수를 통해서 특정 공기오염원에 대한 예측력을 높일 수 있다는 것을 밝혔다.