서지주요정보
End-to-end price movement prediction network using incomplete time series data = 불완전한 시계열 데이터를 이용한 엔드투엔드 가격 변동 방향 예측 네트워크
서명 / 저자 End-to-end price movement prediction network using incomplete time series data = 불완전한 시계열 데이터를 이용한 엔드투엔드 가격 변동 방향 예측 네트워크 / Taemin Choi.
발행사항 [대전 : 한국과학기술원, 2020].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8036117

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 20103

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Market data is complex and dynamic data. It is caused by the traders' interactions in the market and creates market trends. We solved the problem of predicting the direction of price changes for one of the market data, Naphtha. Since Naphtha is also market data, there are two difficulties. 1) Market data is determined by the involvement of persons and is influenced by the investor's psychological state or international situation or policy. This is what makes market data very unstable. Therefore, it is impossible to predict future price based only on past price trends. 2) Naphtha is a petrochemical produced during petroleum refining, and many other petrochemicals are produced. Inevitably, the price of Naphtha is challenging to predict because it is heavily influenced by the prices of products such as crude oil and gasoline, a type of petrochemical. In this paper, we propose a network that can use Naphtha's supply/demand data to solve the difficulties. Naphtha's supply/demand data is collected every half month. The proposed network generates a latent vector that shows the characteristics of the supply and demand data using the Autoencoder structure. Traditional time series data imputation networks mostly use Generative Adversarial Networks(GAN). A Generative Adversarial Networks must learn step by step. However, the proposed network can learn at once and has a more straightforward structure. It also has the advantage of being more structurally convenient than other networks when used for classification. The proposed network was able to use the price data collected daily and the supply/demand data collected on a half monthly to help the naphtha price prediction. We use 16 price-related data and 17 supply/demand data. Price data was collected from July 2011 and supply/demand data from January 2016. In this paper, we propose a network that can efficiently utilize price data and supply/demand data of Naphtha. The network is designed separately because the characteristics of the two data are different. The important features of price data were extracted using CNN, and the characteristics of supply and demand data were extracted using the proposed autoencoder-based imputation network. In order to resolve the imbalance in the collection period, we first learned using price-related data and fine-tuned to set a better starting point of price network. Also, the two networks were combined to enable end-to-end learning. In the experiments chapter, we measured and compared the network performance using the actual collected data. The performance of the proposed network was measured by Accuracy and Matthew's Correlation Coefficient, and the proposed network showed better results than the network using other market data.

시장 데이터는 복잡하고 동적인 특성을 가지고 있는 데이터다. 이와 같은 복잡함은 시장에서 거래자들간의 상호관계에 의해 발생한다. 여러 복잡함이 합쳐지면서 시장의 경향성이 만들어진다. 우리는 시장 데이터 중 하나인 나프타의 가격의 변동 방향을 예측하는 네트워크를 설계하였다. 나프타 역시 시장 데이터이기 때문에 가격의 변동성을 예측하는데 2가지 어려움이 있다. 1) 시장 데이터는 사람이 참여하여 결정되기 때문에 투자자의 심리 상태 혹은 국제 정세나 정책에 의한 영향을 받는다. 이는 시장 데이터를 매우 불안정하게 만드는 요인이다. 따라서 과거의 가격 추세만으로 미래를 예측하는 것은 불가능하다. 2) 나프타는 석유 정제 중 나오는 화학물질로 생산되는 동안 다른 석유 화학물질이 많이 생산된다. 필연적으로 나프타의 가격은 원유나 가솔린과 같은 부산물들의 가격에 영향을 많이 받아 예측이 어렵다. 이 논문에서는 위의 어려움을 해결하기 위해 나프타의 수급 데이터를 사용할 수 있는 네트워크를 제안한다. 나프타의 수급 데이터는 반월마다 수집된다는 특성이 있다. 이 네트워크는 반월단위로 수집되는 수급데이터를 Autoencoder 구조를 이용하여 데이터의 특성을 잘 나타내는 latent vector를 생성해낸다. 기존 시계열 데이터 생성 네트워크는 대부분 생산적 적대 신경망(GAN)을 사용한다. 생산적 적대 신경망은 학습을 단계적으로 해야하지만 제안된 네트워크는 한 번에 학습을 진행할 수 있고, 더 간단한 구조를 가지고 있다. 또한 분류에 이용할 때도 다른 네트워크보다 구조적으로 편하다는 장점이 있다. 제안된 네트워크는 매일 수집되는 가격 데이터와 반월단위로 수집되는 수급 데이터를 함께 사용할 수 있게하여 나프타 가격예측에 도움을 줬다. 우리는 가격 관련 데이터 16개와 수급 관련 데이터 17개를 이용하여 학습을 진행한다. 가격 관련 데이터는 2011년 7월부터, 수급 관련 데이터는 2016년부터 수집되었다. 본 논문에서는, 나프타의 가격 데이터와 수급 데이터를 효율적으로 활용할 수 있는 네트워크를 제안한다. 두 데이터의 특성이 다르므로 네트워크를 따로 설계하였다. CNN을 이용하여 가격 데이터의 중요 특징을 추출하고, 제안한 autoencoder-based imputation network를 이용하여 수급 데이터의 특징을 추출하였다. 수집 기간의 불균형을 해결하기 위해 가격 관련 데이터를 이용해 먼저 학습을 진행하고 fine tuning하여 더 좋은 학습 시작점을 찾을 수 있게 했다. 또한, 두 네트워크를 합쳐 end-to-end로 학습할 수 있게 하였다. 실험 장에서는 실제 수집된 나프타 관련 데이터를 이용하여 네트워크의 성능을 측정 및 비교하였다. 네트워크의 정확도는 Accuracy와 Matthew's Correlation Coefficient로 측정하였으며 제안된 네트워크가 타 마켓 데이터를 사용한 네트워크에 비해 좋은 결과를 보였다.

서지기타정보

서지기타정보
청구기호 {MEE 20103
형태사항 iii, 31 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최태민
지도교수의 영문표기 : Jong-Hwan Kim
지도교수의 한글표기 : 김종환
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 28-29
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서