서지주요정보
(A) bilevel optimization framework for peak trough aware time series forecasting = 극값 중심 시계열 예측을 위한 이중 최적화 프레임워크
서명 / 저자 (A) bilevel optimization framework for peak trough aware time series forecasting = 극값 중심 시계열 예측을 위한 이중 최적화 프레임워크 / Jungmin Kim.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8043158

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MAI 24060

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In Time Series Forecasting(TSF), accurately predicting peaks and troughs is critical but challenging with traditional metrics like mean squared error (MSE). We propose a bilevel optimization framework that combines point-wise $L_p$ loss and dynamic time warping (DTW) loss to better capture these critical features. In our bilevel optimization formulation, the upper-level problem minimizes the $L_p$ norm distance, while the lower-level problem targets DTW loss, allowing dynamic adjustment between the two objectives. By separating parameters within a single TSF model, our approach remains model-agnostic and efficient. Our experiment results show that the bilevel optimization framework effectively achieves the primary TSF objective and excels in peak-trough accuracy, outperforming baseline methods in the newly defined Peak-Trough MSE (PTMSE) metric. Qualitative visualizations confirm that our framework enables sharp predictions, and better-capturing peaks and troughs.

시계열 예측에서 피크(Peak)와 트러프(Trough)를 정확하게 예측하는 것은 중요하지만, 평균 제곱 오차와 같은 전통적인 메트릭으로는 이에 대한 한계를 가진다. 우리는 이러한 중요한 특징을 더 잘 포착하기 위해 점별 엘피 \(L_p\) 손실과 동적 시간 왜곡(DTW) 손실을 결합한 이중 최적화 프레임워크를 제안한다. 우리의 이중 최적화 공식에서 상위 문제는 \(L_p\) 노름 거리를 최소화하고, 하위 문제는 동적 시간 왜곡 손실을 목표로 하여 두 목표 간의 동적 조정을 가능하게 한다. 또한, 단일 TSF 모델 내에서 매개변수를 분리함으로써, 우리의 접근 방식은 모델 어그노스틱하고 효율적이다. 시계열 예측 벤치마크 데이터을 대상으로 실험을 진행한 결과, 이중 최적화 프레임워크는 주요 시계열 예측 목표를 효과적으로 달성함과 동시에 피크-트러프 정확도에서 뛰어난 성능을 보이며, 새롭게 정의한 피크-트러프 평균 제곱 오차(PTMSE) 메트릭에서 기존 손실 방법을 능가함을 보여준다. 추가적으로, 정성적 시각화를 통해 우리의 프레임워크가 모델의 날카로운 예측을 가능하게 하여 피크와 트러프를 더 잘 포착한다는 것을 확인할 수 있다.

서지기타정보

서지기타정보
청구기호 {MAI 24060
형태사항 iv, 25 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 김정민
지도교수의 영문표기 : Jaesik Choi
지도교수의 한글표기 : 최재식
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 김재철AI대학원,
서지주기 References : p. 20-23
주제 Time series forecasting
peak-trough
time series metric and loss function
bilevel optimization framework
시계열 예측
피크-트러프
시계열 메트릭 및 손실 함수
이중 최적화 프레임워크
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서

Interpolation between two sine functions (blue and red) by using DTW and Euclidean distance. For Euclidean distance, linear interpolation is applied and a barycenter is computed for DTW The interpolation weights (ㅅi,42) are (0.25, 0.75), (0.5, 0.5), and (0.75, 0.25) corresponding to the ground truth and prediction. We refer to these interpolation figures from [12].

Three types ofpredictions are illustrated: (a) Sharp prediction, (b) Smooth prediction, and (c) Prediction with temporal error, using black for ground truth (GT) and blue for predictions (Pred). Pred-(a) is sharper than pred-(b), both having a similar mean squared error (MSE) of0.55 but Pred-(a) has a significantly lower DTW (25.15) and peak-trough MSE (PTMSE) (0.09) compared to Pred-(b) (92.78, 1

Univariate forecasting results with supervised PatchTST with different losses. The best performance in each loss is bolded. All of the experiments follow the same experimental setup with prediction length H E {96,192,336, 720} and historical time series length T = 336

Comparison of PatchTST [27] model predictions using different losses on an electricity benchmark dataset [48]. Blue shows historical data (model input), and yellow shows ground truth targets. Red and green represent the prediction based on MSE (red) and bilevel optimization (green).

Visualization ofthe predictions ofPatchTST model on Electricity dataset. Blue series is the Inputand ground truth target, the red series is bilevel optimization framework prediction (bi prediction) and the green series is MSE loss-based prediction (MSE prediction). Input length T=336 and output length H=96.

Visualization of the predictions of PatchTST model on Electricity dataset. Input length T=336 and output length H=192.

Visualization ofthe predictions ofPatchTST model on ETTh1 dataset. Input length T=336 and output length H=96.

Visualization ofthe predictions ofPatchTST model on ETTh1 dataset. Input length T=336 and output length H=192.

Visualization ofthe predictions ofPatchTST model on ETTh2 dataset. InputlengthT=336 and output length H=96.

Visualization ofthe predictions ofPatchTST model on ETTh2 dataset. Input length T=336 and output length H=192.

Visualization of the predictions of PatchTST model on ETTm1 dataset. Input length T=336 and output length H=96.

Visualization of the predictions of PatchTST model on ETTm1 dataset. Input length T=336 and output length H=192.

Visualization of the predictions of PatchTST model on Traffic dataset. Input length T=336 and output length H=192.

Visualization of the predictions of PatchTST model on Traffic dataset. Input length T=336 and output length H=336.