서지주요정보
SDDP-Transformer: applying the transformer to generation of piecewise linear value function = 트랜스포머를 활용한 가치 함수의 받침 초평면 생성 연구
서명 / 저자 SDDP-Transformer: applying the transformer to generation of piecewise linear value function = 트랜스포머를 활용한 가치 함수의 받침 초평면 생성 연구 / Jong-Woong Park.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040612

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MIE 23007

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Stochastic dual dynamic programming (SDDP), the conventional stage-wise decomposition algorithm for large-scale multistage stochastic programs, approximates the value function by adding a supporting hyperplane at each iteration. In other words, SDDP is an algorithm that sequentially generates supporting hyperplane until converging to the solution. SDDP is known as a state-of-the-art method for solving multi-stage stochastic optimization problem, but it has a critical problem related to growing time complexity occurred by increasing size of subproblem as the algorithm progresses. Transformer is a sequence model that shows the best performance with an encoder-decoder structure based on attention mechanism. We propose a model that sequentially generates supporting hyperplanes to build piecewise linear lower bound for value function based on the structure of Transformer. Our model can decrease problem solving cost of SDDP without losing solution quality compared to original method across various multi-stage stochastic optimization problems.

다단 추계적 최적화 문제의 여러 해법 중 가장 보편적으로 활용되는 방법은 추계적 쌍대 동적 계획법이다. 추계적 쌍대 동적 계획법은 불확실한 상황에서 쌍대 변수를 활용하여 순차적으로 가치 함수의 받침 초평면을 찾고, 초평면의 집합인 조각별 선형 함수로 가치 함수를 근사한다. 이러한 방식은 하위 단계 문제의 크기를 증가시켜, 추계적 쌍대 동적 계획법의 시간 복잡도가 선형으로 늘게 된다. 시간 복잡도 문제로 인해 추계적 쌍대 동적 계획법을 대규모 문제에 적용하는 데 많은 어려움이 있다. 트랜스포머는 선도적인 순차 모형으로서 기계 번역, 음성 인식 등 다양한 분야에서 활용되고 있다. 이 연구에서는 트랜스포머를 활용하여 가치 함수의 받침 초평면을 순차적으로 생성하는 모델을 소개한다. 우리의 모델로 가치 함수를 근사하는 조각별 선형 함수를 짧은 시간 안에 생성할 수 있고 추계적 쌍대 동적 계획법보다 더 낮은 오차율의 근사 함수를 생성할 수 있다.

서지기타정보

서지기타정보
청구기호 {MIE 23007
형태사항 v, 74 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박종웅
지도교수의 영문표기 : Woo Chang Kim
지도교수의 한글표기 : 김우창
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 산업및시스템공학과,
서지주기 References : p. 71-72
주제 Multistage stochastic optimization
Stochastic dual dynamic programming
Value function approximation
Sequence model
Transformer
다단 추계적 최적화 문제
추계적 쌍대 동적 계획법
가치 함수 근사
순차 모형
트랜스포머
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서