서지주요정보
Proximal policy optimization (PPO) based reinforcement learning model for scalable 3D X-point array structure design considering signal integrity issues = 신호무결성을 고려한 스케일러블 3차원 크로스포인트 어레이 구조 설계를 위한 근위 정책 최적화 기반 강화학습 모델
서명 / 저자 Proximal policy optimization (PPO) based reinforcement learning model for scalable 3D X-point array structure design considering signal integrity issues = 신호무결성을 고려한 스케일러블 3차원 크로스포인트 어레이 구조 설계를 위한 근위 정책 최적화 기반 강화학습 모델 / Kyungjune Son.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039573

소장위치/청구기호

학술문화관(도서관)2층 학위논문

DEE 22063

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In this paper, we, for the first time, propose a reinforcement-learning model to design an optimal 3D X-Point array structure considering signal integrity issues. The interconnection design problem is modeled to the MDP. The proposed reinforcement-learning model designs the 3D X-Point array structure based on three reward factors: the number of bits, the crosstalk, and the IR drop. We applied multi-layer perceptron and long shot-term memory to parameterize the policy. Proximal policy optimization is used to optimize the parameters to train the policy. The reward of the proposed reinforcement-learning model is well converged with variations of the array structure size and hyperparameters of the reward factors. We verified the scalability and sensitivity of the proposed reinforcement-learning model. With the optimal 3D X-Point array structure design, we analyzed the reward factor and signal integrity issues. The optimal design of the 3D X-Point array structure shows 17 % to 26.5 % better signal integrity performance than the conventional design in finer process technology. In addition, we suggest a range of possible directions for improvement of the proposed model with variations of MDP tuples, reward factors, and learning algorithms, among other factors. Using the proposed model, we can easily design an optimal 3D X-Point array structure with a certain size, performance capabilities and specifications based on reward factors and hyperparameters.

본 논문에서는 신호 무결성 문제를 고려하여 최적의 3D X-Point 어레이 구조를 설계하기 위한 강화 학습 모델을 처음으로 제안한다. 상호 연결 설계 문제는 MDP로 모델링되며, 제안된 강화 학습 모델은 비트 수, 누화, 전압 강하의 세 가지 보상 요소를 기반으로 3D X-Point 배열 구조를 설계한다. 다층 퍼셉트론과 장기 기억을 적용하여 정책을 매개변수화 하였으며, 근위정책최적화는 정책을 훈련하기 위해 매개변수를 최적화하는 데 사용된다. 제안된 강화 학습 모델의 보상은 배열 구조 크기와 하이퍼파라미터의 변화로 잘 수렴되며 확장성과 민감도를 검증하였다. 최적의 3D X-Point 어레이 구조 설계로 보상 요인 및 신호 무결성 문제를 분석하였다. 3D X-Point 어레이 구조의 최적 설계는 미세 공정 기술에서 기존 설계보다 17% ~ 26.5% 더 나은 신호 무결성 성능을 보여주며, 또한 MDP 튜플, 보상 요인, 학습 알고리즘 등을 변형하여 제안된 모델을 개선할 수 있는 다양한 방향을 제안하였다. 제안된 모델을 사용하여 보상 인자와 하이퍼파라미터를 기반으로 특정 크기, 성능 및 사양을 가진 최적의 3D X-Point 어레이 구조를 쉽게 설계할 수 있다.

서지기타정보

서지기타정보
청구기호 {DEE 22063
형태사항 v, 62 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 손경준
지도교수의 영문표기 : Joungho Kim
지도교수의 한글표기 : 김정호
Including appendix
학위논문 학위논문(박사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 51-52
주제 3D X-Point array structure
Crosstalk
Interconnection
IR drop
Long-short term memory
Proximal policy optimization
Reinforcement learning
Signal integrity
3차원 크로스포인트 어레이 구조
누화
상호 연결
전압 강하
장단기메모리
근위정책최적화
강화학습
신호 무결성
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서