서지주요정보
D2GRAF: dynamic and decentralized GPU resource allocation framework for high performance computing on cloud system = D2GRAF : 클라우드 시스템에서의 고성능 컴퓨팅을 위한 동적·분산식 GPU 자원 할당 프레임워크
서명 / 저자 D2GRAF: dynamic and decentralized GPU resource allocation framework for high performance computing on cloud system = D2GRAF : 클라우드 시스템에서의 고성능 컴퓨팅을 위한 동적·분산식 GPU 자원 할당 프레임워크 / Quoc Dung Van.
저자명 Van, Quoc Dung ; Van Quoc Dung
발행사항 [대전 : 한국과학기술원, 2015].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028277

소장위치/청구기호

학술문화관(문화관) 보존서고

MCS 15057

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

As the evolution of General-Purpose Graphic Processing Unit (GPGPU) has significantly improved in computational processing power recently, many High Performance Computing Platform (HPCs) have integrated GPGPU as their accelerator engine. Cloud Provides, which allow user to setup their own HPC, also consider add GPGPU as a cloud resource. Current state of the art technology, that enables GPGPU resource in Cloud - called GPU Virtualization - are NVIDIA Grid, PCI Passthrough, and remote API. Amongst these, Remote API has better resource utilization than PCI Passthrough and is more flexible to deploy than NVIDIA Grid. However, there is no comprehensive study to adopt this technique into Cloud platform as Cloud System poses many challenges such as highly scalable, fault-tolerant system requirement, optimized resource usage... This thesis analyzes the characteristic of GPGPU and Cloud Platform, based on which, a comprehensive framework, called D2GRAF, is proposed. D2GRAF is framework that allows scheduling GPU resource automatically and it is designed with a goal of a scalable, fault tolerant system. To evaluate this work, real experiment using D2GRAF on Cloud Platform (OpenStack) has been performed. In addition, simulation environment also is developed in order to test its scalable and fault-tolerant characteristic. The result shows that D2GRAF could scale well and have reasonable recovery time with low overhead on the whole system.

최근 전산처리능력에 있어 GPU 상의 범용계산(GPGPU)의 진화가 상당히 진전됨에 따라, 많은 수의 고성능 컴퓨터 플랫폼이 GPGPU를 엑셀러레이터 엔진으로써 통합시켜 왔다. 사용자들에게 자신만의 고성능컴퓨터를 설정할 수 있도록 하는 클라우드 프로바이더의 경우 또한 GPGPU를 클라우드 리소스로써의 활용을 고려하고 있다. 클라우드 상에서 GPGPU를 리소스화 한 (GPU 가상화라 불리는) 최근의 최첨단 기술로는 NVIDIA Grid, PCI Pass through, Remote API 등이 있다. 이들 중 Remote API는 PCI Pass through 보다 리소스 사용율이 더 우수하고, NVIDIA Grid 보다 전개면에서 더 유연하다. 그러나, 확장성 문제나, 고장감내 시스템의 요구사항, 최적화된 리소스 사용 등 클라우드 시스템에서 야기될 수 있는 여러가지 난제들을 고려하여 클라우드 플렛폼에 도입되는 것에 대한 포괄적인 연구는 없는 상태이다. 본 논문에서는 GPGPU와 클라우드 플렛폼의 특징을 분석하고 클라우드 플랫폼과 GPGPU의 통합적 프레임워크인 D2GRAF를 제시하였다. D2GRAF 는 확장성과 고장감내 능력을 갖춘 시스템을 목적으로 하여 고안되었다. 이를 달성하기 위해서, D2GRAF는 마스터와 슬레이브 역할 내에서 운영되는 복수의 일정관리 체제(D2GRAF 스케줄러)로 이루어진다. 효과적인 일정관리와 확장성을 구축하기 위하여, 이 체제들은 주키퍼 서버와 인피니밴드 네트워크 라이브러리와 협력하면서, 네트워크 접근에 따라 클러스터를 구축한다. 결국, 주키퍼의 “Watch” 기능이 마스터와 슬레이브의 고장을 신속하게 복구함으로써 높은 고장감내 능력을 달성할 수 있도록 도와주는 것이다. 이 구조는 실질적인 실행 및 시뮬레이션(모의실험) 모두에서 측정되었다. 결과에 따르면, D2GRAF는 GPU가상화 기술에 비해 오버헤드가 감소한다. 또한 1000번에 걸친 노드 모의실험결과 높은 고장감내 능력과 확장성을 보인다.

서지기타정보

서지기타정보
청구기호 {MCS 15057
형태사항 vi, 44 p : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : Van Quoc Dung
지도교수의 영문표기 : Dae Young Kim
지도교수의 한글표기 : 김대영
Including Appendix
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 References : p.
주제 GPU Resource Allocation
High Performance Computing
Cloud System
Decentralized
D2GRAF
GPU 자원 할당
고성능 컴퓨팅을
클라우드 시스템
분산식
D2GRAF
QR CODE qr code