3D integration is one of the most promising options to fulfill the demands of high performance and large cache by integrating multiple processor cores and 3D stacked cache. Temperature however becomes a problem in 3D integration due to increased power density. This implies that while the performance is maximized, thermal issues like reliability, power consumption must be taken into account
In this thesis both the design time and runtime solutions are presented to maximize the performance keeping the temperature under a given limit.
Chapter 2 presents two methods to exploit maximum performance while keeping the temperature under a given limit. First method optimizes the clock frequencies and cache size while second method solves for the op-timum clock frequencies, cache capacity and the placement of cache banks for each core to get the maximum throughput at design time. Experiments are done on multiple benchmark programs and a peak 53% and an average 49% improvement in performance as compared to the base case which assigns same frequency and number of banks to each core is found.
Chapter 3 presents a runtime solution to maximize performance in 3D multicore systems with stacked NU-CA cache. This method also optimizes the clock frequencies, cache capacity and placement of cache banks at runtime while meeting the temperature constraint. This method utilizes both the workload characteristics and the thermal characteristics of 3D architectures to get the maximum performance. The experiments performed on SPEC2000/2006 and other real-time programs show a performance improvement of 35.2 % (average 33.8%) compared with the design time solutions.
삼차원 집적기술은 다중프로세서와 삼차원 적층 캐시를 함께 집적함으로써 고성능과 고용량 캐시메모리를 구현할 수 있는 새로운 기술이다. 그러나 삼차원 집적으로 인해 증가된 전력밀도는 온도를 상승시키는 요인이 된다. 이는 신뢰성, 전력 소비 등 온도와 관련된 문제들을 고려해야 하는 것을 의미한다.
본 논문에서는 시스템 온도를 정해진 한계점 이하로 동작시키면서 성능을 최대화 하기 위한 디자인 타임 방법론과 실시간 방법론을 소개한다.
처음 두 방법은 시스템 온도를 정해진 한계점 이하로 동작시키면서 성능을 최대화 하는 기술을 소개한다. 처음 방법은 프로세서의 동작 주파수와 캐시 용량을, 두번 째 방법은 동작 주파수, 캐시 용량, 그리고 캐시 뱅크의 위치를 각각 디자인 타임에 결정한다. 실험 결과는 기존 방법 대비 최대 53%, 평균 49%의 성능 이득을 보여준다.
그리고 나서 NUCA 캐시가 적층된 삼차원 다중 프로세서에서의 성능 최대화를 위한 실시간 해결책을 제안한다. 이 방법 역시 프로세서들의 동작 주파수와 캐시 용량, 그리고 캐시 뱅크들의 위치를 실시간에 결정하며 시스템 온도는 정해진 한계점을 넘지 않도록 한다. 이 방법은 프로그램의 특성들과 삼차원 집적 구조에서의 온도 특성들을 고려하여 최대 성능을 얻을 수 있었다. SPEC2000/2006을 바탕으로 한 실험 결과는 디자인 타임에 적용된 방법들에 대해 최대 35.2%, 평균 33.8% 로 성능 향상을 가져 왔다.