The latest proposed HBM-PIM architectures target to accelerate bandwidth sensitive operation with PIM units around memory banks. In this PIM architecture, locality of the PIM operands must be guaranteed due to their architectural limitation. But state-of-the-art GPUs use hash function for physical address and memory location mapping which causes the problem that each operand is stored in different bank, so PIM operation cannot be performed. In this thesis, we propose software and hardware architecture to utilize PIM units in GPUs with HBM-PIM system by rearranging the PIM operands in HBM logic die to guarantee PIM operand locality.
최근 제안된 HBM-PIM 구조는 메모리 뱅크 주변에 인메모리 연산기를 두며 메모리 대역에 민감한 연산 가속을 목표로 한다. 이러한 PIM 구조에서는 구조적 한계 때문에 피연산자들의 지역성이 전제되어야 한다. 하지만 최신 GPU는 메모리 위치 매핑을 위해 해시 함수를 사용하며 이 경우 각 피연산자들이 다른 메모리 뱅크에 저장되어 PIM 연산을 수행할 수 없다는 문제점이 있다. 본 학위 논문에서는 이 문제를 해결하기 위하여, HBM logic die에서 인메모리 연산의 피연산자 간 지역성을 갖도록 데이터를 재배치하여 HBM-PIM을 사용하는 GPU 시스템에서 PIM 연산을 원활하게 수행할 수 있도록하는 소프트웨어와 하드웨어 구조를 제안하고자 한다.