Diffusion tensor imaging (DTI) is a noninvasive tractography technique that searches pathways in the brain. Based on complex and specialized computation, the tractography algorithm has been developed to have high reliability. Such computation, however, requires long computation times. Computational running time is a key element in both brain research and disease diagnosis. If we acquire higher resolution DTI data, decreased the voxel size comes at a cost of increased computation time. One way to reduce the computation time is parallel processing, with its highly parallelizable algorithm. The larger the voxel number, the more advantageous it will be to utilize parallelized algorithms. We therefore propose a parallel tractography algorithm from diffusion tensor MR imaging, implemented on a multi-GPU (graphics processing unit). We enhanced the performance to develop an accelerated DTI analysis algorithm by using GPU parallel programming in 3 TESLA C1060 (240 cores each) NVIDIA GPGPUs (general purpose graphics processing units).
확산텐서영상은 뇌 안에 물 분자의 비등방성 계산을 통해서 백질의 신경세포의 연결을 비침습적인 방법으로 확인할 수 있는 뇌 영상 기술이다. 여기서 얻어내는 뇌의 신경세포 연결성은 우리 뇌의 구조적, 기능적 조직을 이해하는데 아주 중요한 요소가 된다. 확산텐서영상 데이터는 스트림라인 방법에 의한 확산텐서영역에서 가장 빠른 확산방향을 따라 궤적을 그리므로 분석된다. 하지만 더 나은 결과를 획득하기 위해 그리고 가지고 있는 내재적 문제점을 해결하기 위해 알고리듬은 점점 복잡해져 계산시간이 길어졌다. 계산시간은 뇌연구와 진단에 있어서 아주 중요한 요소이다. 만약 우리가 높은 해상도의 데이터를 획득했다면 부피소의 개수가 기하급수적으로 늘어나 계산시간은 아주 길어지게 된다. 이 계산시간을 줄이기 위한 방법으로 먼저 계산시간이 오래 걸리는 알고리듬을 심층적으로 분석하여 계산시간이 길어지는 이유를 알아내고, 그 알고리듬을 병렬화 하였다. 그리고 병렬화된 알고리듬을 각 프로세서당 수백개의 코어를 가지고 있는 고도로 높은 병렬 하드웨어 아키텍처의 다중 그래픽처리장치 (NVIDIA TESLA C1060 3개)를 이용한 병렬처리를 적용했다. 하나의 장치는 240개의 코어를 가지고 있다. 이 것은 부피소의 개수가 늘어나면 늘어날수록 더 좋은 성능을 보일 것이다.