서지주요정보
(An) area efficient unified early Z-test for embedded 3D graphics processor = 임베디드 3D 그래픽스 프로세서에 적합한 통합 early Z-test 방법
서명 / 저자 (An) area efficient unified early Z-test for embedded 3D graphics processor = 임베디드 3D 그래픽스 프로세서에 적합한 통합 early Z-test 방법 / Hong-Yun Kim.
발행사항 [대전 : 한국과학기술원, 2008].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8019182

소장위치/청구기호

학술문화관(문화관) 보존서고

MEE 08022

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

As 3D graphics rendering processor requires a large amount of primitives and additional data associated with the primitives to synthesize more realistic and accurate 3D images, memory bandwidth problem has been the major issue in designing a 3D graphics rendering engine. In this paper, we propose an area efficient unified early z-test (EZT) method suitable for embedded 3D graphics processor. The unified EZT unit performs the z-test for a pixel from a tile-based rasterizer by using three depth data of a tile such as Z-Max, Z-Min, and Mask. To validate the proposed method, we use a 3D graphics architecture test simulator. Simulation results for Quake3 3D game show that memory bandwidth in the rasterization pipeline is lowered by 24.8 percent compared to the hierarchical z-buffer and 27.4 percent compared to the mid-texturing method with only a 384 Byte on-chip memory.

3차원 그래픽스 하드웨어의 궁극적인 목표는 현실세계와 구분할 수 없을 정도의 현실감 넘치고 정확한 이미지를 리얼타임으로 생성해 내는 것이다. 이를 위해 많은 양의 프리미티브 뿐 아니라, 그와 관련되어 있는 추가적인 데이터 (텍스쳐) 가 그래픽스 하드웨어 내부에서 처리되어야 한다. 때문에 외부에 저장되어 있는 이런 데이터들에 대한 빈번한 억세스가 발생하게 된다. 기본적인 동작을 위해서 깊이 테스트, 색깔 혼합, 텍스쳐 맵핑 등 이 필요하게 되는데, 이는 픽셀에 대한 처리를 맡고 있는 레스터라이제이션 스테이지에서의 메모리 대역폭 향상을 가지고 온다. 이는 3차원 그래픽스 하드웨어의 성능을 결정하는데 중요한 역할을 하게 되고, 이 문제를 해결하는 것은 그래픽스 하드웨어를 설계하는데 있어서 중요한 문제가 되어왔다. 일반적인 그래픽스 하드웨어에서는 비록 해당 오브젝트가 다른 오브젝트에 의해 가려져서 실제 카메라의 위치에서는 보이지 않음에도 불구하고, 해당 오브젝트에 대한 모든 operation 을 수행해야 하는 단점이 있다. 때문에 최종화면에서는 보이지도 않을 오브젝트를 그리느라 불필요한 메모리 대역폭 과 파워가 소모된다. 이러한 문제를 해결하기 위해 제안된 방법이 occlusion culling 방법이다. 즉, 최종화면에 보이지 않게되는 오브젝트를 텍스쳐 맵핑을 하기 전에 미리 판단하여 하드웨어가 불필요하게 사용되는 것을 방지하는 방법이다. 이러한 방법에는 크게 두 가지가 있는데, 자명하게 보이는 오브젝트를 판단하는 방법(Z-Min)과 자명하게 보이지 않게 되는 오브젝트를 판단하는 방법(Z-Max)이 있다. 이 두 가지 방법으로 기존의 뒤쪽 단에서만 Z-Test를 수행하지 않고, 파이프라인의 앞쪽에서 Z-Test를 한번 더 수행하는 방법들을 Early Z-Test 라고도 한다. 본 논문에서는 기존에 제시되었던 Z-Max 방법들의 장점들만 모아, 가장 일반적이면서도 높은 성능을 나타낼 수 있는 방법을 제안하였고, 여기에 추가적으로 메모리 대역폭을 줄이기 위해 Z-Min 방법을 통합하였다. 이 방법은 높은 성능을 나타낼 수 는 있지만, 기존 연구보다 많은 메모리 사이즈를 필요로 하기 때문에 여러 자원이 제한되어 있는 임베디드 시스템에서는 사용하기가 쉽지 않다. 이를 극복하기 위해 일반적인 레스터라이져를 사용하지 않고, tile 단위로 traversing 하는 레스터라이져를 이용하여, 하나의 tile 에 대한 Early Z-Test를 수행하고 난 뒤, Early Z-Test를 하기 위한 Tile 의 세 가지 정보(Z-Max value, Z-Min value, Mask bits)를 업데이트 시킴으로써, 중간과정의 값들을 저장하고 있지 않아도 되게 하였고, 이는 이전 연구들과 비교하여 가장 작은 메모리 사이즈를 사용하여 가장 높은 성능을 낼 수 있도록 하는데 중요한 역할을 한다. 제안한 방법의 우수성을 검증하기 위해 여러 모델에 대해 시뮬레이션을 돌렸다. 특히, 상용 게임인 Quake 3의 경우, 40개의 scene을 무작위로 선택하여 시뮬레이션을 수행한 결과, 현재 제품에 사용되고 있는 hierarchical z-buffer 방법 보다는 24.8% 더 낮은 메모리 대역폭이 필요하였다. 또한 필요한 하드웨어 자원으로는 96bit register 3개와 32bit floating point comparator 2개, 그 외의 몇 개의 작은 logic gate들 뿐이었다. 추가로, 이 방법을 지원하기 위해 cache 구조도 제안하였는데, 384 Byte on-chip 메모리 만으로도 2.8% 의 miss rate을 기록하였다. 특히 384 Byte라는 메모리 사이즈는 기존에 제안되어있던 mid-texturing 방법이 동일 miss rate를 이루기 위해 16Kbyte가 필요했던 것과 비교해서 많은 양의 cache size가 줄었음을 나타낸다. 이로써, 제안한 방법은 사용 가능한 자원이 제한되어 있는 임베디드 시스템에 사용하기 적합함을 알 수 있다.

서지기타정보

서지기타정보
청구기호 {MEE 08022
형태사항 v, 64 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 김홍윤
지도교수의 영문표기 : Lee-Sup Kim
지도교수의 한글표기 : 김이섭
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학전공,
서지주기 참고문헌 : p. 47-48
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서