서지주요정보
Exploitation of versions for handling updates to shared data = 공유 데이터의 갱신을 처리하기 위한 버전의 활용
서명 / 저자 Exploitation of versions for handling updates to shared data = 공유 데이터의 갱신을 처리하기 위한 버전의 활용 / Heum-Geun Kang.
저자명 Kang, Heum-Geun ; 강흠근
발행사항 [대전 : 한국과학기술원, 2004].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8015883

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 04021

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

A multi-version concurrency control mechanism increases the degree of concurrency between transactions by maintaining multiple versions of data items. This thesis presents studies on using multi-version concurrency control mechanisms to control the consistency of cached data in a client-server database management system environment and to maintain a data warehouse while queries are performed on the data warehouse. The efficiency of algorithms managing data caches has a major impact on the performance of systems that utilize client-side data caching. In these systems, two versions of data can be maintained without additional overhead by exploiting the replication of data in the server's buffer and clients' caches. In this thesis, we study the performance implications of versions in these systems. For this purpose, we present a new concurrency control scheme employing versions and a new cache consistency algorithm based on the scheme: Two Version-Callback Locking (2VCBL). We present simulation results that compare 2V-CBL with a leading cache consistency algorithm, Asynchronous Avoidance-based Cache Consistency (AACC). Our experimental results indicate that exploiting versions improves the performance of the systems utilizing client side data caching. 2V-CBL is shown to provide good performance, particularly outperforms AACC when some clients run only read-only transactions. A data warehouse is an integrated database whose data is collected from several data sources, and supports on-line analytical processing (OLAP). Typically, a query to the data warehouse tends to be complex and involves a large volume of data. To keep the data at the warehouse consistent with the source data, changes to the data sources should be propagated to the data warehouse periodically. Because the propagation of the changes (maintenance) is batch processing, it takes long time. Since both query transactions and maintenance transactions are long and involve large volumes of data, traditional concurrency control mechanisms such as two-phase locking are not adequate for a data warehouse environment. We propose a multi-version concurrency control mechanism suited for data warehouses which use multi-dimensional OLAP (MOLAP) servers. We call the mechanism multiversion concurrency control for data warehouses (MVCC-DW). To our knowledge, our work is the first attempt to exploit versions for online data warehouse maintenance in a MOLAP environment. MVCC-DW guarantees the serializability of concurrent transactions. Transactions running under the mechanism do not block each other and do not need to place locks.

다중버전 동시성 제어 기법은 하나의 데이터에 대해 여러 버전의 값을 저장하여 트랜잭션(transaction)들의 동시성을 높인다. 본 논문은, 클라이언트-서버 데이터베이스 관리 시스템 환경에서 클라이언트의 캐쉬에 저장된 데이터의 일관성을 유지하기 위해서 다중버전 기법을 사용하는 것에 대한 연구와 On-Line Analytical Processing (OLAP) 환경에서 다중버전 기법을 사용하여 질의가 처리되고 있는 동안 데이터 웨어하우스(Data Warehouse)의 유지보수가 가능하도록 하는 연구를 소개한다. 데이터 캐쉬를 관리하는 알고리즘의 성능은 클라이언트에 데이터를 저장하는 캐쉬가 있는 시스템의 성능에 큰 영향을 준다. 클라이언트에 데이터를 저장하는 캐쉬가 있는 시스템에서는 하나의 데이터가 서버의 버퍼와 클라이언트의 캐쉬에 중복 저장될 수 있다. 이러한 특징을 이용하면 추가로 공간을 사용하지 않고도, 하나의 데이터에 대해 두 버전의 값을 저장 관리할 수 있다. 본 논문에서는 다중 버전 동시성 기법을 활용하는 캐쉬 동시성 알고리즘인 Two Version-Callback Locking (2V-CBL)을 제안하여 다중 버전 기법이 클라이언트에 데이터 캐쉬가 있는 시스템의 성능에 어떤 영향을 주는지 연구하였다. 우리는 시뮬레이션을 통하여 본 논문에서 제안하고 있는 2V-CBL과 기존의 연구된 알고리즘들 중에서 가장 앞선 AACC와 성능을 비교하였다. 실험 결과에 의하면 2V-CBL이 AACC보다 다양한 환경에서 높은 성능을 보이며, 특히 일부의 클라이언트가 읽기 전용 트랜잭션만을 처리하는 경우에는 AACC보다 월등한 성능을 보였다. 데이터 웨어하우스는 여러 곳에 있는 원본 데이터(source data)를 취합하여 저장하는 데이터베이스로 OLAP을 지원하다. 보통 데이터 웨어하우스에서 행해지는 질의는 많은 데이터를 사용하여 복잡한 처리를 한다. 데이터 웨어하우스의 데이터들이 원본 데이터들과 일관성이 유지되도록 하기 위해서 원본 데이터에서의 변경을 주기적으로 데이터 웨어하우스에 반영한다. 이러한 데이터 웨어하우스의 변경은 일괄 작업이기 때문에 많은 시간이 걸린다. 질의 트랜잭션과 변경 트랜잭션 모두 많은 데이터를 오랜 시간 동안 처리하기 때문에 잠금같은 기존의 동시성 방법은 데이터 웨어하우스 환경에 적합하지 않다. 본 논문에서는 MOLAP(Multi-dimensional OLAP) 서버가 관리하는 데이터 웨어하우스 환경에 적합한 다중 버전 동시성 방법인 MultiVersion Concurrency Control for Data Warehouse (MVCC-DW)를 제안한다. 본 눈문의 연구는 처음으로 MOLAP 환경에서의 데이터 웨어하우스 유지보수를 위해서 다중 버전 기법을 도입하였다. MVCC-DW는 트랜잭션들의 직렬성을 보장한다. 또한, 트랜잭션들은 다른 트랜잭션으로 인해 지연되지 않으며 실행 중 잠금을 설정할 필요도 없다.

서지기타정보

서지기타정보
청구기호 {DCS 04021
형태사항 ix, 98 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 강흠근
지도교수의 영문표기 : Chin-Wan Chung
지도교수의 한글표기 : 정진완
학위논문 학위논문(박사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 92-98
주제 MULTI-VERSION CONCURRENCY CONTROL
TRANSACTION
OLAP
CLIENT-SERVER
다중버전 동시성 제어
트랜잭션
온라인 분석 처리
클라이언트-서버
QR CODE qr code