Aggregation is typically an expensive operation, and temporal aggregation is particularly more so because it deals with very large data accumulated over time and has to calculate aggregate values separately for multiple time intervals. Concerned with the cost, several methods have been developed for efficient temporal aggregation. Most recently introduced is the S13-tree method, which keeps updating the aggregate values for each aggregate function every time a tuple is inserted, deleted, or updated. This brings the advantage of quick temporal aggregation. It, however, also brings the overhead of keeping the aggregates up to date, and this overhead renders the method unsuitable in an environment with frequent tuple insertions/deletions/updates. In this dissertation we propose a new method based on two-dimensional representation of time intervals. This method uses a multi-dimensional index commonly available in spatial or spatio-temporal databases and calculates temporal aggregation while reading data pages incrementally through index. The results of experiments comparing the performance with that of the the SB-tree show that our method is superior to the SB-tree in an environment with frequent updates while being comparable in the opposite environment. These results indicate usability of our method in a former type of environment. We further improve the efficiency by proposing a new buffer page replacement technique that predicts the page access order within the index and by proposing a new index page region split technique that minimizes the page access count. We demonstrate the efficacy of our methods through experiments.
일반적으로 데이타베이스 시스템에서 집계는 처리 비용이 많이 드는 연산 중의 하나이다. 시간 지원 데이타베이스에서의 집계, 즉 시간 집계는 더욱 많은 비용이 든다. 왜냐 하면 시간 지원 데이타베이스에서는 객체의 현재 상태 뿐만 아니라 과거 또는 미래의 상태까지 저장하여 관리하기 때문에 데이타베이스의 크기가 훨씬 커지고, 시점에 따라 각각 다른 집계 결과를 구해야 하기 때문이다. 지금까지 효율적인 시간 집계 처리를 위해 몇 가지 방법들이 제안되었다. 그 중에서 가장 최근에 제안된 SB-트리를 이용한 시간 집계 처리 방법은 새로운 튜플이 삽입되거나 튜플의 데이타가 갱신될 때마다 집계값을 갱신하여 저장해 놓음으로써, 시간 집계 질의를 빨리 처리할 수 있는 장점이 있다. 하지만 이 방법은 튜플들의 집계값을 항상 최신의 상태로 계산하여 유지하므로, 튜플의 삽입, 삭제 또는 갱신이 빈번하게 발생하는 환경에서는 집계값을 갱신하는 오버헤드가 커진다. 본 논문에서는 시간 구간을 이차원 상의 점으로 표현하여 시간 집계를 구하는 새로운 방법을 제안한다. 이 방법에서는 시공간 데이타베이스에서 널리 사용되는 다차원 색인을 사용하여 시간 데이타를 저장하고, 다차원 색인을 통해 데이타 페이지들을 점진적으로 읽어 가면서 시간 집계를 구한다. 또한 SB-트리와 성능을 비교한 실험 결과 제안하는 방법은 튜플의 삽입,삭제,갱신이 빈번히 발생하는 환경에서는 훨씬 우수하며, 다른 환경에서는 비슷한 성능을 가짐을 보인다. 이것은 제안하는 방법이 갱신이 빈번한 환경에 유용하게 쓰일 수 있음을 나타내고 있다. 또한 시간 집계를 처리하는 동안 접근하는 페이지의 순서를 예측하여 이를 버퍼 대체 전략에 적용한 순서 기준(order-based) 버퍼 페이지 대체 알고리즘과 다차원 색인의 페이지 접근 횟수를 줄이기 위한 페이지 분할 알고리즘을 제안함으로써 성능을 더욱 향상시키고 있다. 실험을 통하여 제안한 방법들의 유효성을 입증한다.