With the increasing popularity of World Wide Web, network traffic due to HTTP requests and responses has dramatically increased. World Wide Web proxies are used to reduce user-perceived latency and wide-area network traffic by caching the frequently accessed Web objects. But, It is said that the bottleneck of Web proxy cache server is disk I/O in recent researches. It grows user-perceived latency significantly.
In general, proxy is running on a UNIX file system that has different disk I/O workload characteristics than those of proxies. It does slow down the performance of proxies. In this paper we study the problems of caching web objects on disk, and suggest a Dynamic Contents Clustering for disk I/O enhancement, which preserves locality of the HTTP requests by translating it into spatial locality in disk space. It reduces seek and rotation delay of disk I/O by increasing the unit of disk I/O. Additionally we use BUDDY disk layout system in a file for reduction in file meta-data management overhead and an easy disk space allocation for the cluster of Web contents. We evaluate the performance of our approach by the mix of trace-driven simulation and experimental evaluation. And, we compare our approach with SQUID proxy server, the most popular caching proxy within the public domain, and a previous work that use BUDDY file management scheme for disk I/O enhancement because our approach is an enhanced version of this previous work.
인터넷의 사용이 늘어남에 따라 HTTP에 의한 트래픽이 많이 늘어났다. 프락시 서버는 자주 사용되는 객체를 저장함으로써 불필요한 트랙픽 발생 억제와 사용자에게 보다 빠른 서비스를 해주는 서버이다. 그러나 최근 연구 결과에 의하면 프락시 서버에서 디스크 입출력이 병목이 된다고 한다. 결과적으로 사용자가 겪는 시간지연이 많이 늘어나게 된다.
일반적으로 프락시 서버는 일반적이 유닉스 파일 시스템 위에서 동작한다. 그러나 유닉스 파일 시스템의 로드 특징은 프락시 서버의 특징과 다르다. 따라서 프락시 서버의 성능을 저하시키는 역할을 한다 그래서 이 논문에서는 웹 객체를 디스크에 저장하는데 있어서 문제점을 살펴보고 Dynamic Contents Clustering이라는 방법을 제시한다. 이것은 HTTP 요청의 Locality를 디스크상의 공간상의 Locality로써 보존한다. 그리고 이것은 디스크 입출력 단위를 크게 함으로써 디스크의 Seek과 Rotation에 의한 지연을 줄여준다. 게다가 BUDDY Disk Layout System를 사용함으로써 파일의 meta-data를 관리하는 문제점을 해결하고 웹 문서의 클러스터를 위한 디스크의 빈 공간 할당을 쉽게 해 준다. Dynamic Contents Clustering의 성능을 측정하기 위해서 프락시 트레이스를 통한 시뮬레이션과 파일시스템으로의 직접적인 실험을 병행하였다.
그리고 가장 잘 알려진 프락시 서버인 Squid와 기존의 작업인 BUDDY와 비교하였다