서지주요정보
Secure and efficient data deduplication techniques for cloud storage systems = 클라우드 스토리지 시스템에서 안전하고 효율적인 데이터 중복 제거 기법에 관한 연구
서명 / 저자 Secure and efficient data deduplication techniques for cloud storage systems = 클라우드 스토리지 시스템에서 안전하고 효율적인 데이터 중복 제거 기법에 관한 연구 / Young-Joo Shin.
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8026968

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 14024

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Data outsourcing to a cloud storage brings forth new challenges for efficient utilization of computing resources such as storage space and network bandwidth in the cloud computing infrastructure. Data deduplication refers to a technique that eliminates the redundant data on the storage and transmitting on the network, and is considered to be one of the the most-enabling storage technologies that offers efficient resource utilization in the cloud computing. However, applying data deduplication incurs security vulnerabilities in the cloud storage system so that untrusted entities including a cloud server or unauthorized users may break data confidentiality, privacy and integrity on the outsourced data. It is challenging to solve the problems of data security and privacy with respect to data deduplication, but certainly necessary for offering a mature and stable cloud storage service. In the dissertation, we study the security implications of data deduplication in the cloud computing environment. We analyze the issues of security and efficiency in various aspects, and propose novel solutions for secure and efficient data deduplication in the cloud storage system. First, we propose a secure and efficient file deduplication scheme that keeps data confidentiality from a cloud server and unauthorized users. For implementing the deduplication scheme, we construct two symmetric-key equality predicate encryption algorithms, which are cryptographic primitives in the symmetric-key setting that allow to know only equivalence relations among ciphertexts without leaking any other information about that plaintexts. By applying the constructions, the cloud server is able to perform deduplication over encrypted files without any knowledge of their content. This offers data confidentiality against the cloud server while still preserving the desired storage efficiency. In addition, the proposed deduplication scheme adopts randomized approach in hybrid manner. That is, deduplication will occur either of at server side or at client side with some probability, which is dependent on a security parameter. This randomized strategy greatly increases attack overhead of online-guessing adversaries, hence reduces the risk of information leakage on the stored data. The constructed equality predicate encryptions offer provable security, and the required data security of the proposed deduplication scheme is also strongly enforced. Second, we address a problem of information leakage through the side channel in client-side data deduplication, and discuss inefficiency and security weakness of previously proposed solutions. For satisfying the desired privacy requirements, we propose a differentially private client-side data deduplication protocol. Differential privacy is a security notion that guarantees enhanced privacy against an adversary who is capable of performing statistical analysis using sufficient computing resources. By exploiting a differential private approach, the proposed protocol strongly guarantees that it is hard for the side channel adversaries to infer the existence of individual data in the cloud storage. To implement the proposed scheme, we utilize a storage gateway, which is a network appliance server that provides access to the remote cloud storage over the Internet. In the proposed scheme, a storage gateway mainly handles user requests for data uploads and performs data deduplication on them on behalf of users. This storage gateway based approach prevents generating unnecessary network traffic, thus elevates the efficiency in terms of network bandwidth utilization, while eliminating the side channel by weakening the link between the deduplication event and the amount of actually transferred. In order to validate the effectiveness of the proposed solution, we make the analysis of security and performance, as well as some experiments. Third, we address a problem of security in a proof of storage with deduplication, which is an approach that combines proof of ownership protocol with reliable data auditing schemes in a cloud storage system. We discuss a security weakness of a previous scheme under a newly proposed attack model, in which users are allowed to manipulate their own keys. More concretely, we show that the previous scheme fails to satisfy the desired security requirements if malicious users initiate the protocol with dishonestly manipulated keys. We present a solution that mitigates such an attack and improves security by modifying the original scheme such that the user keys are blended with the random values contributed by the cloud storage server. This approach weakens the adversary`s capability to manipulate their keys. We minimize the modification, hence the proposed scheme preserves the efficiency while providing more robust security. All of the schemes that are proposed in the dissertation achieve high level of efficiency in terms of utilizing the resources of storage space and network bandwidth. These schemes have the advantage with regard to strong data security and privacy against an untrusted cloud server and unauthorized users. The proposed schemes are expected to contribute to the advance of secure deduplication techniques for cloud storage services.

클라우드 스토리지 서비스는 스토리지 저장 용량과 네트워크 대역폭 등 IT 자원을 효율적으로 사용하기 위해 대부분 데이터 중복 제거 기술을 사용하고 있다. 데이터 중복 제거 기술이란 여러 사용자가 동일한 파일을 스토리지에 아웃소싱 하게 되는 경우 물리적으로 하나의 파일을 제외하고 나머지는 논리적인 링크로 대체하는 기술을 말한다. 데이터 중복 제거 기술은 중복 제거가 일어나는 위치에 따라 서버 방식과 클라이언트 방식으로 구분할 수 있다. 서버 방식의 중복 제거는 클라우드 서버에서 중복된 파일을 찾아 제거하는 방식이며 클라이언트 방식은 클라이언트가 파일을 업로드 하기 전에 중복 여부를 탐지하여 중복을 제거한다. 클라이언트 방식의 중복 제거는 서버의 스토리지 용량을 절감할 수 있을 뿐 아니라 네트워크에서 소모되는 대역폭도 절감할 수 있는 장점이 있다. 이러한 데이터 중복 제거 기술은 디스크 저장 공간과 네트워크 대역폭을 최대 90\% 가까이 절감할 수 있는 것으로 나타났다. 따라서 IT 자원의 효율적 이용이 금전적 비용의 절감과 직결되면서 데이터 중복 제거 기술은 클라우드 스토리지 서비스 사업자에게는 반드시 필요한 기술로 받아들여지고 있다. 그러나 현재의 데이터 중복 제거 기술은 사용자의 데이터에 대해 심각한 보안 위협을 초래한다. 클라우드 서버가 사용자의 파일들에 대해 중복 여부를 판단하기 위해서는 파일이 평문 형태로 저장이 되어야한다. 각 사용자의 암호키로 암호화되어 저장된다면 중복 여부를 판단할 수 없기 때문이다. 따라서 클라우드 서버 시스템에 침투한 해커 등 외부 공격자로부터 사용자의 데이터에 대한 기밀성과 프라이버시가 전혀 보장되지 못한다. 침해 사고에 대비해 클라우드 서버가 저장 데이터에 대하여 직접 암호화를 할 수 는 있으나 역시 신뢰할 수 없는 클라우드 서버에 대하여는 사용자 데이터를 보호할 수 없다. 데이터 중복 제거 기술이 야기하는 또 다른 형태의 보안 문제도 존재한다. 최근의 연구에 따르면 클라이언트 방식의 중복 제거를 사용하는 클라우드 스토리지 서비스에서 비인가 사용자가 부 채널을 이용하여 저장된 파일의 정보를 획득할 수 있는 보안 취약점이 발견되었다. 이 취약점을 이용하면 공격자는 온라인 추측 공격을 실행하여 저장된 파일의 내용을 복구할 수 있다. 공격 방법은 간단하다. 공격자는 파일의 내용을 추측하여 후보 파일을 만들고 이를 클라우드 서버에 업로드를 요청한다. 클라우드 서버는 파일 업로드를 하기 전에 파일의 중복 여부를 판단하여 동일 파일이 존재하면 업로드를 하지 않고 요청을 처리한다. 공격자는 네트워크 전송 크기를 모니터링 하여 후보 파일이 실제로 업로드 되는지를 판단할 수 있다. 공격자는 이러한 과정을 반복하면서 서버에 저장된 파일의 내용을 알아낼 수 있다.현재의 데이터 중복 제거 기술은 위의 두 가지 보안 위협에 대하여 사용자 데이터에 대한 안전성을 전혀 보장하지 못한다. IT 자원의 효율적 활용을 가능하게 하는 동시에 사용자 데이터의 안전성을 보장하는 안전한 데이터 중복 제거 기술의 구현은 아직까지 해결하지 못한 문제로 남아있다. 본 연구는 이 문제를 다루어 효율적이면서도 안전한 데이터 중복 제거 기법을 제시한다. 첫째, 신뢰할 수 없는 클라우드 서버와 비인가 사용자들에게 저장된 데이터의 정보가 노출되는 것을 방지할 수 있는 효율적 데이터 중복 제거 기법을 제안한다. 이를 위해 대칭키 환경의 동치술어 암호 시스템을 구현하고 이에 기반한 데이터 중복 제거 프로토콜을 구현한다. 동치술어 암호란 두 암호문이 주어졌을 때 그 평문의 동치 관계를 판단할 수 있는 암호 시스템을 말한다. 이를 활용하면 클라우드 서버는 사용자가 암호화한 파일에 대해서도 중복 여부를 판단할 수 있게 된다. 또한 온라인 추측 공격으로부터 사용자의 데이터를 보호하기 위하여 하이브리드 방식의 중복 제거 방식도 제안한다. 하이브리드 방식이란 일정한 확률에 따라 클라이언트 또는 서버에서 중복 제거를 실행하는 것으로 온라인 추측 공격의 복잡도를 증가시키고 데이터의 정보가 노출될 위험을 최소화 시킬 수 있다. 둘째, 클라이언트 방식의 데이터 중복 제거 기술을 사용 시 부 채널에 의한 정보 유출 문제를 다루고 기존에 제안 된 기법들의 안전성 및 효율성 문제에 대해 논의한다. 부 채널을 방지하면서 보다 향상된 안전성 기준을 만족하기 위하여 차분적 프라이버시를 보장하는 새로운 클라이언트 데이터 중복 제거 기법을 제안한다. 차분적 프라이버시는 특정 데이터가 클라우드 서버에 존재하는지 또는 존재하지 않는 지에 대한 정보가 공격자에게 쉽게 노출되지 않는 것을 보장하는 새로운 안전성 개념이다. 본 연구에서 제안한 기법은 차분적 프라이버시 개념을 충족하면서 기존에 제안된 기법들에 비해 네트워크 대역폭 낭비가 대폭 줄어드는 장점을 가지고 있다. 셋째, 클라우드 스토리지에서 데이터 중복 제거와 소유권 증명 및 무결성 검증을 모두 제공하는 기법을 고안할 때 발생하는 보안 문제에 대해 논의 하고 안전성을 향상시키기 위한 방안을 제안한다. 구체적으로, 사용자가 자신의 비밀키를 악의적인 방법으로 생성할 수 있는 새로운 보안 모델을 제시하고, 이 보안 모델에서 기존에 제안 된 기법에 보안 취약점이 존재함을 보인다. 그리고 새로운 보안 모델에서 안전성을 보장하기 위하여 기존 기법을 개선한 방법을 제안한다. 제안한 방법은 기존의 안전성과 효율성을 그대로 유지하면서 새 보안 모델에서의 공격도 차단할 수 있는 장점을 가지고 있다. 본 연구에서 제시된 기법들은 모두 스토리지 공간과 네트워크 대역폭 활용 측면에서 효율성을 제공하는 동시에 클라우드 서버와 비인가 사용자 등 내외부 공격자들로부터 높은 수준의 데이터 기밀성과 프라이버시를 보장한다. 본 제안 방법들이 앞으로 클라우드 스토리지 시스템에서 더욱 효율적이고 안전한 데이터 중복 제거 기술이 개발되는 데 기여할 수 있을 것으로 기대한다.

서지기타정보

서지기타정보
청구기호 {DCS 14024
형태사항 vii, 86 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 신영주
지도교수의 영문표기 : Kwang-Jo Kim
지도교수의 한글표기 : 김광조
수록잡지명 : "Efficient and Secure File Data Deduplication in Cloud Storage". IEICE Transactions on Information ans Systems, v.E97-D. no.2, pp.184-197(2014)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 References : p. 76-80
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서