서지주요정보
편향분포 데이터를 위한 카운팅 벡터몫 필터 설계 = Designing counting vector quotient filter for skewed data
서명 / 저자 편향분포 데이터를 위한 카운팅 벡터몫 필터 설계 = Designing counting vector quotient filter for skewed data / 황채영.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8042166

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 24054

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Filters are data structures that probabilistically represents the presence of items within a given set. Filters, using less space compared to storing all elements, thus resides in memory and reduces unnecessary I/O operations to the secondary storage. Well-known filters such as Bloom filters, Quotient filters, and Vector Quotient filters have the drawback of experiencing memory overhead when dealing with datasets skewed distributions. This paper analyzes the shortcomings of Vector Quotient filters with skewed datasets. Then we introduce Counting Vector Quotient Filter, which solves this problem by applying a counting algorithm and filter size adjustment algorithm to the Vector Quotient Filter. This paper evaluate the performance of Counting Vector Quotient Filter in terms of operations per second on insertion, lookup, and deletion operations for datasets with skewed datasets.

필터는 주어진 집합 내에 원소의 존재 유무를 확률적으로 나타내는 자료구조이다. 필터는 모든 원소를 저장하는 것에 비해 적은 공간을 사용하기에 메모리 내에 상주하며 불필요한 입출력을 줄인다. 제안된 대표적인 필터들인 블룸 필터, 몫 필터, 벡터 몫 필터 등은 불균형 분포의 데이터셋에 대해서는 메모리 오버헤드가 발생한다는 문제점을 가지고 있다. 본 논문은 불균형 분포의 데이터셋에서 벡터 몫 필터의 문제점을 분석하고 카운팅 기법과 필터 크기 조절 알고리즘을 도입함으로써 이를 해결한다. 불균형 분포의 데이터셋에 대해서 카운팅 필터들간의 초당 연산량을 비교하여 삽입, 검색, 삭제 연산에서 모두 높은 성능을 보임을 확인한다.

서지기타정보

서지기타정보
청구기호 {MEE 24054
형태사항 iv, 54 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Chaeyoung Hwang
지도교수의 한글표기 : 원유집
지도교수의 영문표기 : Youjip Won
부록 수록
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 참고문헌 : p. 49-53
주제 확률형 자료구조
빈도 추정
공간 효율성
편향 분포 데이터셋
Probabilistic data structure
Frequency estimation
Space efficiency
Skewed dataset
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서