서지주요정보
벡터 몫 필터 내에 불균형 데이터를 삽입하기 위한 카운팅 기법 = Counting methods for skewed data insertion in vector quotient filter
서명 / 저자 벡터 몫 필터 내에 불균형 데이터를 삽입하기 위한 카운팅 기법 = Counting methods for skewed data insertion in vector quotient filter / 김용진.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8039851

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 22120

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Filter, also known as Approximate Membership Query, is a data structure that approximately represents whether an element belongs to a set. Compared to dictionary, which stores all data, filters use much less space and therefore is able to fit in memory. Using filter can decrease the amount of unnecessary queries and this benefits performance in various fields including distributed storage, network, machine learning and computational biology. Some famous filters are bloom filter, cuckoo filter, morton filter and quotient filter. Vector quotient filter has superior insertion throughput above all others due to its architectural optimizations. This paper focus on the issue that rise when skewed data is inserted to vector quotient filter, a variant of quotient filter. The issue can solved by implementing counter. Implementation of counter inside vector quotient filter is described and the benefits and overhead of implementing counter are assessed.

필터는 주어진 집합 내에 특정 원소가 존재하는지 확률적으로 나타내는 자료구조이다. 필터는 모든 원소를 저장하는 것에 비해 적은 공간을 사용하기에 메모리 내에 상주할 수 있다. 필터를 사용하면 원소 검색 시 불필요한 입출력을 줄일 수 있어 성능상의 이점을 얻을 수 있다. 필터의 종류로는 블룸 필터, 쿠쿠 필터, 모턴 필터, 몫 필터 등이 있다. 본 논문은 몫 필터에서 파생된 벡터 몫 필터 자료구조에 대해 고찰하고 원소 삽입 시 발생할 수 있는 문제를 카운팅 기법을 적용해 해결한다. 이후 카운팅 기법으로 절약할 수 있는 공간에 대해 분석하고 오버헤드를 측정한다.

서지기타정보

서지기타정보
청구기호 {MEE 22120
형태사항 v, 48 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Yong-Jin Kim
지도교수의 한글표기 : 원유집
지도교수의 영문표기 : Youjip Won
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 참고문헌 : p. 44-48
주제 Probabilistic Data Structure
Frequency Estimation
Space Efficiency
False Positive Rate
확률형 자료구조
빈도 추정
공간 효율성
위양성 확률
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서