서지주요정보
Software-hardware co-designed similarity search engine for online image-text retrieval system = 온라인 이미지-텍스트 검색 시스템을 위한 소프트웨어-하드웨어 공동 설계를 통한 유사성 검색 엔진
서명 / 저자 Software-hardware co-designed similarity search engine for online image-text retrieval system = 온라인 이미지-텍스트 검색 시스템을 위한 소프트웨어-하드웨어 공동 설계를 통한 유사성 검색 엔진 / Yeo-Reum Park.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8038789

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MEE 22044

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Thanks to enhancing image-text retrieval(ITR) application based on cross-modal retrieval, the application's latency is reduced by extracting feature embeddings of image and text offline. However, due to the similarity search that is the application's bottleneck, it is still not feasible to service online ITR according to our analysis of ITR workloads on GPU. In this paper, we propose a novel software-hardware design to accelerate the similarity search and implement it on a Xilinx Alveo U280 card. We reduce the dataset by 92.4% through quantizing embedding dataset from 32-bit floating point to 8-bit fixed point and reconstructing sparse text embedding matrices to be dense. Our reconstructed dataset searching algorithm is implemented as a 4-stage pipeline and leverages our custom dataflow, which minimizes off-chip data transfer. We achieve up to 214.5x and 8.3x faster and up to 264.2x and 41.7x more energy-efficient than the baseline and optimized GPU design, respectively, on the MS-COCO 5K dataset.

교차 모달 검색을 기반으로 한 이미지-텍스트 검색(ITR) 애플리케이션의 발전으로 오프라인에서 이미지 및 텍스트 특징 임베딩을 추출하여 애플리케이션의 지연시간이 줄어들었다. 그러나 ITR 어플리케이션의 병목 구간인 유사성 검색으로 인해 GPU에서의 ITR 워크로드 분석에 따르면 온라인 ITR 서비스는 여전히 불가능합니다. 이 논문에서 우리는 이 유사성 검색을 가속하고 Xilinx Alveo U280 카드에 구현하기 위한 새로운 소프트웨어-하드웨어 설계를 제안한다. 임베딩 데이터 세트를 32bit 부동소수점에서 8bit 고정소수점으로 정량화하고 희소 텍스트 임베딩 행렬을 밀집 행렬로 재구성하여 해당 데이터 세트의 크기를 92.4%만큼 줄였다. 또한 재구성된 데이터 세트에 대한 검색 알고리즘은 오프칩 데이터 전송을 최소화하는 맞춤형 데이터 플로우를 활용하며 4단계 파이프라인으로 구현된다. 이를 통해 우리는 MS-COCO 5K 데이터 세트에 대해 기준 및 최적화된 GPU 기반 설계보다 각각 최대 214.5배 및 8.3배 더 빠르고 최대 264.2배 및 41.7배 더 에너지 효율적인 설계를 할 수 있다.

서지기타정보

서지기타정보
청구기호 {MEE 22044
형태사항 iv, 25 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 박여름
지도교수의 영문표기 : Joo-Young Kim
지도교수의 한글표기 : 김주영
학위논문 학위논문(석사) - 한국과학기술원 : 전기및전자공학부,
서지주기 References : p. 22-23
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서