서지주요정보
딥러닝 기반의 음성 데이터 초해상화 = Deep learning based audio super resolution
서명 / 저자 딥러닝 기반의 음성 데이터 초해상화 = Deep learning based audio super resolution / 정상현.
발행사항 [대전 : 한국과학기술원, 2023].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8040848

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MCS 23033

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

The audio super resolution is a task that inferences audio with high sampling rate from audio with low sampling rate. In this thesis, we interpret the audio super resolution task from two perspectives: wave form regression problem and spectrogram form bandwidth extension problem, and create new deep learning structures that can reflect its characteristics and apply it to the proposed model. And based on the fact that audio super resolution task is a seq2seq problem, we propose a new structure that can implicitly explain the attention mechanism. The proposed model will be compared with existing audio super resolution models by visual comparison using spectrogram and numerical comparison using SNR and LSD.

음성 데이터 초해상화는 낮은 샘플링 레이트의 음성 데이터로부터 높은 샘플링 레이트의 음성 데이터를 추론하는 작업이다. 본 논문에서는 음성 데이터 초해상화 작업을 파동 형태의 회귀 문제와 스펙트로그램 형태의 주파수 대역폭 확장의 두 가지 관점에서 해석하여, 그 특성들을 반영할 수 있는 새로운 딥러닝 구조를 만들어 제안 모델에 적용하려고 한다. 그리고 음성 데이터 초해상화가 seq2seq 문제라는 점에서 착안하여 기존의 어텐션 메커니즘을 내재적으로 설명할 수 있는 구조를 제안한다. 제안 모델과 기존에 연구된 음성 데이터 초해상화 모델들을 스펙트로그램을 이용한 시각적 비교와 SNR 값과 LSD 값을 이용한 수치적 비교의 두 가지 방법을 통해 성능을 비교할 것이다.

서지기타정보

서지기타정보
청구기호 {MCS 23033
형태사항 iii, 20 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Sanghyun Jung
지도교수의 한글표기 : 최성희
지도교수의 영문표기 : Sunghee Choi
학위논문 학위논문(석사) - 한국과학기술원 : 전산학부,
서지주기 참고문헌 : p. 18-19
주제 기계학습
딥러닝
초해상화
오디오 업샘플링
machine learning
deep learning
super resolution
audio upsampling
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서