For preventing exposure of youth to explicit contents, in Korea, there is explicit lyrics deliberation system. In this research, we study automated explicit contents classification model. Based on analyzation of explicit lyrics, we propose the new method for selecting explicit words. For classifying the two group of explicit lyrics; 'lyrics contain explicit word' and 'lyric contain explicit contents metaphorically', we propose hybrid explicit contents classification model which is based on dictionary based filtering model and Hierarchical Attention Networks.
우리나라에서는 청소년의 유해매체 노출을 줄이기 위해 청소년 유해음반 심의가 이루어진다. 본 학위논문에서는 유해음반 심의 자동화를 위한 유해가사 분류 모델에 대해 연구한다. 본 학위 논문에서는 유해가사의 특징을 분석하고, 유해단어 어휘목록 자동 생성을 위한 기법를 제안한다. 유해가사의 두 종류인 '유해단어가 등장하는 가사'와 '맥락적으로 유해한 내용을 담고 있는 가사'를 분류하기 위하여 복수 사전 기반 필터링과 Hierarchical Attention Networks 모델을 합친 하이브리드 유해가사 분류 모델을 제안한다.