서지주요정보
(A) study on constructing dictionary for Korean hate speech classification : focusing on online news comments = 한글 혐오 발언 분류를 위한 사전 구축 연구 : 온라인 뉴스 댓글을 중심으로
서명 / 저자 (A) study on constructing dictionary for Korean hate speech classification : focusing on online news comments = 한글 혐오 발언 분류를 위한 사전 구축 연구 : 온라인 뉴스 댓글을 중심으로 / Seungche Kang.
발행사항 [대전 : 한국과학기술원, 2018].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8032850

소장위치/청구기호

학술문화관(문화관) 보존서고

MGCT 18013

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

As more people turn online for news, there are more opportunities and a wider platform to share unregulated comments, which may lead to more instances of personal attacks and verbal abuse. Our study aims to classify hate speech in news comments and construct a dictionary of Korean hate speech. We used comments from daily ranking news in four sections of the news portal. We build a Korean hate speech dictionary that uses a word embedding technique, and we implement the classification of hate speech through various machine learning algorithms comparison. Then we present the optimal model by comparing bag-of-words and dictionary based methods. The results of this study can be used as a fundamental study for identifying Korean hate speech.

지난 온라인 상 뉴스 소비가 증가하면서 뉴스 포털 내 정제되지 않은 다양한 댓글들이 공유되며 인신 공격 및 욕설과 같은 혐오성 발언이 문제가 되고 있다. 이 연구는 뉴스 댓글 내의 혐오 발언을 분류하고, 한글 혐오 발언 연구에 활용될 수 있는 혐오 발언 사전을 구축하는 것을 목표로 한다. 뉴스 포털 내 네 가지 섹션의 랭킹 뉴스에 등장하는 댓글 데이터를 활용했다. 다양한 기계 학습 기반의 분류 성능 비교를 통해 혐오 발언 분류를 시행하고, 단어 임베딩을 통해 구축한 한글 혐오 발언 사전을 기반으로 한 사전 기반 분류를 통해 최적의 모델을 제시한다. 이 연구의 결과는 한글 혐오 발언 분석 및 탐지를 위한 기반 연구로써 활용 될 수 있다.

서지기타정보

서지기타정보
청구기호 {MGCT 18013
형태사항 iii, 23 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 영문표기 : Seungche Kang
저자명의 국문표기 : 강승체
지도교수의 영문표기 : Wonjae Lee
지도교수의 국문표기 : 이원재
공동지도교수의 영문표기 : Meeyoung Cha
공동지도교수의 국문표기 : 차미영
학위논문 학위논문(석사) - 한국과학기술원 : 문화기술대학원,
서지주기 References : p. 21-23
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서