This research aims on investigating the cues of comment profanity. The facial salience level in the thumbnail image is especially a key concern of the paper, and hence, CNN based face recognition algorithm was applied to measure the facial salience of the image. Also, manually designed NLP algorithm, robust to noisy online user-generated text was used to determine the swearing level of comments with accuracy of 91.91%. By analyzing the massive online dataset from the web portal of South Korea, we found out that the ratio of faces in thumbnail image is negatively correlated with the average profanity score of comments in general. Depending on whether it is partisan news or not, however, the direction of its impact varied. For partisan news articles, the salient facial images succeeded in regulating harmful comments. On the other hand, it rather increased profanity comments in the case of non-partisan news including national security issues, Thus, this paper argues that facial cue of the media content could take a role as a catalyst for prosocial linguistic behavior in online space.
본 연구는 댓글의 욕설에 영향을 주는 요인을 분석하는 것을 목표로 한다. 썸네일 이미지에서 얼굴이 포함된 정도는 본 연구에서 탐구하고자 하는 핵심 독립 변수이며, 이를 계산하기 위해 CNN 기반의 얼굴 인식 알고리즘을 활용하였다. 또한 변형이 자유로운 인터넷 댓글 욕설을 잘 포착하기 위해, 한글 자모를 분리한 후 BPE-FastText-CNN을 적용해 연산 시간이 빠르면서도 91.91%의 높은 정확도를 갖는 알고리즘을 직접 개발하였다. 온라인 포털 정치 뉴스의 4천 8백여개 기사의 약 120만개 댓글에 대해 분석을 실시한 결과, 일반적으로 기사에 사용된 썸네일 사진에서 얼굴의 비중이 높을수록 해당 기사의 평균적인 욕설 비중은 감소함을 확인할 수 있었다. 이러한 양상은 진보/보수 정당 및 정치인 관련 뉴스에 대해서는 여전히 유효하게 나타났으나 북한/안보 이슈 및 중립적인 사안에 대해서는 오히려 역의 관계가 관찰되었다. 이러한 일련의 현상들을 이해하기 위해서는 귀인이론(attribution theory) 및 ‘감시하는 눈’효과 (watching eye effect)와 같은 사회심리학적 개념들이 도움이 될 수 있을 것이다.