This paper analyzes the ‘news homogenization’ phenomenon in NAVER News, a representative news portal in Korea. It proves that news homogenization, which has been studied only with news data corresponding to a specific issue, is a common phenomenon throughout NAVER News. It also checks whether news homogenization, which was recently illuminated only at a specific social issue, has been a phenomenon that has been continuously occurring since the past. For analyzing this, this paper gathered whole news articles per day on the second Wednesday of April every year over the past 10 years, 2013-2022. To analyze large amounts of original data, up to 213485 cases, we used a machine learning model, Word2Vec, and a clustering algorithm, DBSCAN. The optimal number of clusters derived from the DBSCAN algorithm was viewed as the news topic used for news homogenization, and the number of articles belonging to the clusters was viewed as the scale of news homogenization. As a result, it was confirmed that news homogenization is a phenomenon that spreads throughout NAVER News regardless of sections and media companies. In addition, it was proved that the news homogenization phenomenon continued to exist in NAVER News from 2013 to 2022, and its size and proportion continued to increase, peaking in 2022.
본 연구는 대표적인 포털 뉴스 서비스인 '네이버 뉴스' 속 뉴스 동질화 현상을 탐색적으로 분석한다. 특정 이슈에 해당하는 뉴스 데이터로만 연구되어온 뉴스 동질화가 네이버 뉴스 서비스 전반에 걸쳐 보편적으로 일어나는 현상인지 증명한다. 또한 최근에 한정한 특정 시점에 대해서만 조명되었던 뉴스 동질화가 과거부터 지속적으로 발생해온 현상인지도 확인한다. 이를 위해 최근 10년치인 2013~2022년에 걸쳐 매년 4월 둘째주 수요일 하루 뉴스 기사 전수를 분석 데이터로 삼았다. 213485건에 이르는 대량의 원본 데이터를 분석하기 위해 기계 학습 모델인 Word2Vec과 군집화 알고리즘인 DBSCAN을 사용했다. DBSCAN 알고리즘으로 도출한 최적의 군집 수를 뉴스 동질화에 사용된 뉴스거리로 보고, 해당 군집들에 속한 기사의 수를 뉴스 동질화 현상의 규모로 봤다. 그 결과 뉴스 동질화는 섹션, 언론사를 막론하고 네이버 뉴스 서비스 전반에 걸쳐 퍼져 있는 현상임을 확인했다. 또한 2013년부터 2022년까지 뉴스 동질화 현상이 네이버 뉴스 서비스에 계속 존재해왔으며 그 규모와 비중이 계속 증가해 2022년에 정점을 찍었음을 확인했다.