In this paper, we provide a quantitative, computational analysis of the evolution of the poems of Seo Jeong-Ju (1915–2000), Korea’s eminent 20th-century. The publications of his books of poems are un- derstood to have marked the evolution of his poetry, which we explore in this work using modern data-processing techniques for capturing his changing compositional styles. First, we focus on the words related to colour and the names of Korea’s historical kingdoms conjectured as forming the identity of Seo’s poetry in past qualitative studies. We count the frequencies of twelve colours and eight historical Kingdoms and see how they change over time that point to the trends in Seo’s compositional style. We also analyse his poetry using the tools of computational linguistics. Topic Modeling refers to a set of methods that discover groups of important words appearing together in a text and allow us to identify its topic. We cross-reference the topics with other poets’ and critics’ writings from the era. Sentiment Analysis refers to determining the positivity or negativity of the sentiment of a given text. the emotional air of a work is naturally aroused by the artist’s creative choices reflecting their thoughts or feeling. In addition, by using a general level of positive or negative language in creation, the writer can express his or her intention. The evolution in the sentiment of poems, therefore, could also indicate a meaningful characteristic of the works. Existing classical studies on him have focusing on only a limited set of materials and periods. Our work showcases the ability of modern computational tools to verify the findings from traditional studies, and propose questions.
본 논문에서는 한국의 저명한 시인인 서정주(1915-2000)의 어휘 사용 변화에 대한 양적, 전산적 분석을 제공한다. 출간된 그의 시집은 그의 시세계의 변화를 보여준 것으로 이해되며, 우리는 그의 변화하는 창작 스타일을 포착하기 위해 현대 데이터 처리 기술을 사용하여 탐구한다. 먼저, 우리는 기존의 질적 연구에서 서정주의 시적 정체성을 형성하고 있다고 추측하는, 색채와 관련된 단어들과 한반도에 존재했던 역사적 국가들의 이름에 초점을 맞춘다. 우리는 시집에서 나타난 열두 가지 색깔들과 여덟 개의 역사적 왕국들의 빈도를 바탕으로, 서정주의 창작 스타일의 경향을 가리키는 그것들이 시간이 지남에 따라 어떻게 변화하는지 파악한다. 또한, 우리는 계산 언어학의 도구를 사용하여 그의 시를 분석한다. 토픽 모델링은 텍스트에 함께 나타나는 중요한 단어 그룹을 발견하고 주제를 식별할 수 있도록 하는 일련의 방법을 말한다. 이러한 주제 분석으로 얻은 결과들은 다른 비평가들의 글들과 상호 참조된다. 마지막으로 수행된 감성 분석은 주어진 텍스트의 긍정어 혹은 부정어 사용 정도를 분석하는 것을 말한다. 작품의 감정적인 분위기는 그들의 생각 이나 느낌을 반영하는 예술가의 창조적인 선택에 의해 자연스럽게 자극된다. 또한, 일반적인 수준의 긍부정 언어를 창작에 사용함으로써 작가가 본인의 의도를 표출할 수 있다. 그러므로, 시에 사용된 감성어의 변화는 작품의 의미있는 특징을 포착할 수 있다. 서정주에 대한 고전적인 문학 연구는 제한된 자료와 특정 기간에만 초점을 맞추고 있다. 이와는 달리, 우리의 연구는 전통적인 연구의 결과를 검증하고 질문을 제안하는 현대 컴퓨터 도구의 능력을 보여준다.