In a movie, the story and the media are subordinate to each other; the story and images interact to form a narrative that is delivered to the audience, which has been central to the tradition in film criticism. This necessitates an integrated research on image representation and narrative. In this work, we study the quantitative difference between screenplay per se and the video using network analysis to highlight the translation process, since the relationships between characters form the central feature of the narrative. The two graphs showed a clear difference, so further investigation was implemented to clarify the cause of the difference using shot scale and facial expression data. We employ natural language processing and machine learning techniques for face recognition to do so. The results show the elaborate process by which a character is emphasized via image craft.
영화 데이터에 대해 기존에는 문학 텍스트와 같이 대본을 기반으로 한 의미적 분석과 영화의 멀티모달 데이터를 중심으로 한 패턴 분석이 각기 연구되어 왔다. 하지만 영화에서의 내러티브와 이를 매개하는 영상이나 음성은 한쪽이 다른 한쪽을 위해 종사하는 관계가 아니라 두 가지가 통합되어 제작자의 의도를 관객에게 전달하여 특정한 생각이나 감정을 일으키는 것으로 보아야 한다. 따라서 이번 연구에서는 네트워크 방법론을 사용하여 영화 대본이 영상화될 때 일어나는 차이에 대해 규명하고 제한된 시간 안에 가장 효과적으로 의도를 전달하기 위한 카메라 연출이나 감정 연기의 패턴을 분석한다. 구체적으로는 영화의 대본과 이미지에서의 캐릭터의 동시 등장을 연결 기준으로 삼은 네트워크에서 각 캐릭터의 역할의 차이를 커뮤니티 탐지 기법으로 비교한다. 그리고 네트워크에서의 중심성이 딥러닝이 네트워크를 통해 화면에서 감지한 인물의 얼굴 크기와 어떤 관계를 가지는지에 대한 상관분석을 진행한 후, 캐릭터를 구성하는 감정의 복잡도를 표정 인식 네트워크를 통해 밝혀 캐릭터의 역할에 따른 차이가 있는지 살펴본다.