The generative models have made remarkable progress in various domains such as vision, natural language, and time-series. In particular, they have achieved significant results in domains traditionally associated with human creativity, such as literature, art, and music. As a result of these recent advancements, there is increasing interest in the creative generation capabilities and limitations of generative models. Since creativity is closely tied to problem-solving abilities, systematic and in-depth research on AI creativity is essential for enhancing the scalability and practical applicability of AI technologies in the future. However, research on computationally evaluating the creativity of the outputs of generative models or strengthening creative generation is still in its early stages. Existing studies have discussed various definitions of creativity, but there is general consensus that a creative output must possess both novelty and value. While methods for evaluating the “value” of generated outputs of generative models in image domain have been actively researched, studies focusing on the quantitative evaluation of “novelty” are relatively scarce.
This study proposes a novel evaluation method, the Rarity Score, to quantitatively assess the novelty of generative model outputs while accounting for their quality, and explores a method to enhance creative generation without additional training. By extending existing k-nearest neighbor (k-NN)-based evaluation methods, we have designed a way to quantify how uncommon the generated images are within the distribution of training data. The proposed Rarity Score was experimentally tested on various datasets and models, and its high alignment with human recognition was demonstrated through user studies.
Furthermore, this study presents a method to enhance creative generation by adjusting the internal representations (feature maps) of generative models. Notably, when selectively amplifying the feature maps of shallow layers, we experimentally confirmed an improvement in novelty. This approach can be easily applied to existing models without additional fine-tuning, offering the potential for use in various creative applications.
This research advances the study of AI creativity through a systematic approach to evaluating and enhancing the novelty of generative models, laying the groundwork for future expansion into creative problem-solving and collaborative creation between humans and AI.
생성모델은 최근 시각데이터, 자연어데이터, 시계열 데이터 등 다양한 분야에서 비약적인 생성 성능의 향상을 이루었다. 특히, 인간의 산물이라고 여겨졌던 창의성을 요구하는 분야인 문학, 예술, 음악 분야에서도 괄목할만 한 성과를 이루고 있다. 이러한 최근의 발전에 따라, 생성 모델의 창의적 생성 능력과 그 한계에 대한 관심이 점차 증대되고 있다. 특히, 창의성은 창의적 문제 해결 능력과 밀접하게 연결되어 있기 때문에, 인공지능의 창의성에 대한 체계적이고 심층적인 연구는 향후 인공지능 기술의 확장성과 실질적 활용 가능성을 높이는 데 필수적이다. 그러나 생성모델의 산출물에 대한 창의성을 전산적으로 평가하거나 창의적 생성을 강화하는 연구 아직 초기 단계에 머물러 있다. 기존 연구들에서는 창의성의 정의에 대해 다양한 논의가 있었으나, 창의적 산출물이란 참신함(novelty)과 가치(usability 또는 value)를 동시에 갖추어야 한다는 데에는 대체로 합의하고 있다. 이미지 생성 모델에서는 산출물의 “가치”를 평가하는 방법은 활발히 연구되어 온 반면, “참신성"을 정량적으로 평가하는 연구는 상대적으로 부족하다.
본 연구는 생성 모델의 산출물에 대해 가치를 고려하면서도 참신성을 정량적으로 평가할 수 있는 새로운 평가방법인 Rarity Score를 제안하고, 추가적 학습 없이 생성 모델의 창의적 산출을 강화하는 방법을 연구하였다.
기존의 k-최근접 이웃(k-NN) 기반 평가 방법을 확장하여, 생성된 이미지가 기존 데이터 분포 내에서 얼마나 독창적인지를 정량화할 수 있도록 설계하였다. 제안된 Rarity Score는 다양한 데이터셋과 모델에 대해 실험되었으며, 사용자 연구를 통해 인간 인식과의 높은 일치도를 입증하였다.
아울러, 본 연구는 생성 모델의 내부 표현(feature map)을 조정하여 창의적 산출을 강화하는 방법을 제시하였다. 특히 얕은 층(shallow layer)의 특징맵을 선택적으로 증폭할 경우 참신성이 향상됨을 실험적으로 확인하였다. 이러한 방법론은 추가 학습(fine-tuning) 없이 기존 모델에 쉽게 적용할 수 있어, 다양한 창의적 응용 분야에 활용 가능성을 제시한다.
본 연구는 생성 모델의 참신성 평가 및 강화에 대한 체계적 접근을 통해 인공지능의 창의성 연구를 한 단계 발전시키고, 향후 창의적 문제 해결 및 인간과 인공지능의 협력적 창작 분야로의 확장을 위한 기반을 마련하였다.