According to the ‘revealed preference’ and the ‘expected utility theory’, preference can be observed by choice and is invariant across context; thus individuals have been considered to choose the optimal option and make rational choices. However, recent evidence, which opposes this classical concept of preference, shows that choices do not always reflect preference, such as in the status quo bias, and that choices change depending on the description of the problem, leading to suboptimal choices and thereby resulting in irrationality. Herein, we investigated preference-based decision-making in rats. We observed choice behavior based on the rats’ own subjective preference between different flavored foods or different amounts of food by applying the framing effect. Thus, we monitored the macroscopic behavior of decision dynamics and preference changes when the alternatives were framed.
In the first study, we measured choices among 4 different flavored pellets during a long-term period to mimic choice dynamics in real life. We analyzed temporal and sequential components in choice patterns with a distribution analysis to find the governing role within those patterns. We found the temporal and sequential choice components that respectively reflect the “wanting” and “liking” attributes of preference followed heavy-tailed distribution in which extreme observations were discovered far more frequently than in randomly arising systems. Temporal dynamics were modeled by cascading non-human Poisson processes and sequential dynamics were explained by dual evaluation processes consisting of goal-directed and habit systems. This study provides evidence for a universal bursting property of animal behavior in both timing and sequential choices.
In the next study, we examined the role of the nucleus accumbens (NAc), known to participate in hedonic responses and reward process in choice dynamics. First, we damaged the NAc shell by electrolytic lesions, and next we downregulated dopamine in the NAc shell by the injection of lentivirus vectors to knockdown the dopamine D2 receptor (DRD2). Our data revealed that the lesion in the NAc particularly affected the sequential choice dynamics by increasing the mean length of run, which refers a series of consecutive same choice. Simple choice pattern and biased choice to the most preferred pellets were found in NAc lesioned rats but not in the DRD2 KD subjects. These results snotnotnotnotuggest that the NAc shell is one of the candidates that affect choice dynamics by modulating preference and reward processing.
In our third study, loss aversion and reference dependence, which were found in humans and apes, were explored in rats. We modified the conventional T-maze to develop a reference point in rats. Similarly to monkeys, rats avoided alternatives that were framed as loss. This was the first study that found loss aversion and reference dependence in rats. Our findings are important because they confirm that biased preference, including loss aversion and reference dependence, is evolutionarily conserved from rat to human. Furthermore, this study will contribute the understanding of the neuronal processes of biased preference in methodologically view.
These current studies will provide a better understanding of choice and preference by revealing dynamic structure and its relationship with the NAc shell in repeated choices, and confirming the possibility of the evolutionary preservation of biased preference.
현시선호이론(revealed preference)과 기대효용 이론(Expected utility theory)에 따르면 선택을 통해 선호가 드러나며 이러한 선호는 상황에 따라 변하니 않으며 개체는 최상의 선택을 한다는 것을 가정한다. 하지만, 많은 연구들이 이와 반대되는 증거를 보여주는데, 예를 들어 현상유지편향(status quo bias) 같은 경우 항상 선호되는 것이 선택되는 것은 아니라는 것을 보여주며, 또한 선호는 문제제시 방법에 따라 변하여 사람들을 종종 최상의 선택이 아닌 비이성적인 선택을 하도록 한다.
본 연구에서는 쥐에서 선호에 기반한 선택과정을 조사하였다. 쥐의 내재적 선호에 기반하여 서로 다른 맛을 가진 음식에서와 프레임효과를 적용한 서로 다른 양의 보상간에서의 선택을 살펴보았다. 따라서 선택행동의 동역학을 거시적인 관점에서 살펴보았으며 이와 관련된 뇌영역과의 연관관계에 대해서 알아보고, 선호가 맥락 혹은 서술되는 형식에 따라 어떻게 변화되는지 알아보았다.
첫 번째 실험에서는 정상적인 쥐에서 일상에서 일어나는 선택을 모방하기 위해 영양적으로는 동일하지만 4가지 서로 다른 향(flavor)을 가지는 펠렛의 선택을 오랜 기간(long-term)동안 측정하였다. 선택의 시간적(temporal) 특성과 순차적(sequential) 특성의 선택패턴에 내재되어 있는 구조적 특성을 파악하기 위해 분포 분석을 실시하였다. 그 결과 선택에서 각각 선호의 원함(wanting)과 좋아함(liking)을 반영하는 시간적인 요소와 순차적 요소가 극단적인 관측값이 무작위적인 시스템보다 유의하게 관찰되는 두꺼운 꼬리분포(heavy-tailed distribution)를 따름을 확인하였다. 시간적 동역학은 연속되는 비동질적 포아송(cascading non-homogeneous poisson) 모델을 통해, 순차적 동역학은 습관적 통제(habit control)와 목표지향적 통제 (goal-directed control)로 구성되는 두 가지 보상 평가과정 모델을 통해 내재된 계산시스템의 상호작용에 의한 행동의 분포가 어떻게 시간과 선택에서 두꺼운 꼬리분포로 나타나는지를 볼 수 있었다.
두 번째 실험에서는 선택의 동역학에서 보상관련 중추로서 쾌락에 반응하는 측좌핵(nucleus accumbens)의 외피(Shell) 역할을 규명하였다. 첫째로 쥐의 측좌핵의 외피에 전류를 가하여 세포를 파괴하였고, 이어 lenti 바이러스 벡터를 측좌핵 외피에 주입하여 도파민 D2 리셉터 녹다운(knock-down)을 통해 도파민 영향을 줄이고자 하였다. 결과 NAc세포의 파괴는 오직 순차적 동역학에만 영향을 미쳤으며, 선택에서 같은 선택을 지속하는 경향이 증가하였다. 결과적으로 선택의 엔트로피(정보량)가 단순해졌고 가장 선호하는 것을 편향되게 많이 선택하였다. 그러나 측좌핵에서 도파민의 영향과 선택의 동역학에 영향을 미치지 않았다. 이는 측좌핵 외피부분이 보상과정을 통해 주관적인 선호에 영향을 주어 순차적 동영학에도 영향을 줄 수 있는 뇌영역이라는 가설을 뒷받침한다.
마지막으로 사람이나 유인원에서 발견되는 선호의 편향성인 손실회피(loss aversion)의 준거의존성(reference dependence)을 쥐에서 확인하고자 하였다. 이를 위해 기존의 T자형 미로를 개선하여 쥐에서 하여금 준거점(reference point)을 형성할 수 있게 하였다. 그 결과 쥐에서 프레밍 효과인 뚜렷한 손실회피와 준거의존성을 확인할 수 있었으며, 이는 이러한 편향된 선호가 진화적으로 보전되었음을 시사한다. 따라서 이러한 편향된 선호를 뇌 혹은 신경회로 수준에서도 실험을 통해 검증할 수 있을 것으로 보인다.
본 연구는 쥐에서 선호에 기반한 선택의 동역학적 특성과 이러한 행동과 뇌영역(측좌핵 외피)와의 관계, 그리고 편향된 선호의 진화적 보전 가능성 확인을 통해 선택과 선호에 대한 이해를 높이고자 하였다.