Animals show various response when competing over a limited amount of resources. In the case of humans, due to a long history of being a part of great societies, altruistic and cooperative behaviors are easily observed. However, in non-human animals, aggression and selfish behaviors are more readily observed. We observed two mice showing cooperation-like behavior (Henceforth referred to as ‘Cooperative zone allocation behavior’) in competitive situations over a reward. If we interpret this observation from the viewpoint of ethology, we can say that they made a heuristic rule of reciprocity. However, this can also be interpreted as a result of reinforcement learning of each individual mouse. Here, we attempt to explain this zone allocation behavior from the aspect of reinforcement learning and compare it with the aspect of ethology.
한정된 자원을 두고 경쟁하는 상황에서 동물은 다양한 반응을 나타낸다. 인간의 경우 대규모의 사회를 이루어 살아온 영향으로 이타적 행동이나 협동 행동을 보이는 경우가 많이 관찰되지만, 인간이 아닌 동물의 경우 폭력적 행동과 이기적인 행동을 많이 보이는 것으로 알려져 있다. 우리는 두 마리 생쥐가 보상을 두고 경쟁하는 상황에서 협동하는 것 같은 행동을 보이는 것을 관찰하였다. 이 관찰 결과를 행동생태학적 관점에서 본다면 호혜적 관점에서 일종의 경험적인 규칙을 형성한 것이라고 할 수도 있다. 하지만, 행동의 결과에 초점을 맞춰 생각해보면 이 행동은 한 쌍을 이루는 생쥐 각각의 강화학습으로 나타날 수 있는 현상이기도 하다. 여기서 우리는 이 행동을 강화학습의 관점에서 설명해보고 행동생태학적 관점에서 해석할 경우와 비교해보고자 한다.