Both our brain and deep neural networks (DNNs) successfully perform object recognition, but the visual pathway in the brain consists of fewer hierarchical layers than a DNN, presumably due to the restricted volume of the brain. What is the distinct strategy of the brain as compared to the artificial network that enables cost-efficient visual processing under this physical constraint, and how can this be implemented in artificial neural networks? Here, I suggest that the cortical long-range connections (LRCs) observed in various mammalian species can organize balanced local and global connections in the network, and they enable object recognition even in shallow neural networks. Using simulations of a model hierarchical network with convergent feedforward connections and LRCs from tree shrew data, I investigated the functional roles of LRCs for object recognition. First, I observed that the addition of LRCs to a shallow feedforward network significantly enhances the CIFAR-10 image classification performance so that it is comparable to that of a much deeper network. Second, through network pruning with gradient-based optimization, I confirmed that LRCs could spontaneously emerge by minimizing the total connection length while maximizing classification performance. Although most of the initial connections were pruned during training, a certain portion of the very long connections survived until the end of training. Ablation of the surviving LRCs led to a significant reduction in classification performance, which implies that LRCs are crucial for image classification. Lastly, I found that a combination of sparse LRCs and dense local connections organizes small-world type connectivity in a model network, and this enables consistent recognition of various types of objects. Furthermore, I found that performance enhancement by LRCs is strongly correlated with the small-worldness of a network, and this can possibly explain the optimal ratio of LRCs in the visual cortex. Taken together, I propose that long-range horizontal connectivity might be a key architecture of the visual cortex to implement parsimonious object recognition under the physical constraints of the brain.
두뇌와 인공 심층 신경망은 모두 시각 인지 기능을 성공적으로 수행하지만, 두뇌의 시각 경로는 이를 구성하고 있는 뉴런과 세포의 물리적인 크기 제약 때문에 일반적인 인공신경망보다 훨씬 적은 수의 계층으로 구성된다. 이렇게 물리적인 제약 하에서 비용 효율적인 시각 인지 기능을 가능하게 하는 두뇌의 전략은 무엇일까? 본 연구는 다양한 포유류 종의 일차시각피질에서 관찰되는 장거리 연결성이 신경망을 작은 세상 네트워크로 만들어, 얕은 신경망에서도 물체 인식을 가능하게 하는 주요 연결 요소라는 것을 제안한다. 이를 위해 본 연구에서는 수렴형 피드포워드 연결을 가진 인공신경망 모델 시뮬레이션과 동물 데이터에서 추출한 측면 연결성 데이터를 사용하여 객체 인식을 위한 장거리 연결성의 기능적 역할을 조사하였다. 먼저, 본 연구는 얕은 피드포워드 신경망에 장거리 연결성을 추가하면 자연 이미지 분류 성능이 크게 향상되어 훨씬 더 깊은 계층 수를 가진 신경망과 비슷한 수준에 도달함을 보였다. 둘째, 전체 연결 길이를 최소화하면서 분류 성능을 최대화하는 기울기 기반 구조 최적화 방식을 통하여 장거리 연결성이 자발적으로 나타날 수 있음을 확인하였다. 초기 연결의 대부분은 전체 길이를 줄이려는 목표함수에 의해 삭제되었지만, 극소수의 초장거리 연결은 학습이 끝날 때까지 살아남았다. 살아남은 장거리 연결을 제거하면 분류 성능이 크게 저하되며, 이는 장거리 연결성이 이미지 분류에 매우 중요한 역할을 담당함을 의미한다. 마지막으로, 본 연구는 극소수의 장거리 연결과 조밀한 로컬 연결의 조합이 신경망에서 작은 세상 네트워크를 형성하고 이를 통해 다양한 유형의 객체를 일관되게 인식할 수 있음을 발견하였다. 신경망의 성능 향상 정도는 네트워크의 작은 세계성과 강한 상관관계를 보였으며, 이를 토대로 시각 피질에서 장거리 연결을 차지하는 비율의 당위성을 증명할 수 있었다. 종합하면, 두뇌에서 발견되는 장거리 수평 연결이 뇌의 물리적 제약 하에서 비용 효율적인 객체 인식을 구현하기 위한 핵심 아키텍처가 될 수 있다고 제안한다.