This paper proposes a dictionary learning algorithm in which the atoms of the dictionary have a tree-structured hierarchy such that atoms of the parent node are tunned in representing patterns common across images belonging to all classes that the atoms of its child nodes are tunned to represent. Thus, the atoms at the root are tunned to represent patterns common to all images, while the atoms at the leaves are tunned to represent image patterns exclusive to a class. An image feature is assumed to be represented by atoms in the dictionary along a unique path from the root to a leaf. The learned dictionary is efficient in its use of the atoms, and leads to a more discriminative representation than that led by previous dictionaries which is devoid of any structure and contains redundant atoms : previously proposed dictionaries are a collection of independently constructed class dictionaries. The dictionary is learned by solving a constraint optimization problem that minimizes the reconstruction error of a given set of images while using the atoms along a particular path from the root to the leaf exclusive to each class. For a given "tree-structured dictionary", sparse representation is pursued to improve generalization. The proposed algorithm is extensively evaluated on benchmark image dataatoms in comparison with existing sparse representation and DL based classification methods.
본 학위논문은 data를 representation하는 basis를 class간의 similarity에 따라 tree-structured dictionary로 구성하여 구별력있는 feature를 추출하는 것을 제안한다. 최근, data를 소수의 basis와 sparse coefficients로 표현하고자 basis를 learning하는 dictionary learning algorithm을 inpainting, denoising, super resolution 등 다양한 영상 처리 분야에서 좋은 성능을 보이며 많은 주목을 받고 있다.
classification에서는, data를 dictionary의 basis들과 함께 표현하는 sparse coefficients가 feature로 사용되며, 이를 discriminative하게 만들기 위해 많은 연구가 진행되어 왔다. 기존의 연구들은 크게 두가지로 분류될 수 있는데, 이들은 sparse coefficients를 discriminative하게 만들어주거나 dictionary basis들을 incoherent하게 만들어주었다. Sparse coefficients를 discriminative하게 만드는 연구로, Q. Zhang과 B. Li는 objective function으로 squared loss function과 classifier를 같이 learning함으로써, 정확하게 representation하고 discriminative한 dictionary를 만드는 algorithm을 제안하였고, Z. Jiang, Z. Lin과 L. S. Davis.는 Zhang이 제안한 algorithm에 label consistent term을 추가해 기존보다 dictionary를 discriminative하게 만드는 algorithm을 제안하였다. M. Yang, L. 코뭏, X. Feng과 D. Zhang은 sparse coefficients에 대한 Fisher discriminative term을 objective function에 추가하여 algorithm을 만들었다. Dictionary basis를 incoherent하게 만드는 연구로, I. Ramirez, P. Sprechmann과 G. Sapiro는 dictionary를 incoherent하게 만드는 텀을 dictionary learning의 objective function에 추가하였다. S. Kong과 D. Wang은 sparse coefficients를 discriminative하게 만드는 term과 dictionary를 incoherent하게 만드는 term을 같이 사용하였다.
하지만, 이러한 다양한 algorithm들에도 불구하고, 각 class의 data들이 가지고 있는 similarity들은 유지되고 있었고, 이는 incorrect classification의 원이 되었다. 따라서, 본 논문은 이러한 class간에 존재하는 similarity를 tree structure와 함께 feature 추출과 classification에 이용하여 이전보다 높은 섣ㅇ능의 classification algorithm을 제안하였다.