Multi-label classification aims to find a function that predicts multiple labels for an instance. For successful learning, the classifier requires a fully ground-truth label dataset which demands a high annotation cost. Many previous works proposed classification model learning from partial labels to alleviate the issue. However, those works have limitations due to the assumption that classes are mutually exclusive. In a realistic setting, classes are not disjoint, i.e., a hierarchical relationship exists between categories. When classes of a dataset are organized into a hierarchical structure, Hierarchical Multi-label Classification (HMC) aims to learn a multi-label classifier that satisfies hierarchical constraints. Previous works impose hierarchical constraints on network architectures or loss functions to predict an instance with a set of hierarchically related labels. To the best of our knowledge, we propose for the first time the problem to find a hierarchical multi-label classifier when a partial label dataset without a known hierarchy is given rather than a fully-supervised dataset. In this work, we propose an iterative framework for hierarchical multi-label classification from partial labels without known hierarchy. When training a multi-label classifier with partial labels, our model extracts label hierarchy from the classifier output using our hierarchy extraction algorithm. Then, our proposed losses exploit the extracted hierarchy to train the classifier. Several experiments show that our model obtains a label hierarchy quite close to the ground-truth dataset hierarchy, so that outperforms previous methods for multi-label classification from partial labels.
다중 레이블 분류는 인스턴스에 대한 여러 레이블을 예측하는 함수를 찾는 것을 목표로 한다. 성공적인 학습을 위해 분류기는 완전한 참 레이블 데이터 세트가 필요하고, 이는 높은 레이블링 비용을 요구한다. 많은 선행 연구들은 이러한 레이블링 비용 문제를 완화하기 위해 부분 레이블이 주어졌을 때 다중 레이블 분류기를 훈련시키는 방법론을 제안했다. 하지만 이러한 방법들은 레이블의 범주가 상호배타적이라고 가정한다는 제약이 있다. 현실적인 환경에서 클래스는 상호배타적인 관계가 아니고, 계층적 관계가 존재할 수 있다. 데이터셋의 클래스가 계층 구조로 구성되었을 때, 계층 다중 레이블 분류는 계층적 제약 조건을 충족하는 다중 레이블 분류기를 학습한다. 본 연구는 알려진 계층 구조가 없는 부분 레이블 데이터 세트가 주어질 때, 계층적 다중 레이블 분류기를 찾는 문제를 처음으로 제안한다. 부분 레이블로 다중 레이블 분류기를 훈련하기 위하여, 본 연구에서 제안하는 모델은 계층 추출 알고리즘을 이용하여 분류기 출력으로부터 레이블 계층을 추출하고, 추출된 계층을 이용하여 손실함수로 분류기를 훈련한다. 제안된 모델은 실험 결과를 통해 실제 데이터와 상당히 가까운 레이블 계층을 얻는 것으로 유효성을 검증하였다. 또한 부분 레이블이 주어졌을 때 다중 레이블 분류 실험에서 이전 방법론을 능가하는 성능을 보였다.