In the real-world, product classification is a significant task. It is because item categorization is combined with the financial element in the flow leading to manufacturers, distributors, sellers, and consumers. In addition, the process of managing products and categories by each company is a very labor-intensive task due to its large scale. To this end, previous studies on product classification generally focused on feature extraction of products and categories and neglected the task of adjusting features in the learning process. Previous studies used product and category information, but there are some improvements. Because, in reality, there are situations in which unlearned categories need to be classified. To solve this problem, we want to take advantage of the benefits of learning products and categories in the joint embedding space. In addition, we propose a method of finely adjusting feature vectors by learning the relationship between products and categories based on supervised contrastive learning rather than simply projecting feature vectors into the same embedding space. We set up two scenarios depending on whether categories appeared in training data, and as a result, our proposed method produces better performance than general classification models.
현실에서 상품을 분류하는 것은 매우 중요하다. 제조업체, 유통업체, 판매업체, 소비자로 이어지는 흐름 안에서 금전적인 요소와 결합되기 때문이다. 뿐만 아니라, 각 업체들이 상품과 카테고리를 관리하는 과정은 큰 규모로 인해 매우 노동집약적인 업무이다. 이를 해결하기 위해 상품 분류를 연구한 선행 연구들은 대체로 상품과 카테고리의 특징 추출에 집중하고, 학습 과정에서 특징을 조정하는 작업에는 소홀했다. 선행 연구는 상품과 카테고리의 정보를 모두 활용했으나, 몇 가지 개선점이 있다. 현실에서는 학습하지 못한 카테고리를 분류해야하는 상황도 발생하기 때문이다. 우리는 이런 문제를 해결하기 위해 상품과 카테고리를 같은 임베딩 공간에서 학습할 경우 생기는 이점을 활용하고자 한다. 또한 단순히 같은 임베딩 공간으로 특징 벡터를 투사하는 것만이 아니라 지도 대조학습을 기반으로 상품과 카테고리의 관계를 학습하여 특징 벡터를 정교하게 조정하는 방법도 제안한다. 우리는 카테고리의 학습데이터 등장 여부에 따라 두 가지 시나리오를 설정했고, 결과적으로 일반적인 분류 모델보다 향상된 성능을 산출할 수 있었다.