With the advent of the Fourth Industrial Revolution, various artificial intelligence technologies are being used to understand individual customers based on data as digital transformation has spread to all industrial areas. In response to these changes, policies to protect personal information emerged such as GDPR and CCPA. Google, Apple, and others agreed not to provide third-party companies with unidentifiable information, such as cookie data, to infer individuals, in line with privacy protection, so that the data could only be used through their own sandboxes, which can cause services within the platform to become data dependent on the parent platform. From this point of view, players on the platform have become more important than ever to collect their own data in order to gain independence from the data ecosystem. This study shows analyzing the impact of various data collections surrounding a customer on predicting their taste. In particular, this study identifies the impact of data actively entered by individuals on customer taste prediction and constructs a customer taste classification prediction model of the interior area via deep learning. In addition, oversampling is performed to predict customers' imbalanced taste, and the study shows how oversampling contributes imbalanced minority class prediction. Through this verification, this paper presents the business implication of collecting customer data actively entered and refinement of taste prediction in minority classes.
4차 산업혁명 시대의 도래로 디지털 트랜스포메이션이 전 산업 영역에 확산됨에 따라 데이터를 기반으로 개별 고객을 이해하기 위한 다양한 인공지능 기술들이 활용되고 있다. 이러한 시대적 변화에 대한 반작용으로 GDPR, CCPA 등 개인정보 보호를 위한 조치들이 등장하였다. 한편, 구글, 애플 등은 개인 정보 보호에 동조하여 3rd party 업체들에게 개인을 유추할 수 있는 쿠키 데이터 등의 비식별 정보를 제공하지 않기로 결정하였고, 데이터 활용은 그들이 보유한 샌드박스를 통해서만 활용할 수 있도록 조치하였다. 이러한 흐름은 플랫폼 내에서 활동하는 사업체들로 하여금 상위 플랫폼에 대한 데이터 종속화를 야기할 수 있으며, 이러한 관점에서 플랫폼 내 플레이어들은 데이터에 대한 독립성 확보를 위해 자체적인 데이터 수집이 이전보다 더욱 중요해졌다. 본 연구에서는 한 고객을 둘러싼 다양한 데이터 수집이 고객의 취향에 미치는 영향에 대해 분석하였다. 특히, 그 중에서도 개인이 능동성을 두고 적극적으로 기입한 고객 데이터가 취향 예측에 미치는 영향을 파악하였다. 여기서는 딥러닝을 활용하여 인테리어 영역의 고객 취향 분류 예측 모델을 구성하였다. 이에 더하여, 고객의 불균형한 인테리어 취향 예측의 향상을 위해 오버샘플링을 시행하여, 오버샘플링이 불균형한 취향 예측에 기여하는 바에 대해서도 연구하였다. 이를 통해 능동적 고객 데이터 수집과 소수 클래스의 취향 예측의 정교화가 가져오는 비즈니스 관점의 시사점을 제시하였다.