Identifying key supply chains of companies to pinpoint potential threats in the supply chains of companies or items, and finding alternative suppliers is crucial. In this study, we built a pipeline to create supply chains using a relation extraction model based on 10K reports. We extracted relationships from the 2022 10K reports of S&P 500 companies using the conventional relation extraction model SSAN and the large-scale language model ChatGPT. We refined the network using word embeddings through SBERT. The outputs of both models were compared, and the created supply networks were classified into countries, companies, materials, and technologies, followed by visualization and statistical analysis to determine the most critical nodes in the supply chains. This research is expected to aid in utilizing large-scale language models and quickly and easily provide users with hidden connections between companies or specific information about a particular company.
기업의 핵심 공급망을 식별하여 기업이나 품목의 공급망에서 위협이 될 수 있는 부분을 파악하고, 대안적인 공급업체를 찾아내는 것은 중요합니다. 본 연구에서는 10K 보고서를 기반으로 관계 추출 모델을 통해 공급 망을 생성하는 파이프라인을 구축했습니다. S&P 500 기업들의 2022년 10K 보고서에 대해 기존 관계 추출모 델인 SSAN 과 대규모 언어 모델인 Chat GPT를 활용하여 관계를 추출하였으며, SBERT를 이용하여 워드 임베딩을 통해 정제된 지식그래프를 생성했습니다. 두 모델의 결과물을 비교했고, 생성된 공급망 네트워크를 국가, 회사, 재료, 기술 면으로 분류한 후 시각화와 통계적 분석을 수행하여 어떤 노드가 공급망에서 가장 중 요한지를 밝혀내었습니다. 이러한 연구는 대규모 언어 모델의 활용에 도움을 주고, 사용자에게 회사 간의 숨겨진 연결고리나 특정 회사에 대한 정보를 쉽고 빠르게 전달할 수 있을 것으로 기대됩니다.