서지주요정보
(The) effects of lexical features on information quality by data analytics = 데이터 애널리틱스를 활용한 비정형데이터의 어휘적 특성이 정보품질에 미치는 영향
서명 / 저자 (The) effects of lexical features on information quality by data analytics = 데이터 애널리틱스를 활용한 비정형데이터의 어휘적 특성이 정보품질에 미치는 영향 / Taeyoung Kang.
저자명 Kang, Taeyoung ; 강태영
발행사항 [대전 : 한국과학기술원, 2014].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8031235

소장위치/청구기호

학술문화관(문화관) 보존서고

DMT 14008

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

등록번호

9001513

소장위치/청구기호

서울 학위논문 서가

DMT 14008 c. 2

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Individuals gather information online to resolve problems in their daily lives and make various decisions about the purchase of products or services. With the development of the Internet, web 2.0 has allowed more people to easily generate and use online reviews such that the volume of information is rapidly increasing, and the usefulness and significance in analyzing the unstructured data have also increased. Recently, methodologies that can be used to analyze such unstructured data have been introduced because of the development of analytical technology. Text mining is one of these new methodologies. This thesis uses text mining to analyze the types of information that individuals can access, and determines how this information is used when individuals make decisions. In Essay 1, I focus on narrative sections of annual reports, which must be mandatorily disclosed in financial reporting, to reveal the relationship between company assessment information written directly by managers and the performance of companies using the text mining approach. To analyze this relationship, I collected the annual reports of all the publicly listed firms in the United States from 1996 to 2011 and conducted text mining to identify the tones of the annual reports and observe whether the tones of the annual reports changed depending on the current earnings level. In addition, I explore factors that could cause tone flexibility in the reports. I compare companies whose tones in their reports were more positive with those with less positive tones compared to their current performance to analyze how the future performance of these two groups would be different compared to the current performance. In Essay 2, diverse lexical features of expert reviews and user review contents provided by a third-party review site are extracted and defined. Specifically, the lexical properties of the product reviews are defined according to each relevant factor. Then, the influence of each linguistic factor of expert reviews and user reviews on consumers’ final evaluations is tested. In addition, product price is applied as a contextual variable to classify products into high-price products group and low-price products group, and test whether each linguistic factor influencing consumers’ evaluations towards products is different depending on lexical features. Finally, I investigate whether the lexical features of reviews and quantitative evaluations, rated by experts and users, affect consumers’ purchase decisions. Through these analyses, I expect to provide guidelines for how individuals process massive volumes of unstructured data depending on lexical features in various contexts, and how companies can use this mechanism from their perspective.

최근 정보 기술의 발전에 따라 개인은 인터넷의 다양한 경로를 통해 많은 정보를 손쉽게 얻을 수 있게 되었다. 개인이 얻을 수 있는 기업 관련 정보나 기업이 제공하는 제품이나 서비스에 대한 정보는 크게 나누어 보면, 정보의 주체인 기업 관계자가 직접 작성한 정보와 제 3의 기관이나 전문가가 창출한 정보, 그리고 일반 소비자가 작성한 정보 등으로 구분 할 수 있을 것이다. 이러한 정보들이 개인의 의사결정 (decision making)에 미치는 영향은 상황이나 정보의 목적이 무엇인지에 따라 다를 것이다. 다양한 원천의 정보들은 일반적으로 비정형데이터(Unstructured data)의 형태를 띄고 있기 때문에, 기존에 활용되고 있던 정형적인 (structured) 데이터를 분석하는 정량적(quantitative)인 방법론만으로 콘텐츠 자체를 분석하는 것은 한계를 가진다. 최근 분석 기술의 발전으로 이러한 비정형 데이터를 분석할 수 있는 기법이 소개되고 있는데, 텍스트 마이닝(text mining)이 그 중 하나이다. 본 연구는 텍스트마이닝을 활용해서 개인이 접할 수 있는 정보의 내용(contents) 측면을 분석하여 개인이 의사결정에 어떻게 활용하는지를 확인하고자 한다. Essay 1에서는 기업 환경에서 기업이 직접 작성하여 매년마다 공시 (disclosure) 하는 애뉴얼리포트(annual report)의 정보적 특성을 분석하고, 이들의 차기 년도 기업 성과 (future firm performance)에 어떤 영향을 미치는지 분석하고자 한다. 구체적으로 현재 성과 수준 (current performance level)에 따른 에뉴얼리포트의 톤(tone)을 분석하였다. 전체적으로 기업 에뉴얼리포트의 톤이 해당 기업의 성과 지속성에 미치는 영향과 추가적으로 현재 기업의 성과와 기업의 특징들을 통제한 후, 대비 overly positive biased 된 그룹과 less positively biased 된 그룹으로 나누어서, 각각의 그룹에서 톤의 변화로 기업의 미래성과를 얼마나 잘 예측하게 해주는지를 테스트 하였다. Essay 2에서는 소비자 환경에서, 소비자들이 접할 수 있는 전문가 리뷰 (expert review)와 소비자 제품 평가 후기(consumer review)의 정보적 특성이 소비자들의 제품 평가(user’s evaluation)와 제품 매출 (sales)과 밀접한 관련이 있는 소비자들의 의사결정(purchase decision)에 어떤 영향을 미치는지 확인하고자 한다. 본 연구에서 추가적으로 각 모바일 폰의 6개월치 누적 매출 데이터를 활용하여, 최종적인 소비자의 의사결정관련 변수들이 해당 모바일 폰의 매출에 미치는 영향을 테스트 하였다. 본 연구를 수행하고자 전문가 리뷰를 수집하여, 각 리뷰를 언어적인 특성 (lexical properties)들을 관계 있는 요인(factor) 별로 정리하였고, 전문가 리뷰 사이트와 연계되어 있는 제 3의 리뷰 전문 사이트에서 유저들의 리뷰를 개별적으로 수집하였다. 또한 각각의 전문가 리뷰와 유저리뷰의 언어적 요인 (linguistic factor)들이 소비자의 최종적인 제품 평가에 미치는 영향을 테스트 하였다. 추가분석에서는 고가격제품그룹 (High price product group)과 저가격 제품그룹 (low price product group) 으로 구분하여 각각의 언어적 요인들이 제품의 특성 별로 소비자 제품평가에 미치는 요인이 달라 지는지를 테스트 하였다. 이를 뒷받침하는 이론으로는 Elaboration Likelihood Model (ELM) 이론을 적용하여서 설명한다. 본 연구를 통해서, 다양한 환경, 즉 자본시장과 온라인 비즈니스 환경 내에서 활용되는 방대한 텍스트 정보들의 어휘적인 특성에 따라 해당 정보를 개인이 어떻게 처리 (processing)하며, 이러한 메커니즘을 기업 입장에서 어떻게 활용해야 하는지의 가이드를 제공할 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {DMT 14008
형태사항 vi, 108 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 강태영
지도교수의 영문표기 : Ingoo Han
지도교수의 한글표기 : 한인구
Including Appendix
학위논문 학위논문(박사) - 한국과학기술원 : 경영공학부,
서지주기 References: p. 93-103
주제 text analysis
purchase decision
annual report
third-party product review
tone analysis
exploratory factor analysis
earnings persistence
computational linguistics
텍스트마이닝
제품평가
소비자 의사결정
톤 분석
성과 지속성
소비자 제품리뷰
전문가 제품리뷰
연차보고서
탐색적 요인분석
QR CODE qr code