서지주요정보
범위 민감도를 도입한 도시 복잡시스템의 빅데이터 분석 방법론 연구 = (A) framework for band-sensitive big data analysis for urban complex system
서명 / 저자 범위 민감도를 도입한 도시 복잡시스템의 빅데이터 분석 방법론 연구 = (A) framework for band-sensitive big data analysis for urban complex system / 류제완.
발행사항 [대전 : 한국과학기술원, 2022].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8038464

소장위치/청구기호

학술문화관(도서관)2층 학위논문

DCE 22001

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

In modern society, the urban system has become a large system in which various factors and environments such as population, transportation, water and sewage, electricity, gas, communication, and external factors have complex interrelationship. The inherent complexity in this system emphasized the systemic approach. Recently, in order to overcome the limitations that traditional systemic approach have in causal analysis inherent in huge systems, the introduction of big data-based analysis methods has been proposed as an alternative. However, the various methodologies and deep learning models in previous studies have limitations that they assume the causality of the inherent causal relationship as the activity of neurons in the deep layers. In this study, the Convergent Cross Mapping(CCM) was introduced to analyze the causal relationship within a complex system and to derive causal coefficients between variables. The derived causal coefficients replace the original variables and used as input of Self-organizing Map(SOM) model to learn the causal patterns so that the variables with similar causal pattern are assigned in the same cluster. The selected variables used together as input for Long Short-Term Memory(LSTM) model to learn and predict the target variable. In the backpropagation, dynamically weighted loss function with Gaussian function placed more sensitivity for errors occurred in a band. In other words, in order to analyze an urban complex system, the proposed framework in this study consists of the quantification of causal relationships between system variables, the variable selection by clustering based on similar causal patterns from quantified causality, and the band-sensitive prediction by deep learning model with dynamically weighted loss function. The proposed framework was verified by applying it to the Lorentz Attractor system, and also applied to the particulate matters in seasonal management period from 2017 to 2020, Seoul. Big data such as air pollutants, traffic, population, and meteorological factors were collected for case study. The CCM and SOM concluded that the concentrations of air pollutants except ozone have causality pattern similar to the PM2.5. As a result of learning selected variables by LSTM model, it was confirmed that the variable selection based on similar causality pattern improved the prediction of PM2.5. Furthermore, the dynamically weighted loss function selectively improved the prediction near the reference concentration in which the level of PM2.5 changes. In particular, it was confirmed that the prediction of the test set was improved from 12.83 to 11.11 based on the average RMSE when a band is given near 35㎍/㎥, which is the standard concentration of the PM2.5. In conclusion, the proposed framework in this study can be applied to improve the prediction of target variables in an urban complex system. It can contribute to decision-making and policy analysis by providing band-sensitive improvement of target variable, particularly to the cases with policy standards such as air quality and water quality.

현대 사회가 발전하면서 도시는 인구, 교통, 상하수도, 전기, 가스, 통신, 외부 요인 등 다양한 요소와 환경이 복잡하게 작용하는 거대한 시스템이 되었고, 내재된 복잡성으로 인해 시스템적 관점에 기반한 분석의 중요성이 강조되었다. 최근 전통적 시스템 분석 방법론이 거대한 시스템에 내재된 인과관계 분석에 가지고 있던 한계점을 극복하기 위해서 빅데이터 기반 분석 방법의 도입 등이 대안으로 제시되고 있다. 그러나 선행연구에서 제시된 다양한 방법론 및 딥러닝 아키텍쳐는 내재된 인과관계의 인과성을 딥러닝 아키텍쳐 내부의 뉴런 활성도로 가정한다는 한계가 존재한다. 이에 복잡한 시스템 내부의 인과관계와 방향을 분석하는 수렴 교차 사상을 도입하여 각 변수 사이의 인과계수를 도출하고, 도출된 인과계수의 패턴을 입력값으로 활용하여 자기조직화 지도 모델에 학습 및 클러스터링하여 예측 타겟 변수와 유사한 인과패턴을 갖는 변수들을 선택한다. 선택된 변수들은 LSTM 모델의 입력값으로 활용하여 학습 및 타겟 변수 예측에 사용된다. 이 과정에서 손실 함수에 가우시안 형태의 동적 가중치를 적용하여 LSTM 모델의 역전파 과정에서 특정 범위에 속하는 타겟 변수 값의 오차를 더 민감하게 받아들였다. 즉, 본 연구는 도시 내부의 복잡한 시스템 분석을 위해서 시스템 내부 데이터 사이의 인과관계 정량화, 정량화된 인과관계 패턴 기반 클러스터링, 클러스터링 기반 변수 선택과 동적 가중치가 적용된 손실 함수의 도입을 통해 특정 구간의 예측력을 선택적으로 향상시킨 딥러닝 모델을 하나로 결합한 빅데이터 분석 방법론을 제시한다. 제안된 방법론은 로렌츠 끌개 시스템에 적용하여 일차적으로 검증되었으며, 2019년 및 2020년 서울시 계절관리기간의 초미세먼지 농도를 사례로 선정하여 방법론을 적용하고 검증하였다. 2017년부터 2020년까지 서울시 및 주변 지역의 대기오염물질, 교통량, 생활인구수, 기상자료 빅데이터가 수집되었다. 수렴 교차 사상과 자기조직화 지도를 통해 서울시 초미세먼지 농도와 유사한 인과계수 패턴을 갖는 변수는 오존 농도를 제외한 대기오염물질 농도로 분석되었다. 이 변수들을 활용하여 LSTM 모델에 빅데이터를 학습시킨 결과 인과계수의 패턴이 유사한 변수를 선택하여 사용할 때 초미세먼지 농도에 대한 예측력 향상을 확인할 수 있었고, 또한 동적 가중치를 도입한 손실함수의 적용으로 초미세먼지 등급이 변하는 기준 농도 근처에서의 예측력을 선택적으로 향상시킬 수 있었다. 특히, 미세먼지 농도 등급제의 기준 농도인 35㎍/㎥ 근처의 밴드를 설정했을 때, 테스트 셋에 대한 예측력이 테스트 평균 RMSE를 기준으로 12.83에서 11.11으로 향상된 것을 확인할 수 있었다. 이와 같이 본 연구에서 제안된 빅데이터 분석 방법론은 복잡한 시스템으로 정의되는 도시에서 타겟 변수의 예측력 향상에 적용될 수 있으며, 특히 미세먼지, 수질 등 정책적으로 기준이 되는 값이 정의되어 있는 경우 더 정확한 농도 예측 및 분석을 통해 의사결정 및 정책 분석에 기여할 수 있다.

서지기타정보

서지기타정보
청구기호 {DCE 22001
형태사항 iii, 64 p. : 삽화 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Jewan Ryu
지도교수의 한글표기 : 박희경
지도교수의 영문표기 : Heekyung Park
부록 수록
학위논문 학위논문(박사) - 한국과학기술원 : 건설및환경공학과,
서지주기 참고문헌 : p. 59-63
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서