서지주요정보
Evaluation of collision risk factors affecting injury severity for various collision groups using data mining technique = 데이터 마이닝 기법을 이용한 다양한 교통사고 그룹의 부상 심각도에 영향을 미치는 사고 위험 요인 평가에 관한 연구
서명 / 저자 Evaluation of collision risk factors affecting injury severity for various collision groups using data mining technique = 데이터 마이닝 기법을 이용한 다양한 교통사고 그룹의 부상 심각도에 영향을 미치는 사고 위험 요인 평가에 관한 연구 / Yeonghwa Woo.
발행사항 [대전 : 한국과학기술원, 2016].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8028848

소장위치/청구기호

학술문화관(문화관) 보존서고

MCE 16007

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Road safety is one of main health issues related to transportation system nowadays. Risk factor analysis is performed to identify major variables that determine severity of collisions, and to measure their influence to the injury severity. In this study, we identify major risk factors that determine collision severity for various subgroups generated from single large-scaled data and compared different subgroups quantita-tively and qualitatively based on risk factor importance. For the study, collision records from SWITRS data-base are used to generate subgroups based on five subgrouping criteria - gender of driver, population of colli-sion area, at-fault party indicator, race of driver, and vehicle maker. For identification of major risk factors and measurement of risk factor importance, advanced data mining technique of regularized random forest is used. The method is based on classification and regression tree (CART), considering dependency between risk factors. Here, tree regularization is applied to derive more reliable list of risk factors ordered by their importance. Random forest is applied to increase overall model prediction accuracy. Using regularized random forest, risk factors are ranked by their importance in severity determination for each group. Subgroups are compared based on these risk factor rankings. In order to quantitatively compare risk factor rankings, descriptive statistics of mean ranking and ranking standard deviation are measured for each risk factor. In this study, it is shown that crash type and violation category are two most dominant risk factors regardless of subgroup characteristics. Movement pre-ceding collision, state highway indicator, and population of collision area are relatively major risk factors that show some ranking change by subgroups. At-fault party indicator is risk factor that generally gives intermedi-ate influence to collision severity. Other risk factors such as race, age group and gender of driver, driver sobri-ety, and vehicle age group were generally regarded as minor risk factors with frequent ranking changes by subgroups. In addition to descriptive statistics, dissimilarity index is introduced to evaluate the dissimilarity of two subgroup’s risk factor rankings. High dissimilarity between two subgroups indicates that behavior charac-teristics of given two subgroups in collision situation differs a lot. For each subgrouping criteria, average dis-similarity index between subgroups is measured. According to the result, at-fault indicator shows highest dis-similarity index, followed by population of collision area. Vehicle maker shows third highest average dissimi-larity index. Two driver-related variables of gender and race of driver show lowest dissimilarity indices be-tween corresponding subgroups. After quantitative analysis, subgroups are compared by each subgrouping criteria. For risk factors that show significant ranking change by subgroups, actual severity distribution is measured for comparison. Nota-ble findings include high importance of state highway indicator in urban area, driver sobriety in rural area, movement preceding collision and driver sobriety for at-fault parties, and state highway indicator for not-at-fault parties

사고 위험 요인 분석은, 다수의 사고 관련 변수들 중, 사고 부상 심각도에 직접적인 영향을 미치는 위험 요인들을 파악하고, 각 위험요인들이 사고 심각도에 어떤 영향을 미치는지 분석하는 과정이다. 다양한 데이터를 활용한 사고 위험요인 분석 연구가 존재하지만, 사용된 방법론 및 데이터 형식이 각각 다르기 때문에, 서로 다른 특징을 가지는 교통사고 그룹에 대한 사고 위험 요인의 직접적인 비교가 불가능하다. 또한 기존에 사고 위험요인 분석에 주로 사용되던 로지스틱 회귀분석의 경우, 변수로 사용되는 위험 요인 간 의존성을 고려하지 않는다는 한계점이 존재한다. 본 연구에서는 위험 요인 간 의존성을 고려한 데이터 마이닝 기법을 활용하여 단일 대용량 데이터베이스에서 파생된 다양한 교통사고 그룹의 주요 위험 요인을 찾아내고, 위험 요인 중요도에 기반하여 서로 다른 교통사고 그룹들을 정량적 및 정성적으로 비교 분석한다. 비교 분석에 앞서 다양한 사고 그룹별 주요 위험요인 도출을 위해 캘리포니아의 사고 데이터베이스인 SWITRS로부터 운전자 성별, 사고지역 인구수, 가해차량 여부, 운전자 인종, 차량 제조사를 기준으로 14개의 그룹을 만들어 낸 후, Regularized Random Forest기법을 이용하여 각 그룹별로 사고 위험 요인의 중요도 순위를 매겼다. Regularized Random Forest는 변수간 독립성 조건을 필요로 하지 않는 분류 트리인CART 를 기반으로, 위험 요인의 중요도 차이를 극대화 할 수 있는 트리 정규화(regularization)와 전체 모델 정확도를 높이는 랜덤 포레스트 (random forest)가 적용된 기법이다. 사고 위험요인 순위의 집중 경향성 파악을 위한 정량적 지표로 각 사고 위험요인 별로 평균 순위, 순위 표준 편차를 계산하였으며, 그 결과 충돌 유형 및 법규 위반항목이 일반적으로 그룹 특성에 관계없이 가장 중요한 위험 요인으로 나타나며, 사고 선행 차량행태와 주 고속도로여부, 사고지역 인구수의 경우 대체적으로 중요하지만 그룹별로 순위 변동이 존재한다. 가해 차량 여부는 대부분의 경우 중간 정도의 중요도를 차지하며, 그 외 운전자 성별, 나이대 및 인종, 차량 연식, 음주운전 여부의 경우 일반적으로 중요도가 낮고 순위변동이 잦게 일어난다. 교통사고 그룹별 사고 위험요인 순위 분포의 차이를 정량화 하기 위해 비유사도 (dissimilari-ty) 지수를 도입하여, 그룹화 기준별로 하위 그룹간 평균 비유사도 지수를 계산하였다. 그 결과 가해차량 여부에 대한 순위 비유사도가 가장 높았으며, 도시지역과 시골 지역의 차이, 차량 제조사별 차이, 운전자 성별에 따른 차이, 운전자 인종 별 차이 순으로 높은 값을 나타냈다. 정량적 분석 결과를 바탕으로, 사고 그룹 생성 기준별로 그룹별 사고 위험요인 순위를 비교하고, 큰 순위 차이를 보이는 사고 위험 요인들에 대해 실제 사고 심각도 분포를 측정하였다.

서지기타정보

서지기타정보
청구기호 {MCE 16007
형태사항 vi, 49 p. : 삽화 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 우영화
지도교수의 영문표기 : Yoon Jin Yoon
지도교수의 한글표기 : 윤윤진
학위논문 학위논문(석사) - 한국과학기술원 : 건설및환경공학과,
서지주기 References : p. 44-45
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서