서지주요정보
Identification of influential observations in multivariate statistical methods = 다변량 통계 방법에서 영향 관측치의 탐지
서명 / 저자 Identification of influential observations in multivariate statistical methods = 다변량 통계 방법에서 영향 관측치의 탐지 / Kang-Mo Jung.
저자명 Jung, Kang-Mo ; 정강모
발행사항 [대전 : 한국과학기술원, 1997].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8007567

소장위치/청구기호

학술문화관(문화관) 보존서고

DMA 97003

SMS전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Diagnostics can be summarized as follows. Let R(D,M) denote a result from the data D and the postulated model M, and let M(w) denote the perturbed model according to the perturbation w. The goal of assessing influence is to compare R(D,M) and (R,M(w)) as w varies through a set of relevant perturbations. The main issues in diagnostics are the choice of the perturbation scheme and the method of comparing R(D) and R(D,M(w)). The choice of R is at the discretion of the investigator. There have not been so many diagnostic methods in the field of multivariate statistical methods until recently except for regression and related works. The objective of this thesis is to investigate the influence of observations on the estimators in multivariate statistical methods, and consequently one can identify the influential observations. The local influence method is adapted to principal component analysis, maximum likelihood factor analysis and linear discriminant analysis. The local influence method uses the curvatures of a perturbed surface as a way of comparing R(D) and R(D,M(w)). In this thesis, three simultaneous perturbations are considered, which are totally different from the individual perturbations used in the influence function method and the case deletion method. For summarizing the influence effects on a vector-valued estimate into a scalar measure, three local influence scalar-valued measures are proposed. It can be seen that the maximum slope direction vector and the empirical influence function give essentially the same influence information, and particularly this property is analytically proved in linear discriminant analysis. The local influence method is compared with the influence function method and the case deletion method in multivariate statistical methods through numerical examples. Those illustrate that the former method is more effective than the latter methods, and it avoids masking effects.

통계적 분석의 결과에 대한 진단 방법은 다음과 같이 기술할 수 있다. 진단의 궁극적 목표는 R(D,M)와 R(D,M(w))의 비교에 있다. 여기에서 R(D,M)은 주어진 데이타 D와 가정된 모델 M에서 도출된 결과이고, R(D,M(w))은 어떤 변동 w하에서의 모델 M(w)로부터의 결과이다. 진단에서 중요한 사항은 변동 구조의 선택과 두 결과의 비교 방법이다. 많은 진단 방법이 회귀분석분야에서는 제안되었으나 다변량 분석분야에서 진단 방법은 그리 많지 않다. 본 논문의 목적은 다변량 통계 방법에서 추정량에 관한 관측치의 영향도를 조사하여 영향 관측치를 찾는데 있다. 가정된 모델과 변동된 모델에서의 결과를 비교하는 방법으로 변동 곡면의 곡률을 사용하는 국부적 영향 방법을 주성분분석, 최우량요인분석, 선형판별분석에 적용하여, 영향 측도를 자세히 유도하였다. 본 논문에서는 관측치 제거 방법과 영향 함수 방법에서 사용되는 개별적 변동과는 전혀 다른 3 가지 동시 변동을 고려하였다. 또한 다변량 통계 방법에서 다루는 벡터 추정량에 관한 영향도를 측정할 수 있는 스칼라 척도를 이용하여, 변동 곡면을 구성할 수 있는 방법을 제시하였다. 변동 곡면의 기울기 벡터가 경험적 영향 함수와 같은 영향 정보를 제공한다는 사실을 알 수 있으며, 특히 위의 성질은 선형판별분석에서는 해석적으로 증명된다. 실제 예를 통하여 본 논문의 방법과 관측치 제거 방법, 영향 함수 방법을 비교하였다. 이 예제들은 영향 관측치를 탐지함에 있어 전자의 방법이 후자의 방법들보다 훨씬 효과적이며, 또한 전자는 masking 문제를 극복함을 보여준다.

서지기타정보

서지기타정보
청구기호 {DMA 97003
형태사항 iv, 76 p. : 삽도 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 정강모
지도교수의 영문표기 : Byung-Chun Kim
지도교수의 한글표기 : 김병천
학위논문 학위논문(박사) - 한국과학기술원 : 수학과,
서지주기 Reference : p. 73-76
주제 Curvature
Diagnostics
Influential observations
Local influence
Perturbation
QR CODE qr code