In the statistical literature on regression analysis, much attention has been given to problems of detecting observations which, individually or jointly, exert a disproportionate influence on the outcome of linear regression analysis and to problems of assessing the influence of such cases. Most approaches are ways of measuring the change in some feature of analysis on the deletion of one or more observations. Various measures have been proposed which emphasize different aspects of influence on the linear regression. Among them the influence measure, $\mbox{C_m(X(d_m)X(d_m),\;\; ps^2(d_m}$)), proposed by Cook and Weisberg (1982) is mainly treated in this thesis. This measure will be called Cook-Weisberg measure in this thesis. This thesis is written with the intention of fulfilling four needs for Cook-Weisberg measure. First, even though Cook-Weisberg measure was proposed in 1982, an appropriate critical point has not been given. A critical point is suggested for the measure under the normality assumption. Second, an easy computational form of the measure is derived. Third, when computing the measure in practical problem, an efficient computational procedure is proposed. Fourth, programs are implemented which compute the influence measure with the stepwise approach.
통계학에서 선형 회귀 분석에 관해서 연구할 때 분석의 결과에 크게 영향을 미치는 관측치들을 탐지해서 평가하는 데 많은 관심을 갖는다. 이러한 관측치들을 탐지하기 위해 우선 모든 관측치에 대해서 분석한 후 한 개 또는 둘 이상의 관측치를 제거한 후에 분석함으로써 주어진 측도의 변화량들을 측정하는 방법이 대부분이다. 많은 학자들이 측도를 제안했는 데 본논문에서는 1982년에 Cook과 Weisberg가 제안한 측도, $C_{d_m}(X (d_m)X(d_m),p\, s^2(d_m))$에 관해서 4가지를 제시한다. 첫째, Cook과 Weisberg가 1982년에 제안한 측도를 이용해서, 모든 관측치중 하나 또는 둘 이상을 동시에 제거한 후 그에 대응한 측도를 측정했을 때 어느 값 이상이면 영향을 크게 주는 관측치들이라고 판정할 수 있는 기각치에 관한 연구가 없었다. 본 논문에서는 오차가 정규 분포를 따른다는 가정하에서 F 분포의 확률값으로서 기각치를 제시한다. 둘째, 현재까지 Cook과 Weisberg가 제안한 측도를 계산하는 방법은 행렬들의 연산을 직접 계산하기 때문에 매우 많은 계산 시간이 필요하다. 본 논문에서는 행렬 연산을 스칼라로 계산할 수 있는 방법을 수학적으로 기술한다. 세째, 위?【U} 제안된 계산 방법을 예제를 통해 계산 절차를 밝히고, 새로운 방법이 계산시간면에서 훨씬 우수함을 보인다. 마지막으로 실제 문제에 적용할 수 있는 FORTRAN프로그램을 첨부한다.