In this paper, we introduce a Sparse Partially Linear Additive Models(SPLAM) to analyze a high-dimensional data. This is a model useful for variable selection and for checking if linearity of an independent variable is appropriate for explaining the dependent variable in an additive Model. We also introduce a method of bias reduction in parameter estimation by the Lasso. We introduce a new method of applying this method to the SPLAM to reduce the bias of parameter estimation in the SPLAM. To
compare these two models, we use 3 loss functions for each data set. It is shown through experiments that the new method results in a decrease in error rate over the SPLAM.
이 논문에서는 고차원 데이터 분석을 하기 위해 희소 부분적 선형 가법 모형을 소개하였다. 이는 가법 모형에서 독립 변수가 선택되었는지 여부와 그 변수가 종속 변수를 설명할 때 선형인지 여부를 다루는 모형이다. 또한 Lasso에서 매개 변수의 편향을 줄이는 방법을 소개하였다. 이 방법을 희소 부분적 선형 가법 모형에 적용하여 이 모형에서 매개 변수의 편향을 줄이기 위한 새로운 방법을 제시하였다. 그리고 위의 두 모형을 비교하기 위해 각 자료집합에 대해 3가지 손실 함수들을 사용하였다. 희소 부분적 선형 가법 모형에서 매개 변수의 편향을 줄인 방법이 원래 모형의 정확도보다 높다는 것을 실험들을 통해 보였다.