This thesis proposes a two-phase mathematical programming approach by considering classification gap to solve the proposed credit scoring problem so as to complement any theoretical shortcomings. Specifically, by using the linear programming (LP) approach, phase I is to make the associated decisions such as issuing grant of credit or denial of credit to applicants, or to seek any additional information before making the final decision. Phase 2 is to find a cut-off value, which minimizes any misclassification penalty (cost) to be incurred due to granting credit to `bad' loan applicant or denying credit to `good' loan applicant by using the mixed-integer programming (MIP) approach. This approach is expected to find appropriate classification scores and a cut-off value with respect to deviation and misclassification cost, respectively.
Statistical discriminant analysis methods have been commonly considered to deal with classification problems for credit scoring. In recent years, much theoretical research has focused on the application of mathematical programming techniques to the discriminant problems. It has been reported that mathematical programming techniques could outperform statistical discriminant techniques in some applications, while mathematical programming techniques may suffer from some theoretical shortcomings.
The performance of the proposed two-phase approach is evaluated in this thesis with firm data and loan applicants data, by comparing with three other approaches including Fisher's linear discriminant function, logistic regression and some other existing mathematical programming approaches, which are considered as the performance benchmarks. The evaluation results show that the proposed two-phase mathematical programming approach outperforms the aforementioned statistical approaches. In some cases, two-phase mathematical programming approach marginally outperforms both the statistical approaches and the other existing mathematical programming approaches.
신용평점 모델을 위한 분류 문제를 다루는데 있어서 통계적인 판별분석 방법들이 일반적으로 고려되어 왔었다. 최근에 이러한 문제들에 대해서 수리계획 기법을 응용하는데 초점을 맞추어 많은 연구가 이루어지고 있다. 많은 연구에서 수리계획 기법들이 기존의 통계적인 판별 기법들보다 나은 결과들을 보여주었다. 반면, 이 기법들은 몇 가지 이론적인 단점이 지적되어 왔다.
이 연구에서는 이러한 단점들을 보완하면서 판별문제의 하나인 신용평점 문제를 해결하기 위해서 classification gap을 고려한 두 단계 수리계획 접근방법을 제안한다. 1 단계에서 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것인지의 여부 또는 결정을 내리기 전에 추가적인 정보를 찾을 것인가를 결정하게 된다. 2 단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는다. 이러한 접근방법은 각각 오차와 오분류 비용에 대하여 적절한 판별점수를 찾는다.
이 연구에서는 기업 및 대출 신청자의 데이터에 각각에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 평가 결과를 통하여 두 단계 수리계획 접근법이 통계적인 접근방법 및 기존의 수리계획 접근방법보다 나은 성능을 보인다.