In manufacturing industry with sequential processes, quality of the product is influenced by many factors that have complex causal relationships between processes and parameters. Although traditional approaches such as statistical process (SPC) have done a central role in manufacturing industry, they have limitations to control the processes considering a lot of variables simultaneously. Machine learning techniques have ability to learn from data and to handle uncertain, imprecise, and complex information in large scale of data.
This thesis proposes three hybrid machine learning approaches of inductive learning and neural networks for solving quality problems. First, feature selection using neural networks is used to select a subset of features for higher correct prediction rate of inductive learning. Although a wrapper method which has known it yields good results in feature selection is difficult to apply to the population with large scale of data due to the complexity increased exponentially, this method has reduced its complexity to O(N) using sensitive information of network outputs about features from back-propagation neural networks after training. Second, clustering inductive learning method predicts quality characteristics of output with higher correct prediction rate by a hybrid method of SOM and inductive learning. Third, a pattern detection method is proposed to detect abnormal patterns of processes using self-organizing mapping (SOM) neural networks and test of goodness-of-fit. It gives a solution for multivariate process control on large parameters of data.
This thesis presents these approaches as a unifying framework to solve quality problems with large scale of data. The hybrid machine learning approaches have applied to yield management of semiconductor industry.
복잡한 제조공정을 갖는 장치산업에서 제품의 품질은 공정들과 공정변수들간의 복잡한 상호관계에 의한 많은 요인들에 의해 영향을 받는다. 통계적 공정관리와 같은 전통적인 기법들은 제조공정의 품질시스템에 많은 공헌을 하였으나, 다량의 데이터를 동시에 처리하여야 하는 복잡한 공정에서는 많은 한계를 갖고 있다. 따라서 기존의 기법들을 보완할 수 있는 새로운 방법이 필요하다. 귀납 학습이나 신경망 같은 기계학습 기법들은 다량의 데이터를 효과적으로 학습하여 자동적으로 요인들간의 복잡한 상호관계를 파악하는 능력을 갖고 있다.
이 논문은 복잡한 품질문제를 풀기 위해 귀납 학습과 신경망을 결합한 세가지 방법을 제시한다. 첫번째 통합방법은 신경망을 이용한 중요변수 추출 방법이다. 중요변수 선택시 성능이 좋은 것으로 알려진 포장 방법 (wrapper method)은 다량의 변수를 처리할 경우에는 그 복잡도가 지수적으로 증가하여 다량의 데이터를 갖는 제조공정에의 적용이 어렵다. 이 방법에서는 역전파 알고리즘의 신경망을 이용하여 변수들의 중요도를 파악하고 중요도 순서로 포장 방법에서 변수를 탐색함으로서 복잡도를 O(N)으로 낮춘다. 두번째 통합방법은 군별 귀납학습법으로 기존의 귀납학습에 자기 조직화 알고리즘을 갖는 신경망을 결합하여 예측력을 향상시킨다. 이 방법은 다음 공정의 특성치를 예측하는 데 있어 좀 더 정확한 예측을 가능 케 한다. 세번째 통합방법은 자기 조직화 신경망 기법에 통계적 검정 기법인 $\chi^2$ 검정법을 결합한 것으로 기준 패턴과 다른 패턴을 검출할 수 있다. 이 방법은 다변량 공정관리에 효과적으로 사용할 수 있다.
위의 세가지 기계학습 통합모형은 다량의 변수를 갖는 품질 문제를 해결하는데 적용할 수 있으며, 실제로 반도체 공정의 품질 문제에 적용하는 하나의 통합 모형을 예시한다.