This research focuses on the path planning problem that emerges during the inspection of a Printed Circuit Board (PCB) at semiconductor fabs. The inspection process consists of two elements: the camera and the image processor. The camera visits and captures the predetermined locations on a PCB. The inspection is performed on this image by the backend image processor. The objective of the research is to minimize the makepsan of the inspection of a PCB. A reinforcement learning approach is proposed to solve the problem. Firstly, the 2-Opt heuristic method is adopted. A policy network and a state value network are trained on the paths provided by the 2-Opt in a supervised manner. The policy network provided comparable solutions to the target policy which is the 2-Opt heuristic.
* The author of this thesis is a Global Korea Scholarship scholar sponsored by the Korean Government
이 논문은 반도체 공장에서 인쇄 회로 기판을 검사하는 동안 발생하는 경로 탐색 문제를 다룬다. 검사 과정은 카메라 이동과 이미지 처리의 두 가지 요소로 구성된다. 카메라는 사전에 정의된 검사 대상 촬영 영역을 방문하기위해 이동하며, 촬영된 이미지는 별도의 프로세서에 의해 처리된다. 인쇄 회로 기판 검사의 총 소요 시간을 최소화하는 것이 연구의 목적이다. 강화 학습 방식을 문제를 해결하기 위해 채택한다. 먼저 2-Opt 휴리스틱 방법을 사용하여 문제를 해결한다. 2-Opt가 제공하는 경로에 대해 정책 네트워크와 상태 가치 네트워크가 지도 학습 방식으로 훈련된다. 정책 네트워크는 2-Opt 휴리스틱 대상 정책과 비슷한 솔루션을 제공했다.
* 본 논문작성자는 한국정부초청장학금(Global Korea Scholarship)을 지원받은 장학생임