These days, in the surface mount technology (SMT) process field, automatic optical inspection (AOI) machines inspect components mounted on the printed circuit board (PCB) by measuring and processing images of the PCB. In this paper, our objective is to find a path that minimizes the cycle time to improve the productivity of AOI machines. Existing research solves the PCB path planning problem from the perspective of the traveling salesman problem. Meta-heuristic methods such as genetic algorithm and ant colony algorithm have been proposed to solve this problem. Moreover, exact solutions can be solved by mixed-integer linear programming. We present a learning-to-search approach to the PCB path planning problem in this work. To achieve this, our proposed look-ahead search called Branch-and-Rollout search (BRS) is used in both train and test time. After pre-training policy and value networks with reference policy initially, we fine-train pre-trained models using BRS. We empirically show that fine-trained models outperform reference policy. Furthermore, BRS using fine-trained policy and value networks gives near-optimal solutions.
표면 실장 기술 공정 분야에서 자동 광학 검사 장비를 이용하여 인쇄 회로 기판을 이미지로 측정 및 가공하여 인쇄 회로 기판에 탑재된 부품을 검사한다. 본 논문에서는 자동 광학 검사 장비의 생산성을 향상시키기 위해 공정 주기 시간을 최소화하는 경로를 찾는 것을 목표로 한다. 기존 연구는 외판원 문제 관점에서 접근해서 인쇄 회로 기판 경로 탐색 문제를 해결한다. 이 문제를 해결하기 위해 유전 알고리즘, 개미 군집 알고리즘과 같은 메타 휴리스틱 방법이 제안되었다. 혼합 정수 선형 계획법을 이용하여 정확한 해를 구할 수 있다. 본 연구에서는 인쇄 회로 기판 경로 탐색 문제에 대한 탐색 기반 학습법을 제시한다. 이를 위해서, 분기와 롤아웃을 이용한 전방 탐색을 제안하고 훈련과 테스트 시에 사용한다. 먼저 참조 정책을 이용하여 정책 및 가치 네트워크를 사전 훈련한 뒤, 훈련된 모델들을 분기와 롤아웃을 이용한 탐색으로 미세 훈련을 한다. 미세 훈련된 모델이 참조 정책의 성능을 능가한다는 것을 경험적으로 보여준다. 또한, 미세 훈련된 정책 및 가치 네트워크로 분기와 롤아웃을 이용한 탐색으로 최적해와 가까운 해를 구할 수 있다.