In this paper, we propose a format-aware fuzzing on PDF files. We analyze information about the PDF format and conduct effective fuzzing that overcomes the limitations of the random mutation-based fuzzing on PDF files. We conducted fuzzing on 6 PDF reader programs by implementing a format-aware fuzzer on PDF files. In consequence, we found exploitable bugs that were not seen by other random mutation-based fuzzing techniques, and created exploit code for the bugs found. Also, we collected 2,754 PDF files on the web by creating a PDF file crawler and investigated the characteristics of the general PDF file by analyzing the format of the file.
본 연구에서는 PDF 파일의 포맷 기반 퍼즈 테스팅에 대해 제안한다. 우리는 PDF 포맷에 대한 정보를 분석하여 PDF 파일에 대한 기존의 랜덤 변형 퍼즈 테스팅이 갖는 한계점을 극복한 효과적인 퍼즈 테스팅을 진행한다. 우리는 PDF 파일의 포맷 기반 퍼즈 테스팅 도구를 구현하여 6개의 PDF 리더 프로그램에 대해 퍼즈 테스팅을 수행하였고 일반적인 랜덤 변형 퍼즈 테스팅으로 찾지 못했던 Exploitable 위험도의 크래시를 발견하여 EIP 제어가 가능한 취약점 공격 코드를 제작할 수 있었다. 또한, PDF 파일 크롤러를 제작하여 웹상에 존재하는 PDF 파일을 2,754개 수집하고 파일에 포맷 정보 분석을 수행하여 일반적인 PDF 파일의 특징을 조사하였다.