서지주요정보
Color laser printer forensic based on misregistration analysis for offline content protection = 오프라인 콘텐츠 보호를 위한 오정렬 분석 기반의 컬러 레이저 프린터 포렌식 기술
서명 / 저자 Color laser printer forensic based on misregistration analysis for offline content protection = 오프라인 콘텐츠 보호를 위한 오정렬 분석 기반의 컬러 레이저 프린터 포렌식 기술 / Jung-Ho Choi.
저자명 Choi, Jung-Ho ; 최정호
발행사항 [대전 : 한국과학기술원, 2012].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8024575

소장위치/청구기호

학술문화관(문화관) 보존서고

DCS 12020

휴대폰 전송

도서상태

이용가능

대출가능

반납예정일

초록정보

Media forensics can enhance and protect the reliability of multimedia content where this content is accessed, manipulated, and distributed using high quality computer devices. Color laser printer forensics is a kind of media forensics which identifies the printing source of color printed materials such as fine arts, money, and document and helps to catch a criminal. This paper presents a novel color laser printer forensic algorithm based on noisy texture analysis and support vector machine classifier that can detect which color laser printer was used to print the unknown images. In the color printer mechanism, 4 primary colors are employed for color mixing representation. The 4 primary colors are Cyan, Magenta, Yellow and Black. In the inkjet printers, each of the 4 colors is represented by color inks. On the other hand, in the color laser printers, the 4 primary colors are represented by toner particles. If color inks and color toner particles had transparent characteristic, the color mixing process is quite simple. It is made by just add some primary colors for representing some color. However, the color inks and the color toner particles do not have the transparent characteristic. The halftoning method is the solution for mixing the primary colors in color printer mechanism. For printing some color image, it is decomposed by RGB(Red, Green and Blue) color space. Actually, most of color images in the computer are represented by RGB color space. Next, they are transformed to CMYK(Cyan, Magenta, Yellow and Black) color space which is employed in color printing mechanism. After that, each color planes is sampled and generated by the halftoning method. In that process, some amount and orientation of misregistration between halftone image color planes is unavoidable due to various operations within a printing process such as mechanical paper transport, paper shrinkage, and misalignment of imagers. If there is misregistration of separations overlay, the percentage of the primary colors changes little and it could cause the color difference between the colors in original images and in printed papers. In this case, the high frequency components of the halftone patterns would be little different from the different color laser printers. Since each printer vender uses their own printing process, printed documents from different venders have a little invisible difference looks like noise due to some device dependent mechanical and color properties like color misregistration. In our identification scheme, to identify the color laser printers, we employ the `noises` from the printed images which are caused by the mechanical and color properties from each color laser printers. The noises are extracted using the wiener-filter and the 2D Discrete Wavelet Transform (DWT) filter. Before extracting the noises, we transform the color space of original printed image to CMYK color space which is used in color laser printing mechanism. And we employ the Lab color space which have device independent property to analyse the color property more exactly. The noises are extracted from these 3 color spaces:RGB, CMYK and Lab. Next, a gray level co-occurrence matrix (GLCM) is calculated to analyse the texture of the noises. The GLCM is used to characterize the texture property of the noises. From the GLCM, 576 statistical features are extracted and applied to train and test the support vector machine classifier for identifying the color laser printers. In the experiment, a total of 4,800 images from 8 color laser printer models were used, where half of the image is for training and the other half is for classification. Results prove that the presented algorithm performs well by achieving 99.55%, 98.43% and 91.73% accuracy for the brand, toner and model identification respectively. In additional test, we limit the color range with banknotes. In actual case, the crimes caused by making some fake banknotes using color laser printers have been happened often these days. In the banknotes test, a total of 9,000 image tiles from 8 color laser printer models were used, where half of the image is for training and the other half is for classification. Results prove that the presented algorithm performs well by achieving 100%, 99.87% and 98.60% accuracy for the brand, toner and model identification respectively. They are pretty much improved than the random image test. The printer identification scheme in this paper performed well with the limited color range scenario like banknotes.

미디어 포렌식 분야는 멀티미디어 콘텐츠의 신뢰성을 강화하는 기술이다. 본 논문에서는 그 중에서도 컬러 레이저 프린터 판별 기술에 대하여 연구하였다. 컬러 레이저 프린터 포렌식 기술은 예술품이나 은행권 같이 컬러 정보를 포함하고 있는 오프라인 콘텐츠들의 신뢰성을 강화한다. 본 논문에서 제안하는 컬러 레이저 판별 기술은 인쇄된 컬러 이미지에서 노이즈를 추출하여 그의 통계적 분석을 통하여 특징점을 추출한 뒤 서포트 벡터 머신을 이용하여 학습과 판별 과정을 거침으로서 이루어진다. 이 기술을 사용하면 인쇄된 컬러 이미지가 어떠한 컬러 레이저 프린터로 인쇄되었는지 판별할 수 있다. 일반적인 컬러 레이저 인쇄 과정에서, 기계적인 문제, 예를 들면 종이 전송, 종이 수축, 토너들의 오정렬 같은 문제 때문에 컬러 토너들 사이에 컬러 오 등록 이라는 현상이 발생하게 된다. 이 현상은 컬러 이미지들이 하프톤으로 변환되어 인쇄되는 컬러 프린터 인쇄과정에 영향을 주어 원래 재현하려 했던 색과 약간 다른 색을 재현하게 만든다. 이러한 현상이 발생하면 인쇄된 컬러 이미지의 하프톤의 고주파 부분, 즉 질감적인 특성과 잡음적인 특성이 많은 부분이 각각의 컬러 레이저 프린터마다 조금씩 달라지고, 그 때문에 서로 다른 컬러 레이저 프린터들로부터 인쇄된 컬러 이미지들의 색이 조금씩 달라진다. 또한 이러한 현상은 인쇄에서 사용되는 CMYK 컬러 공간이 기계에 종속적이기 때문에 발생하기도 한다. 이러한 컬러 왜곡 현상을 분석하여 컬러 레이저 프린터의 특징을 추출하여 서로 다른 컬러 레이저 프린터로 인쇄한 이미지들을 판별할 수 있다. 컴퓨터에서 기본적으로 이미지가 표현되는 방식은 RGB 컬러 공간이고, 인쇄를 하기 위해서는 RGB 컬러 공간으로 표현된 이미지는 CMYK 컬러 공간으로 변환하게 된다. 인쇄된 이미지의 컬러적인 특성을 정확하게 분석하기 위해서 본 실험에서는 두 가지의 컬러 공간을 모두 이용하여 분석을 수행하였다. RGB 컬러 공간과 CMYK 컬러 공간은 기계에 종속적인 특징이 있기 때문에, 기계에 독립적인 특징을 가지며 사람의 인지 시각 범위에 더 잘 맞는 특성을 갖는 Lab 컬러 공간도 채택하여 총 세 종류의 컬러 공간으로 표현된 이미지에서 잡음을 추출하여 분석을 수행하였다. 컬러 오 등록 현상은 하프톤 컬러 이미지들의 중첩되는 부분을 변화시킬 수 있으며, 하프톤 이미지 자체가 잡음의 성격을 띠기 때문에 잡음 부분의 특성을 분석함으로써 하프톤 이미지의 특성을 알 수 있기 때문이다. 잡음의 특성을 분석하기 위하여 일반적으로 영상처리 분야에서 널리 쓰이는 위너 필터와 이산 웨이블릿 변환 기반의 필터를 적용하였다. 두 가지 필터를 이용하여 스캔한 이미지로부터 잡음을 추출하고, 그의 질감적인 특성을 분석하기 위하여 교차 상관관계와 네 방향 동시 발생 행렬을 구하였고 그의 특성을 잘 표현해주는 통계적인 특징점을 추출하여 한 이미지마다 총 572개의 통계적인 특징점을 추출하였다. 실험에서는 각각의 서로 다른 8개의 컬러 레이저 프린터로부터 4,800개의 이미지를 얻어냈으며, 그 중 랜덤으로 절반을 채택해 특징점을 추출한 다음 서포트 벡터 머신을 학습하는데 이용하였다. 나머지 절반은 특징점을 추출하여 서포트 벡터 머신을 이용해 그것들을 출력한 프린터를 판별하는데 사용하였다. 실험 결과, 컬러 레이저 프린터 제조 회사별 판별률은 평균 99.55%, 컬러 레이저 프린터 토너별 판별률은 평균 98.43%, 마지막으로 컬러 레이저 프린터 모델별 판별률을 평균 91.73%을 나타내었다. 또한 추가적으로 은행권에 대한 판별 실험도 수행하였다. 앞서서 수행한 실험은 랜덤한 색을 갖는 일반적인 이미지들에 대해서 수행하였는데, 이렇게 학습을 하면 학습되지 않았던 색다른 이미지가 테스트 군으로 입력되는 경우 오작동을 일으킬 확률이 크다. 그렇게 때문에 색의 범위가 제한되는 응용 분야를 찾았고, 은행권 테스트를 그 대상으로 삼았다. 실제로 은행권은 컬러 레이저 프린터를 이용하여 위조 복사되어 시중에 유통되는 경우도 종종 발생하기 때문에 은행권을 대상으로 한 컬러 레이저 프린터 판별 기술은 그 위조 대상의 범위를 좁힐 수 있다는 것에 의의를 둘 수 있다. 은행권을 사용한 실험 결과, 컬러 레이저 프린터 제조 회사별 판별률은 평균 100%, 컬러 레이저 프린터 토너별 판별률은 평균 99.87%, 마지막으로 컬러 레이저 프린터 모델별 판별률을 평균 98.60%을 나타내었다. 이를 통해서 본 기술은 색의 표현 범위가 제한된 이미지에 응용될 때 더 정확한 성능을 보여줌을 알 수 있었다. 향후 연구는 컬러 레이저 프린터의 기계적인 특성과 컬러적인 특성이 어떻게 수학적으로 표현되어 결합될 수 있는지에 초점을 맞추어서 진행돼야 할 것이다. 그를 바탕으로 좀 더 정확한 통계적 특징점을 찾을 수 있을 것이다.

서지기타정보

서지기타정보
청구기호 {DCS 12020
형태사항 vii, 66 p. : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 최정호
지도교수의 영문표기 : Heung-Kyu Lee
지도교수의 한글표기 : 이흥규
수록잡지명 : "Color Laser Printer Forensic Based on Noisy Feature and Support Vector Machine Classifier". Multimedia Tools and Application, (2011)
학위논문 학위논문(박사) - 한국과학기술원 : 전산학과,
서지주기 References : p. 54-57
주제 Media Forensics
Printer Identification
Misregistration
Feature Extraction
Offline Content Protection
미디어 포렌식
프린터 판별
오정렬
특징점 추출
오프라인 콘텐츠 보호
QR CODE qr code