A technique is proposed for generating the MPEG-7 descriptor in compressed image/video data. Image processing in transform domain is a much interesting area recently because compressed image and video data are becoming widely available with the data format like MPEG or JPEG. In general, processing in transform domain requires smaller data quantities, and lower computation complexity than that in spatial domain. In this paper, I propose a generation algorithm of the MPEG-7 metadata in compressed domain. I have developed an algorithm to get the homogeneous texture descriptor in compressed domain. The original homogeneous texture descriptor is generated in frequency domain.
In this paper, proposed algorithms have extracted texture descriptor directly from a compressed domain, i.e., Block DCT domain. Experiments were performed with the MPEG-7 texture data set. First, all images in the data set are changed into the JPEG format. Then, I computed the MPEG-7 texture descriptors with a compressed image using the proposed method. For comparison, we also computed the descriptors in conventional frequency domain. Experimental results show that the computation time of the MPEG-7 descriptor using the proposed method is faster and more efficient than that of the conventional extraction method with compressed data. The proposed method can provide the efficient MPEG-7 metadata generation for compressed image/video in the contents based multimedia indexing/retrieval system.
최근의 인터넷과 멀티미디어 표준화 기술의 급속한 발달 및 보급으로 디지털 형태의 비주얼 멀티미디어 데이터 베이스는 기하급수적으로 증가하고 있어 이러한 방대한 양의 비주얼 데이터의 효율적인 관리, 검색 및 인식에 대한 필요성에서 ISO/IEC JT11/SC29 /WG11 에서는 MPEG-7 을 통한 멀티미디어 검색 및 표현 기술들을 표준화하고 있다. 이러한 경향과 더불어 현재 표준화되고 있는 MPEG-7을 이용한 검색 시스템 개발의 중요성이 대두되고 있다.
본 논문은 그 중요성이 점차 강조되고 있는 MPEG-7의 기술자로 사용중인 homogeneous texture를 이용하여 최근 들어 이미지 및 비디오 데이터 압축 포맷으로 널리 활용되고 있는 MPEG 이나 JPEG에 대해 좀 더 빠르고 효율적인 검색 시스템을 구축하기 위해서 압축 영역에서 직접적으로 특징을 추출하는 알고리즘을 개발한다. 이러한 시도는 MPEG-7을 이용한 검색 시스템의 응용 폭 및 효율성을 확장 시키는 역할을 담당할 것이다. .
압축 영역에서 MPEG-7 기술자 중 하나인 homogeneous texture 기술자를 생성하여 이를 이미지 및 비디오 검색 시스템에 적용하기 위하여 2가지 형태의 접근 방법을 시도해 본다.
먼저 압축 영역에서 이미지를 특징을 추출하여 검색 시스템을 구현하기 위해서 압축 영역의 특징 생성에 알맞은 새로운 데이터 베이스를 가지며 특징을 생성하여 검색 시스템에 이용하는 방법과 압축 영역 자체에서 직접적으로 특징을 추출하여 생성된 특징 자체를 원래의 homogeneous texture 기술자를 사용하여 구축한 MPEG-7 데이터 베이스와 비교하는 방법을 살펴보고 각각의 방법에서 적합한 알고리즘은 생성한다.