Information finding on the Web has been well served by many high-tech search engines and yet information collection of the searched information for sharing and reuse in an organized manner is another useful service for community users as well as personal users. This will effectively reduce and specialize the information search space by minimizing the cognitive overload for users in the Web surfing.
This paper reports the development of a personal/community link library building system, called WebClipper which enables personal/community users to collect the indices for the Web information for more accurate search. The WebClipper manages various link information of the selected Web document and extracts their index data to form a virtual digital library for various purposes. This way, the users can collect useful information from the Web into their own link library space. When searching, they can first search their own library space before going out to navigate on the Web. Community users can share the continuously collected information of their shared libraries built by other users in the same community.
In this thesis, we show an implementation of the virtual library concepts with a Web link database management scheme, Web information clipping technique, and user interface design. The proposed Web link database management technique allows the system not to archive physical data but manipulate link information thus eliminating the problem of storage and copyrights. The clipping technique allows the users to conveniently choose the granularity of the data to be collected and further carry out an automatic keyword extraction and indexing. Database management of the link data enables user-defined link description and makes deadlink management easy too.
인터넷의 폭발적인 성장으로 끊임없는 정보가 나오고, 사용자는 자신에게 필요한 정보에 대한 관리의 필요성이 나타나고 있다. 사용자는 원하는 정보를 파일로 저장하거나 북마크를 이용하여 관리한다. 이와 같은 방식은 특정 컴퓨터에 저장을 하여야 하고, 반드시 저장되어진 컴퓨터를 이용하여야 하는 단점이 있다. 또한, 필요한 정보를 검색하기가 어렵고, 반드시 전체 페이지에서 자신이 원하는 정보를 사용자가 직접 찾아야 한다. 이와 같은 불편함이 없이 사용자가 보다 쉽게 자신의 정보를 관리할 수 있도록 요구되어지고 있다. 가상 문서를 이용한 디지털 라이브러리나 개인화 영역에 대한 많은 연구가 이루어지고 있다.
본 논문에서는 WebClipper 시스템이 기존의 접근방식의 장점을 통합하여 사용자가 보다 쉽게 자신의 정보를 관리하도록 제공하는 것이다. 이제 사용자는 자신이 원하는 영역에 대해 저장과 관리를 할 수 있고, WebClipper는 사용자가 지정한 영역에 대한 데이터에 대해 직접 파일로 관리를 하는 것이 아니라 링크정보를 이용하여 관리를 한다. 예로, 사용자가 웹 서핑을 하다가 원하는 정보를 발견하면 클리핑 페이지에 가서, 원하는 정보를 선택하고 저장하도록 요구를 하면 된다. 자동으로 선택된 영역에 대해 위치 주소, 웹 주소, 설명문, 생성날짜, 동호회 정보등이 하나의 레코드로 데이터베이스에 저장을 한다. 즉, 실제 데이터가 아닌 선택된 영역을 가리키는 링크정보를 이용하여 관리가 이루어지며, 부가적인 정보를 이용하여 보다 효율적인 검색이 가능하다. 키워드 검색뿐만 아니라 설명문, 날짜, 생성자, 동호회에 대해 검색이 이루어져 보다 정확한 정보를 추출할 수 있다. 또한, 개인 영역의 협소한 점을 해결하기 위하여 동호회를 구성하여, 가입한 동호회내에서 필요한 정보를 검색할 수 있다.
이제 사용자는 장소에 구애없이 어느 컴퓨터에서도 자신의 정보를 관리를 할 수 있으며, 이 정보는 다른 사람의 접근을 막도록 보안이 이루어 진다. 자신의 정보를 가입한 동호회에 공개를 할 수 있으며, 다른 사람의 공개된 정보를 공유 할 수 있다. 이와 같이 정보의 통합된 데이터베이스에서 다양한 검색조건을 부여하여 필요한 정보를 추출할 수 있다. 이 접근방식은 기존의 인터넷 환경에 새로운 패러다임의 하나로 될 것 이라고 확신하는 바이다.