Characterization of shared files in peer-to-peer network : lifetime, incompleteness, and pollution = P2P 네트워크에서 파일의 유효성, 불완전성, 훼손성에 대한 분석
서명 / 저자 Characterization of shared files in peer-to-peer network : lifetime, incompleteness, and pollution = P2P 네트워크에서 파일의 유효성, 불완전성, 훼손성에 대한 분석 / Seung-Jun Lee.
발행사항 [대전 : 한국과학기술원, 2005].
Online Access 원문보기 원문인쇄





학술문화관(문화관) 보존서고

MCS 05044

휴대폰 전송







Today most peer-to-peer file sharing systems rife with polluted files. Actual content of polluted file is different from what user expected based on file metadata such as name or size. File pollution decreases the utility of peer-to-peer shared networks by disturbing peers to locate desired files. In this thesis, we analyze characteristics of shared files in eDonkey P2P networks in terms of lifetime, incompleteness, and pollution: how long files are available for download, whether peers download any file completely, and what kind of pollution occurs. For our analysis, we use {\\it eDonkey history}, one month archive of hourly snapshots on file states, for 328,515 files. It was recorded for five months from November 9, 2004 to April 13, 2005. File lifetime analysis shows that files are available for relatively long period of time; lifetime of 45% of files is longer than two months. We observe long-incomplete download problem that files cannot be downloaded completely over one month even though there are available sources. Small number of long-incomplete files, 1.47% of total files, generates about 17% of total requests to find uploading sources. About 32% of polluted files is mislabeled of adult contents and 9.3% of them is virus-infected. Polluted files are available longer than others; average lifetime of polluted files is about 11 weeks.

최근 P2P 공유 시스템은 훼손된 파일로 인해 사용자들이 자신이 원하는 파일을 다운로드 받기 어렵게 만들면서 시스템의 유용성을 저하시키고 있다. 여기서 훼손된 파일이란, 실제 파일 컨텐츠와 파일의 메타정보를 통해 유추되는 파일의 컨텐츠가 다른 경우를 말한다. 본 논문은 P2P 네트워크에서 공유되는 파일의 특징을 훼손성뿐만 아니라 시간에 따른 유효성, 다운로드 불완전성이라는 3가지 측면에서 분석하였다. 공유 파일에 대한 매 시간의 정보를 한 달 동안 기록하는 eDonkey history 데이터를 사용하여 위의 세 가지에 대해 분석하였다. 2004년 11월 9일부터 2005년 4월 13일까지 약 5달 동안 기록된 328,515개의 파일에 대한 정보를 분석을 위해 사용하였다. 파일의 유효성에 대한 분석은 파일이 상당히 오랜 기간 동안 다운로드가 가능하다는 점을 보여준다. 전체 파일의 45%의 유효기간은 2달 이상이다. 유효한 업로드 소스가 존재하여도 다운로드를 시작한 후 한 달이 지나도 완전한 파일을 다운 받을 수 없는 장기간에 걸친 다운로드 불완전성 문제를 발견하였다. 이러한 파일은 전체의 1.47% 밖에 차지하지 않지만 업로드 소스를 찾기 위한 메시지가 전체의 17%나 차지한다. 훼손된 파일의 32%는 성인영화 파일을 보통의 영화파일로 가장한 파일이었다. 그 다음으로 9.3%의 훼손된 파일이 바이러스에 감염되어 있다. 훼손된 파일은 다른 파일에 비해 더 오랜 시간인 평균 약 11 주 동안 다운로드가 유효하였다.


청구기호 {MCS 05044
형태사항 vi, 25 p. : 삽화 ; 26 cm
언어 영어
일반주기 저자명의 한글표기 : 이승준
지도교수의 영문표기 : Sue-Bok Moon
지도교수의 한글표기 : 문수복
학위논문 학위논문(석사) - 한국과학기술원 : 전산학전공,
서지주기 Reference : p. 24-25





이 주제의 인기대출도서