Anonymous network services on the World Wide Web have emerged as new web architecture, called the Dark Web. At the same time, the Dark Web has been the last resort for people who seek freedom of the press as well as avoid censorship. This anonymous nature allows website operators to conceal their identity and thereby leads users to have difficulties in determining the authenticity of websites. We analyzed the text content of 28,928 HTTP Tor hidden services hosting 21 million dark webpages and discovered a trend on the Dark Web in which service providers perceive dark web domains as their service brands. We also conducted a model-based learning method by the Bayesian network, and we run an experiment on real-world specific underground forums to reveal the opinion leaders. Our work facilitates a better understanding of the phishing risks on the Dark Web and encourages further research on establishing an authentic and reliable service on the Dark Web.
현대의 월드 와이드 웹에서 익명 네트워크 서비스(통칭 다크 웹)는 새로운 아키텍쳐로 떠오르고 있다. 이에 다크웹은 검열을 피해 언론의 자유를 찾기 위한 최후의 방책으로의 역할을 하고 있기도 하다. 이런 익명성은 다크웹에서 웹사이트 운영자들이 신분을 숨길 수 있게하고, 이로 인해 웹사이트의 신뢰성을 확인하기 어렵다는 문제가 발생한다. 이 논문에서는 약 2,100만 개의 웹페이지를 포함하는 28,928개의 토르 히든 서비스를 분석하고 서비스 제공자가 다크웹 도메인에서 그들의 브랜드를 확립하는 방법을 확인했다. 또한 모델 기반 학습 방식으로 베이지언 네트워크를 구성하여 특정 지하 포럼들에서 의견 선도자들을 찾아내었다. 이를 통해 본 연구는 다크 웹에서의 피싱 위협에 대한 더 나은 이해를 제시하고, 다크웹에서의 신뢰 할 수 있는 서비스를 이용한 추후 연구의 발판이 된다.