A Sybil attack poses a critical threat to the trust and integrity of web services, exploiting numerous fake (i.e., Sybil) accounts. Efforts to mitigate this threat have proposed leveraging collective classification methods to identify Sybil accounts. However, recent advancements in adversarial attacks have exposed vulnerabilities in existing collective classification techniques, opening up new security challenges. For this reason, we introduce RICC, the first robust collective classification framework specifically designed to detect adversarial Sybil accounts created through adversarial attacks. RICC leverages the adversaries' strategy of performing adversarial attacks highly tailored to the target collective classification model, optimizing the attack budget. The key contribution of RICC lies in its ability to achieve robustness in collective classification by stabilizing classification results across diverse training sets randomly sampled in each round. RICC outperforms all existing Sybil detection methods, demonstrating superior robustness and efficacy in identifying adversarial Sybil accounts.
허위 계정을 이용한 공격은 웹 서비스의 신뢰성과 무결성을 해치는 중대한 위협으로, 공격자는 다수의 허위 계정을 생성하고 이를 악용하여 공격한다. 이러한 위협을 완화하기 위하여 이전 연구들에서는 허위 계정 탐지에 집합적 분류를 활용하는 방법들이 제안하였다. 하지만 최근 연구에서는 최신의 적대적 공격이 기존의 집합적 분류를 우회할 수 있다는 것을 보여주며 새로운 보안 위협을 제기하였다. 집합적 분류에 대한 공격을 완화하기 위해 우리는 RICC을 제안한다. RICC은 적대적 공격에 의해 생성된 허위 계정을 올바르게 탐지하기 위한 최초의 견고한 집합적 분류 프레임워크이다. RICC은 공격자들이 수행하는 적대적 공격이, 목표로 하는 집합적 분류 모델에 매우 특화되어 있어 공격 예산을 최적화한다는 공격자의 전략을 이용한다. RICC은 각 라운드에서 무작위로 추출한 학습 데이터셋을 이용한 분류 결과가 안정화되도록 유도함으로써 집합적 분류에 대한 견고성을 달성하였다. RICC은 Enron, Facebook, Twitter_S, Twitter_L 데이터셋에 대하여 집합적 분류를 이용한 허위 계정 탐지에 우수한 성능과 견고성을 보였다.