For complex systems described as networks, modularity maximization has been emerging as one of community detection methods like PCA and network analysis, due to their intuitive concept and application potential to real systems in spite of the resolution limit. By the traditional methods, however, sub-community structure may not be clearly revealed in many cases. For the complex system of which nodes are expressed in high-dimensional feature vectors, we propose a new procedure using archetypal analysis (AA) and an invented quality function for uncovering the multiscale community structure of the system, visualize the structure with t-SNE and also use machine learning techniques for optimization issues. In this thesis, we study macro- and sub-community structures of various complex systems including generated system, financial system and bioinformatics system with the proposed approach and other traditional methods, and also show that the proposed one can overcome the limit of traditional ones in community detection.
네트워크 형태로 표현되는 다양한 복잡계가 어떤 커뮤니티 구조를 갖는지는 그 시스템을 이해하기 위해 반드시 밝혀져야 할 부분이었고, 이를 위해 PCA, 네트워크 분석 등 다양한 방법이 연구되었다. 특히 지난 10여 년간, 복잡계 네트워크에 대해 최대 모듈러리티를 구함으로써 시스템의 최적 커뮤니티를 찾는 방법이 주목받았다. 이러한 접근은 직관적인 컨셉과 큰 활용 가능성 때문에 지금까지도 널리 이용되고 있지만, 방법론의 내재적인 해상도 문제로 인하여 서브 커뮤니티 구조를 명확히 밝힐 수 없다는 것이 그 한계점으로 지적되고 있다. 이러한 한계를 극복하고자, 이 논문에서는 고차원 특성 벡터 형태로 각각의 노드가 표현되는 복잡계에 대해 다중 축적 커뮤니티 구조를 밝힐 수 있는 새로운 방법론을 제안한다. 원형 분석과 새로 제안된 품질 함수를 이용한 일련의 과정을 통해 전체 커뮤니티 구조를 밝히고, t-SNE를 통해 그 결과를 시각화 하였으며, 이 과정의 최적화에 머신러닝 기법을 사용하였다. 이를 이용하여 기존 방법론으로 명확히 찾을 수 없었던 서브 커뮤니티 구조를 밝힐 수 있었다. 인공 생성 데이터, 금융 데이터, 생명정보 데이터에서 기존 방법과 새로 제안된 방법으로 얻어낸 커뮤니티 구조를 비교함으로써, 새로운 접근법이 기존 방법론보다 개선된 결과를 얻을 수 있음이 확인되었다.