Breast cancer is the most common type of cancer in women worldwide. To detect breast cancer at an early stage for efficient treatment, computer-aided detection (CAD) systems are actively being developed. Of the stages composing a CAD system, classification stage performs the core function in differentiating the true breast masses from the normal tissues. In order to successively improve detection rate of breast masses using CAD systems, therefore, it is highly recommended to develop a well-organized classifier for the classification stage. Sparse representation based classification (SRC), attracting considerable research interest in the field of signal processing, is a classification algorithm exploiting the sparsity of a given signal. When classifying breast masses via SRC, it is expected to effectively represent the characteristics of the input breast masses as few training samples holding very similar characteristics with the input. If sparsity increases, it is possible to represent the input with fewer training samples, namely, to improve the classification performance. Although the goal of CAD systems is to classify a breast mass or a normal tissue, breast masses present various types of margin and shape. This problem increases diversity in the dictionary, and degrades sparsity of the dictionary. To cope with the problem, in this paper, we divide and conquer the mass classification problem including various margins in order to make each dictionary more sparse. We construct one dictionary using one type of masses. Thus, the number of dictionaries equals to the number of mass margins used. This solution maximizes the characteristics of a breast mass contrasting with normal tissues. Comparative experiments have been conducted on public mammogram data set and the clinical data set provided by a private hospital. Our results show that the proposed method improves the sparsity of the dictionaries divided according to its type of mass margins, and outperforms the state-of-the-art support vector machine (SVM) classifier.
유방암은 전 세계의 여성에게 나타나는 암 중 가장 발생 빈도가 높다. 효과적인 치료를 위한 유방암의 조기 발견을 위해 컴퓨터 보조 검출 (CAD) 시스템이 활발하게 개발되고 있다. CAD 시스템을 구성하는 여러 부분들 중에서 판별을 수행하는 단계는 일반 조작들에서 유방 종괴를 구분해 내는 핵심적인 기능을 수행한다. 그러므로 CAD 시스템을 이용하여 유방 종괴의 검출율을 향상시키기 위해서는 종괴의 특성을 잘 반영할 수 있는 판별기의 개발이 필수적이라고 할 수 있다. 최근 신호처리 분야에서 각광 받고 있는 sparse representation에 기반한 판별 방법(SRC)은 주어진 신호의 sparsity를 활용하는 알고리즘이다. SRC를 이용하여 유방 종괴를 판별하면 입력 유방 종괴 특성과 매우 유사한 특성을 갖는 소수개의 샘플만을 이용하여 입력 종괴를 효과적으로 표현할 수 있을 것으로 기대된다. Sparsity가 증가하면 더욱 적은 샘플로도 입력 특성을 표현할 수 있게 되며 이는 판별 성능 향상과 직결된다. 유방 종괴는 여러 종류를 나타내지만 CAD 시스템은 여러 종류의 종괴를 고려하여 종괴를 판별하지 않는다. 이러한 문제점은 dictionary의 다양성을 증가시키고 결과적으로 sparsity를 감소시킨다. 이 문제에 대응하여 본 논문에서는 dictionary의 sparsity를 증가시키기 위해 유방 종괴를 종류별로 나누어 접근하였다. 즉, 한가지 종류에 해당하는 샘플들로 하나의 dictionary를 구성하는 것이다. 이러한 방법은 일반 조직과 대비되는 유방 종괴의 특성을 극대화 시킬 수 있으며 종괴의 종류에 따른 sparsity를 증대시킬 수 있다. 제안하는 방법의 유용성을 확인하기 위해 공개 마모그램 데이터베이스와 사설 병원에서 제공받은 실제 임상 데이터를 사용해 비교실험을 수행하였다. 실험 결과 제안하는 방법은 각 유방 종괴에 따라 구성된 dictionary의 sparsity를 향상시켰으며 최신의 support vector machine (SVM) 분류기를 능가하였다.