Automatic Modulation Recognition (AMR) refers to a technique that finds the modulation type of an observed radio signal and has been recognized as an essential and fundamental process at the initial step in many military and civilian applications. One of the main obstacles in AMR is its non-cooperative environment. In such an environment, recognizing the modulation type is burdensome because it is usually hard to obtain preliminary information about the signal source or the received signal. Recently, several studies have attempted to improve the modulation recognition capability in this harsh environment by applying deep learning (DL), which is currently rapidly developing, to the AMR classifiers. Unfortunately, it is not easy to directly apply the conventional DL's benefits to AMR applications. The radio signals in modern communication systems consist of orthogonal components of I (in-phase) and Q (quadrature). The problem is that these components are theoretically equivalent to a complex number's real and imaginary parts. Until now, most DL tools have been based on real values; that is, they can't inherently handle complex data. Accordingly, the conventional AMR classifiers based on these real-valued DL tools inevitably have to process I and Q data separately. However, in this real data processing, the real-based classifiers fundamentally accompany performance limitations of AMR since it is challenging to learn complex-related features such as the size, phase, and location of each signal element appearing in the two-dimensional complex domain. This study proposes fully complex DL classifiers as a novel method for AMR. First, we newly define two core complex operations for constructing new classifiers: complex-valued (a) max-pooling and (b) softmax. In this step, we also analyze the applicability of the formerly proposed complex operations and the complex training possibility. Next, we experimentally derive AMR-optimized structures and present enhanced AMR architectures: (c) convolutional neural network (CNN) based and (d) residual neural network (ResNet) based fully complex-valued classifiers. Then, the proposed classifiers' performance is evaluated in various aspects: effectiveness of complex signal processing, in-depth analysis of AMR accuracy, effect of dataset size on AMR performance, computational complexity, and AMR performance in a commercial wireless environment. The analysis results show that complex-valued classifiers can provide faster learning speed, higher optimization, and better generalization at acceptable learning and recognition costs. In particular, the proposed classifiers significantly improve the AMR accuracy for the modulation types closely related to complex information (i.e., PSK, APSK, QAM), even in small datasets. Furthermore, to more thoroughly analyze the reasons for the performance improvement of the complex classifiers, we suggest an advanced visualizable tool: (e) the complex-valued gradient-weighted class activation maps (C-Grad-CAM). By visually representing the influence of the final decision on the input signal, this tool can provide an intuitive basis for complex data processing gains. We hope that C-Grad-CAM delivers valuable insights into explaining the inner workings of the complex classifiers, commonly considered black boxes.
자동 변조 인식(AMR)은 관측한 무선 신호의 변조 유형을 찾는 기술을 의미하며, 많은 군 및 민간 응용분야에서 초기 단계에서 필수적이고 기본적인 절차로 인식되어왔습니다. AMR의 주요 난점 중 하나는 바로 비협조적인 환경입니다. 이러한 환경에서는 일반적으로 신호원 또는 수신된 신호에 대한 정보를 사전에 확보하기 어렵기 때문에 변조 유형을 식별하기가 매우 까다롭습니다. 최근에는 현재 급격히 발전 중인 딥러닝을 AMR 분류기에 적용해 가혹한 환경에서의 변조 인식 능력을 향상시키기 위한 연구들이 진행되었습니다. 딥러닝이 객체 (또는 이미지)를 분류하는데 특별히 향상된 성능을 보여주었다는 점에서, 해당 강점을 AMR에 활용하는 것이 합리적으로 보일 수 있습니다. 하지만 안타깝게도, 기존의 딥러닝의 이점을 곧바로 AMR 응용에 접목시키기란 쉽지 않습니다. 최신 통신 시스템에서의 무선 신호는 I(in-phase) 및 Q(quadrature)의 서로 직교하는 성분으로 구성됩니다. 문제는 이러한 I와 Q 성분이 이론적으로 복소수의 실수부 및 허수부와 정확히 동일하다는 점입니다. 지금까지 대부분의 딥러닝 도구들은 모두 실수를 기반으로 동작하며 본질적으로 복소수를 다룰 수 없습니다. 결국, 실수 딥러닝을 접목한 기존의 AMR 분류기들은 I와 Q 데이터를 분리해서 처리하게 됩니다. 하지만, 이러한 실수 기반 데이터 처리에서는 2차원 복소수 영역에서 나타나는 각 신호 요소의 크기, 위상, 위치와 같은 복소수 관련 특징을 학습하기 어렵기 때문에, 기존의 실수 기반 분류기에는 근본적으로 AMR의 성능적 한계가 존재하게 됩니다.
본 연구는 AMR을 위한 새로운 방법의 일환으로 완전 복소수 딥러닝 분류기를 제안합니다. 먼저, 복소수 딥러닝 분류기 설계에 필요한 두 가지 핵심 복소수 연산(즉, (a) 복소수 최대 풀링과 (b) 소프트맥스)을 새롭게 정의합니다. 이 단계에서 기존에 제안된 복소수 연산들의 활용 가능성 및 복소수 훈련 가능성에 대한 분석을 함께 진행합니다. 다음으로, AMR에 최적화된 구조를 실험적으로 도출하고, 이를 접목한 향상된 AMR 분류기, 즉, (c) CNN 및 (d) ResNet 기반 복소수 분류기를 제시합니다. 이후, 복소수 신호 처리의 효율성, 상세 AMR 정확도, 데이터세트 크기가 AMR 성능에 미치는 영향, 계산 복잡도, 상용 무선 환경에서의 AMR 성능 등 다양한 관점에서 제안한 분류기의 AMR 성능을 분석합니다. 분석 결과는 복소수 기반 분류기가 허용 가능한 학습 및 분류 비용을 들여 더 빠른 학습 속도, 더 좋은 최적화 및 더 나은 일반화를 제공할 수 있음을 보여줍니다. 특히, 제안한 분류기는 소규모 데이터 세트에서도 복소수 정보와 밀접하게 관련된 변조 유형(즉, PSK, APSK, QAM 등)에 대한 성능을 월등히 향상시킵니다. 더 나아가, 본 논문에서는 복소수 분류기의 성능 향상 이유를 보다 면밀하게 분석하기 위해 AMR을 위한 고급 복소수 시각적 툴인 (e) 복소수 그레디언트 가중치 클래스 활성화 맵(complex-valued gradient-weighted class activation maps: C-Grad-CAM)을 제안합니다. 이 도구는 최종 결정에 대한 영향력을 입력 신호에 시각적으로 나타냄으로서, 복소수 데이터 처리 이득에 대한 직관적인 근거를 제공합니다. 향후, C-Grad-CAM이 블랙박스로 간주되는 복소수 분류기의 내부 동작 해석에 귀중한 통찰력을 제공할 것으로 기대합니다.