Quantifying the exact amount of a substance in a mixture is a fundamental task in analytical chemistry. With the advantages of high sensitivity, selectivity, immediacy, and non-destructive, spectroscopy is used for quantification. However, there is no universal method to analyze spectral signals for quantification due to the complexity of spectral data. This paper suggested a linear-scaling autoencoder for quantitative analysis with spectral data. Based on the autoencoder architecture, we introduce a modified loss function to align data points in a linear scale on a latent space corresponding to the known quantity labels. The model reduces the dimensionality while preserving the structure of the data and predicts the quantity with the given signal. We validated the model with synthetic and real-world benchmarks and in-house spectroscopy data. The model achieves high performance in quantity prediction and interpretability compared to the existing methodologies. The expandability of the model is also verified using multidimensional data from various fields.
혼합물에 포함된 물질의 정량은 분석화학의 기본 과제이다. 고감도, 선택성, 직접성, 비파괴성 등의 장점을 지닌 분광학적 기술이 정량 분석에 사용된다. 분광 데이터의 복잡성으로 인해 보편적인 분광학적 정량 분석 기술이 없다. 본 논문에서는 데이터 기반 분광학적 정량 분석을 위한 심층학습 모델인 선형화 오토인코더를 제안했다. 새로 도입된 손실 함수와 오토인코더 구조를 통해 데이터를 정량 정보를 기반으로 잠재 공간에 정렬한다. 모델은 데이터의 구조와 정량 정보를 통해 데이터의 차원을 줄이고, 학습된 잠재 공간에서 신호의 정량 정보를 예측한다. 합성 데이터와 정량을 위한 실제 분광 데이터를 사용하여 모델을 검증하였다. 제안한 모델이 기존 기술과 비교하여 높은 성능을 달성함을 보였다. 또한, 제안된 모델이 정량 분석 외 고차원 데이터 분석 분야로 확장될 수 있음을 확인하였다.