Study on machine learning based smartphone colorimetric analysis for concentration prediction of mixed heavy metals = 혼합 중금속 농도 예측을 위한 머신러닝 기반 스마트폰 비색 분석 연구
서명 / 저자 Study on machine learning based smartphone colorimetric analysis for concentration prediction of mixed heavy metals = 혼합 중금속 농도 예측을 위한 머신러닝 기반 스마트폰 비색 분석 연구 / 허미라.
발행사항 [대전 : 한국과학기술원, 2024].
Due to the rapid development of industry and increasing awareness of environmental issues, there has been a continuous demand for rapid detection and monitoring technologies for soil, water quality, and food. Colorimetry is suitable for on-site detection and analysis as it offers relatively simple principles and provides rapid results. Recently, smartphone-based colorimetry has evolved and found various applications in industrial and environmental fields. However, accuracy remains a challenge due to interference from complex mixtures. The advantage of smartphone-based colorimetry is its ease of data collection under various conditions, which can be utilized as an algorithmic approach to solving these interference issues. Therefore, we aim to develop a smartphone- based colorimetric system and propose algorithms to minimize the impact of interference caused by complex mixtures. We designed a smartphone-based colorimetric system and conducted research to improve the performance of analyzing heavy metals in mixtures. The smartphone-based colorimetric system was designed to enable simultaneous measurements of multiple samples without distortion from external environmental factors. We prepared 342 samples with varying concentrations and combinations of three heavy metals (Cd, Zn, Ni) in pure form and mixtures. We selected three reagents that exhibited color reactions with heavy metals and conducted experiments. Based on the RGB data obtained from the color reaction between heavy metals and reagents, we performed Simple Linear Regression (SLR) analysis. As expected, accuracy was very low in mixtures. To address this, we conducted concentration prediction analysis using Multiple Linear Regression (MLR), Partial Least Squares (PLS), Random Forest regression, and Deep Neural Network (DNN) as single regression models. However, there were still issues that needed improvement. Therefore, we proposed a combined model that combines both classification and regression models. For the classification model, we selected random forest, which had the highest classification accuracy among K-Nearest Neighbors (KNN), Support Vector Machine (SVM), and Random Forest. We applied multiple linear regression (MLR) as the regression model and analyzed the two models together. The combined model showed a performance improvement of at least 2 to 4 times compared to the initial Simple Linear Regression (SLR) applied.

고도의 산업발달로 환경오염이 점차 심화되고, 환경에 대한 인식이 증가하면서, 토양 및 수질, 식품에 대한 신속한 검출 및 모니터링 기술의 요구가 지속되어왔다. 비색법은 비교적 원리가 간단하고 신속한 결과를 얻을 수 있어 현장에서의 검출 및 분석법으로 적합하다. 최근에는 스마트폰 기반의 비색법으로 발전하여 산업 및 환경분야에서 다양하게 활용이 되고 있으나, 여전히 혼합물에서 발생하는 간섭으로 인하여 정확도 문제의 어려움을 겪고 있다. 스마트폰 기반의 비색법의 경우 다양한 조건에서의 데이터를 수집하는데 용이하다는 장점을 이용하여 이러한 간섭 문제의 해결책으로써 알고리즘적 접근이 가능하다. 따라서 본 연구에서는 스마트폰 기반의 비색측정 시스템을 개발하고, 혼합물의 상호 간섭 문제에 의한 영향을 최소화하기 위한 알고리즘을 제안하고자 한다. 본 연구에서는 스마트폰 기반의 비색측정 시스템을 설계하였으며, 혼합 중금속의 분석 시 성능을 향상시킬 수 있는 알고리즘에 대한 연구를 실시하였다. 스마트폰 기반의 비색 측정 시스템은 외부환경 요소에 왜곡을 받지 않으면서, 다중 샘플의 동시측정이 가능한 형태로 설계하였다. 중금속 3종(Cd, Zn, Ni)을 순물질 및 혼합물로 각기 다른 농도와 조합의 342개 샘플을 구성하였으며, 중금속과 반응하여 발색반응을 보이는 시약 3개를 선정하여, 실험을 실시하였다. 중금속과 시약과의 색 반응으로부터 획득한 RGB 데이터를 토대로 단순선형회귀(SLR)분석을 실시하였다. 예상한대로, 혼합물에서 정확도가 매우 낮았으며, 이를 해결하기 위한 방법으로 단일 회귀분석 모델로써, 다중 선형회귀(MLR), 부분최소제곱(PLS), 랜덤포레스트(random forest) 회귀, 심층신경망(DNN)을 통해 농도 예측 분석을 실시하였으나, 여전히 개선해야할 문제점들이 존재하였다. 따라서, 분류 모형과 회귀모형이 결합된 형태인 결합 알고리즘을 제안하였고, 분류모형은 K근접 이웃(KNN), 서포트 벡터 머신(SVM), 랜덤포레스트 중 가장 분류 정확도가 높은 랜덤포레스트를 선택하였다. 회귀모형으로는 다중 선형회귀(MLR)을 적용하고 이 두 모형을 결합하여 최종적인 농도 예측 분석을 실시하였다. 처음에 적용했던 단순선형회귀(SLR) 대비 결합 알고리즘의 성능이 최소 2배에서 최대 4배 가까이 향상됨을 확인하였다.


청구기호 {DME 24035
형태사항 v, 109 p. : 삽도 ; 30 cm
언어 한국어
일반주기 저자명의 영문표기 : Mira Heo
지도교수의 한글표기 : 김경수
지도교수의 영문표기 : Kyung-Soo Kim
부록 수록
학위논문 학위논문(박사) - 한국과학기술원 : 기계공학과,
서지주기 참고문헌 : p. 107-109
주제 스마트폰 기반 비색분석
현장 검출
서포트 벡터 머신
Smartphone-based colorimetric analysis
Heavy metal
Machine learning
On-site detecion
Linear regression
Random forest
Deep neural network
K-nearest neighbors
Support vector machine





