서지주요정보
Comprehensive data mining of metal-organic framework literature using large language model = 대규모 언어 모델을 활용한 금속-유기 골격체 문헌의 포괄적인 데이터 마이닝
서명 / 저자 Comprehensive data mining of metal-organic framework literature using large language model = 대규모 언어 모델을 활용한 금속-유기 골격체 문헌의 포괄적인 데이터 마이닝 / Tae-Un Bae.
발행사항 [대전 : 한국과학기술원, 2024].
Online Access 원문보기 원문인쇄

소장정보

등록번호

8042023

소장위치/청구기호

학술문화관(도서관)2층 학위논문

MCBE 24002

휴대폰 전송

도서상태

이용가능(대출불가)

사유안내

반납예정일

리뷰정보

초록정보

Metal-organic frameworks (MOFs) offer several characteristics such as porosity and tunability, making them valuable in diverse applications like sensors and adsorption. For synthesizing MOFs with desired properties, it is important to find out the structure-property relationship. Up until now, we have explored this relationship through a machine learning model trained on simulation data. However, simulation data has limitations as it is derived from various assumptions. Because of this, it is necessary to train the model using experimental data, but it is difficult to collect experimental data. In this thesis, we employed a large language model for comprehensive data mining to address this issue. This approach involved simultaneously extracting overall properties and synthesis conditions from both tables and text in papers. The results confirmed a high accuracy of data mining with an F1 score of 0.9 or above.

금속 유기 골격체는 다공성이나 조정 가능성과 같은 여러 특성들을 통해 센서나 흡착과 같이 다양한 분야에 사용되고 있다. 원하는 특성을 가지는 금속 유기 골격체를 합성하기 위해서는 구조-특성 관계를 찾아내는 것이 중요하다. 이제까지는 시뮬레이션 데이터를 학습한 머신 러닝 모델을 통해 이 관계를 탐구했지만 시뮬레이션 데이터는 여러 가정을 통해 얻은 값이라는 한계를 가지고 있다. 이 때문에 실험 데이터를 이용해 모델을 학습시킬 필요가 있는데 실험 데이터는 수집하기 어렵다는 문제를 가지고 있다. 이 문제를 해결하기 위해 본 학위논문에서는 대규모 언어 모델을 이용한 포괄적인 데이터 마이닝을 진행해보았다. 이 접근법은 논문에 있는 모든 표와 텍스트에서 전반적인 특성과 합성 조건 정보를 동시에 추출한다. 그 결과 0.9 이상의 F1 점수를 가지는 높은 정확도로 데이터 마이닝이 되는 것을 확인할 수 있었다.

서지기타정보

서지기타정보
청구기호 {MCBE 24002
형태사항 iii, 33p : 삽도 ; 30 cm
언어 영어
일반주기 저자명의 한글표기 : 배태언
지도교수의 영문표기 : Jihan Kim
지도교수의 한글표기 : 김지한
Including appendix
학위논문 학위논문(석사) - 한국과학기술원 : 생명화학공학과,
서지주기 References : p. 31-32
주제 Metal-organic framework
Data mining
Large language model
금속 유기 골격체
데이터 마이닝
대규모 언어 모델
QR CODE

책소개

전체보기

목차

전체보기

이 주제의 인기대출도서